Spaces:
Running
Running
michal
commited on
Commit
·
92395fa
1
Parent(s):
56d4acc
Upload
Browse files- leaderboards/ldek_accs.json +444 -0
- leaderboards/lek_accs.json +444 -0
- leaderboards/pes_accs.json +1277 -0
- src/structures/ldek_structure.py +2 -1
- src/structures/lek_structure.py +2 -1
- src/structures/pes_structure.py +2 -2
leaderboards/ldek_accs.json
ADDED
@@ -0,0 +1,444 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
[
|
2 |
+
{
|
3 |
+
"model_name": "model-meta-llama-Meta-Llama-3.1-8B-Instruct",
|
4 |
+
"2008_jesień": 40.4040404040404,
|
5 |
+
"2012_wiosna": 40.72164948453608,
|
6 |
+
"2010_jesień": 43.71859296482412,
|
7 |
+
"2009_wiosna": 47.97979797979798,
|
8 |
+
"2010_wiosna": 46.0,
|
9 |
+
"2011_wiosna": 33.83838383838384,
|
10 |
+
"2012_jesień": 50.0,
|
11 |
+
"2011_jesień": 41.41414141414141,
|
12 |
+
"2009_jesień": 54.0,
|
13 |
+
"2022_wiosna": 38.88888888888889,
|
14 |
+
"2014_wiosna": 33.16326530612245,
|
15 |
+
"2022_jesien": 40.816326530612244,
|
16 |
+
"2014_jesien": 42.487046632124354,
|
17 |
+
"2024_wiosna": 39.59390862944163,
|
18 |
+
"2015_wiosna": 42.473118279569896,
|
19 |
+
"2023_wiosna": 44.94949494949495,
|
20 |
+
"2021_jesien": 40.909090909090914,
|
21 |
+
"2015_jesien": 41.578947368421055,
|
22 |
+
"2023_jesien": 42.05128205128205,
|
23 |
+
"2021_wiosna": 41.3265306122449,
|
24 |
+
"2013_wiosna": 41.23711340206185,
|
25 |
+
"2013_jesien": 44.50261780104712,
|
26 |
+
"overall_accuracy": 42.37642144349037
|
27 |
+
},
|
28 |
+
{
|
29 |
+
"model_name": "model-meta-llama-Meta-Llama-3.1-70B-Instruct",
|
30 |
+
"2008_jesień": 62.121212121212125,
|
31 |
+
"2012_wiosna": 61.34020618556701,
|
32 |
+
"2010_jesień": 62.8140703517588,
|
33 |
+
"2009_wiosna": 69.1919191919192,
|
34 |
+
"2010_wiosna": 73.0,
|
35 |
+
"2011_wiosna": 59.59595959595959,
|
36 |
+
"2012_jesień": 69.89795918367348,
|
37 |
+
"2011_jesień": 65.65656565656566,
|
38 |
+
"2009_jesień": 68.0,
|
39 |
+
"2022_wiosna": 68.68686868686868,
|
40 |
+
"2014_wiosna": 54.59183673469388,
|
41 |
+
"2022_jesien": 62.755102040816325,
|
42 |
+
"2014_jesien": 60.62176165803109,
|
43 |
+
"2024_wiosna": 61.42131979695431,
|
44 |
+
"2015_wiosna": 60.215053763440864,
|
45 |
+
"2023_wiosna": 62.62626262626263,
|
46 |
+
"2021_jesien": 64.14141414141415,
|
47 |
+
"2015_jesien": 58.42105263157895,
|
48 |
+
"2023_jesien": 61.02564102564103,
|
49 |
+
"2021_wiosna": 68.36734693877551,
|
50 |
+
"2013_wiosna": 62.371134020618555,
|
51 |
+
"2013_jesien": 57.06806282722513,
|
52 |
+
"overall_accuracy": 63.402181480621955
|
53 |
+
},
|
54 |
+
{
|
55 |
+
"model_name": "model-Qwen-Qwen2.5-72B-Instruct",
|
56 |
+
"2008_jesień": 58.58585858585859,
|
57 |
+
"2012_wiosna": 56.70103092783505,
|
58 |
+
"2010_jesień": 60.80402010050251,
|
59 |
+
"2009_wiosna": 60.1010101010101,
|
60 |
+
"2010_wiosna": 63.5,
|
61 |
+
"2011_wiosna": 58.58585858585859,
|
62 |
+
"2012_jesień": 66.83673469387756,
|
63 |
+
"2011_jesień": 54.54545454545454,
|
64 |
+
"2009_jesień": 70.5,
|
65 |
+
"2022_wiosna": 59.59595959595959,
|
66 |
+
"2014_wiosna": 53.57142857142857,
|
67 |
+
"2022_jesien": 61.73469387755102,
|
68 |
+
"2014_jesien": 61.6580310880829,
|
69 |
+
"2024_wiosna": 57.360406091370564,
|
70 |
+
"2015_wiosna": 58.602150537634415,
|
71 |
+
"2023_wiosna": 56.56565656565656,
|
72 |
+
"2021_jesien": 59.59595959595959,
|
73 |
+
"2015_jesien": 57.36842105263158,
|
74 |
+
"2023_jesien": 54.871794871794876,
|
75 |
+
"2021_wiosna": 58.673469387755105,
|
76 |
+
"2013_wiosna": 61.855670103092784,
|
77 |
+
"2013_jesien": 57.06806282722513,
|
78 |
+
"overall_accuracy": 59.503365049895564
|
79 |
+
},
|
80 |
+
{
|
81 |
+
"model_name": "model-gpt-4o-mini-2024-07-18",
|
82 |
+
"2008_jesień": 59.09090909090909,
|
83 |
+
"2012_wiosna": 55.670103092783506,
|
84 |
+
"2010_jesień": 55.27638190954774,
|
85 |
+
"2009_wiosna": 68.18181818181817,
|
86 |
+
"2010_wiosna": 62.5,
|
87 |
+
"2011_wiosna": 50.0,
|
88 |
+
"2012_jesień": 65.3061224489796,
|
89 |
+
"2011_jesień": 55.05050505050505,
|
90 |
+
"2009_jesień": 64.0,
|
91 |
+
"2022_wiosna": 52.52525252525253,
|
92 |
+
"2014_wiosna": 46.93877551020408,
|
93 |
+
"2022_jesien": 54.08163265306123,
|
94 |
+
"2014_jesien": 57.51295336787565,
|
95 |
+
"2024_wiosna": 56.34517766497462,
|
96 |
+
"2015_wiosna": 52.68817204301075,
|
97 |
+
"2023_wiosna": 53.535353535353536,
|
98 |
+
"2021_jesien": 58.080808080808076,
|
99 |
+
"2015_jesien": 57.89473684210527,
|
100 |
+
"2023_jesien": 58.46153846153847,
|
101 |
+
"2021_wiosna": 59.693877551020414,
|
102 |
+
"2013_wiosna": 55.154639175257735,
|
103 |
+
"2013_jesien": 51.30890052356021,
|
104 |
+
"overall_accuracy": 56.811325133441635
|
105 |
+
},
|
106 |
+
{
|
107 |
+
"model_name": "model-aaditya-Llama3-OpenBioLLM-70B",
|
108 |
+
"2008_jesień": 19.19191919191919,
|
109 |
+
"2012_wiosna": 19.072164948453608,
|
110 |
+
"2010_jesień": 35.175879396984925,
|
111 |
+
"2009_wiosna": 50.0,
|
112 |
+
"2010_wiosna": 43.0,
|
113 |
+
"2011_wiosna": 38.88888888888889,
|
114 |
+
"2012_jesień": 43.36734693877551,
|
115 |
+
"2011_jesień": 35.35353535353536,
|
116 |
+
"2009_jesień": 48.0,
|
117 |
+
"2022_wiosna": 45.95959595959596,
|
118 |
+
"2014_wiosna": 39.285714285714285,
|
119 |
+
"2022_jesien": 43.36734693877551,
|
120 |
+
"2014_jesien": 39.37823834196891,
|
121 |
+
"2024_wiosna": 44.16243654822335,
|
122 |
+
"2015_wiosna": 41.39784946236559,
|
123 |
+
"2023_wiosna": 42.92929292929293,
|
124 |
+
"2021_jesien": 42.92929292929293,
|
125 |
+
"2015_jesien": 38.421052631578945,
|
126 |
+
"2023_jesien": 38.97435897435898,
|
127 |
+
"2021_wiosna": 41.83673469387755,
|
128 |
+
"2013_wiosna": 41.23711340206185,
|
129 |
+
"2013_jesien": 42.93193717277487,
|
130 |
+
"overall_accuracy": 39.777210489672775
|
131 |
+
},
|
132 |
+
{
|
133 |
+
"model_name": "model-mistralai-Mistral-Large-Instruct-2407",
|
134 |
+
"2008_jesień": 61.61616161616161,
|
135 |
+
"2012_wiosna": 54.123711340206185,
|
136 |
+
"2010_jesień": 62.311557788944725,
|
137 |
+
"2009_wiosna": 67.67676767676768,
|
138 |
+
"2010_wiosna": 69.5,
|
139 |
+
"2011_wiosna": 56.56565656565656,
|
140 |
+
"2012_jesień": 66.3265306122449,
|
141 |
+
"2011_jesień": 58.080808080808076,
|
142 |
+
"2009_jesień": 63.0,
|
143 |
+
"2022_wiosna": 54.54545454545454,
|
144 |
+
"2014_wiosna": 54.08163265306123,
|
145 |
+
"2022_jesien": 56.63265306122449,
|
146 |
+
"2014_jesien": 56.476683937823836,
|
147 |
+
"2024_wiosna": 55.83756345177665,
|
148 |
+
"2015_wiosna": 58.602150537634415,
|
149 |
+
"2023_wiosna": 57.57575757575758,
|
150 |
+
"2021_jesien": 56.060606060606055,
|
151 |
+
"2015_jesien": 60.0,
|
152 |
+
"2023_jesien": 48.205128205128204,
|
153 |
+
"2021_wiosna": 57.14285714285714,
|
154 |
+
"2013_wiosna": 61.34020618556701,
|
155 |
+
"2013_jesien": 55.497382198952884,
|
156 |
+
"overall_accuracy": 58.71431886748666
|
157 |
+
},
|
158 |
+
{
|
159 |
+
"model_name": "model-OpenMeditron-Meditron3-8B",
|
160 |
+
"2008_jesień": 38.88888888888889,
|
161 |
+
"2012_wiosna": 39.69072164948454,
|
162 |
+
"2010_jesień": 36.18090452261307,
|
163 |
+
"2009_wiosna": 41.41414141414141,
|
164 |
+
"2010_wiosna": 43.0,
|
165 |
+
"2011_wiosna": 32.82828282828283,
|
166 |
+
"2012_jesień": 42.3469387755102,
|
167 |
+
"2011_jesień": 33.33333333333333,
|
168 |
+
"2009_jesień": 41.5,
|
169 |
+
"2022_wiosna": 34.34343434343434,
|
170 |
+
"2014_wiosna": 30.102040816326532,
|
171 |
+
"2022_jesien": 36.734693877551024,
|
172 |
+
"2014_jesien": 39.89637305699482,
|
173 |
+
"2024_wiosna": 38.07106598984771,
|
174 |
+
"2015_wiosna": 36.55913978494624,
|
175 |
+
"2023_wiosna": 38.38383838383838,
|
176 |
+
"2021_jesien": 41.41414141414141,
|
177 |
+
"2015_jesien": 39.473684210526315,
|
178 |
+
"2023_jesien": 34.35897435897436,
|
179 |
+
"2021_wiosna": 40.816326530612244,
|
180 |
+
"2013_wiosna": 42.78350515463917,
|
181 |
+
"2013_jesien": 40.83769633507853,
|
182 |
+
"overall_accuracy": 38.31515432815038
|
183 |
+
},
|
184 |
+
{
|
185 |
+
"model_name": "model-meta-llama-Llama-3.2-1B-Instruct",
|
186 |
+
"2008_jesień": 24.242424242424242,
|
187 |
+
"2012_wiosna": 20.618556701030926,
|
188 |
+
"2010_jesień": 23.618090452261306,
|
189 |
+
"2009_wiosna": 24.242424242424242,
|
190 |
+
"2010_wiosna": 23.0,
|
191 |
+
"2011_wiosna": 24.747474747474747,
|
192 |
+
"2012_jesień": 28.57142857142857,
|
193 |
+
"2011_jesień": 21.71717171717172,
|
194 |
+
"2009_jesień": 25.5,
|
195 |
+
"2022_wiosna": 21.21212121212121,
|
196 |
+
"2014_wiosna": 22.448979591836736,
|
197 |
+
"2022_jesien": 29.591836734693878,
|
198 |
+
"2014_jesien": 23.316062176165804,
|
199 |
+
"2024_wiosna": 33.50253807106599,
|
200 |
+
"2015_wiosna": 23.655913978494624,
|
201 |
+
"2023_wiosna": 28.28282828282828,
|
202 |
+
"2021_jesien": 27.27272727272727,
|
203 |
+
"2015_jesien": 24.736842105263158,
|
204 |
+
"2023_jesien": 27.692307692307693,
|
205 |
+
"2021_wiosna": 22.448979591836736,
|
206 |
+
"2013_wiosna": 23.711340206185564,
|
207 |
+
"2013_jesien": 27.748691099476442,
|
208 |
+
"overall_accuracy": 25.08702715247157
|
209 |
+
},
|
210 |
+
{
|
211 |
+
"model_name": "model-OpenMeditron-Meditron3-70B",
|
212 |
+
"2008_jesień": 45.95959595959596,
|
213 |
+
"2012_wiosna": 43.29896907216495,
|
214 |
+
"2010_jesień": 46.733668341708544,
|
215 |
+
"2009_wiosna": 51.010101010101,
|
216 |
+
"2010_wiosna": 49.0,
|
217 |
+
"2011_wiosna": 42.42424242424242,
|
218 |
+
"2012_jesień": 47.44897959183674,
|
219 |
+
"2011_jesień": 46.96969696969697,
|
220 |
+
"2009_jesień": 49.0,
|
221 |
+
"2022_wiosna": 45.95959595959596,
|
222 |
+
"2014_wiosna": 41.83673469387755,
|
223 |
+
"2022_jesien": 48.46938775510204,
|
224 |
+
"2014_jesien": 47.15025906735752,
|
225 |
+
"2024_wiosna": 52.28426395939086,
|
226 |
+
"2015_wiosna": 50.53763440860215,
|
227 |
+
"2023_wiosna": 47.474747474747474,
|
228 |
+
"2021_jesien": 48.98989898989899,
|
229 |
+
"2015_jesien": 51.05263157894737,
|
230 |
+
"2023_jesien": 42.56410256410256,
|
231 |
+
"2021_wiosna": 45.40816326530612,
|
232 |
+
"2013_wiosna": 49.48453608247423,
|
233 |
+
"2013_jesien": 45.54973821989529,
|
234 |
+
"overall_accuracy": 47.203527500580186
|
235 |
+
},
|
236 |
+
{
|
237 |
+
"model_name": "model-ProbeMedicalYonseiMAILab-medllama3-v20",
|
238 |
+
"2008_jesień": 30.303030303030305,
|
239 |
+
"2012_wiosna": 31.958762886597935,
|
240 |
+
"2010_jesień": 30.15075376884422,
|
241 |
+
"2009_wiosna": 37.37373737373738,
|
242 |
+
"2010_wiosna": 31.5,
|
243 |
+
"2011_wiosna": 30.808080808080806,
|
244 |
+
"2012_jesień": 34.69387755102041,
|
245 |
+
"2011_jesień": 30.808080808080806,
|
246 |
+
"2009_jesień": 35.5,
|
247 |
+
"2022_wiosna": 34.84848484848485,
|
248 |
+
"2014_wiosna": 26.53061224489796,
|
249 |
+
"2022_jesien": 34.183673469387756,
|
250 |
+
"2014_jesien": 35.233160621761655,
|
251 |
+
"2024_wiosna": 35.025380710659896,
|
252 |
+
"2015_wiosna": 33.33333333333333,
|
253 |
+
"2023_wiosna": 35.35353535353536,
|
254 |
+
"2021_jesien": 31.818181818181817,
|
255 |
+
"2015_jesien": 37.89473684210527,
|
256 |
+
"2023_jesien": 31.28205128205128,
|
257 |
+
"2021_wiosna": 42.857142857142854,
|
258 |
+
"2013_wiosna": 38.659793814432994,
|
259 |
+
"2013_jesien": 39.26701570680628,
|
260 |
+
"overall_accuracy": 34.04502204687863
|
261 |
+
},
|
262 |
+
{
|
263 |
+
"model_name": "model-mistralai-Mistral-Small-Instruct-2409",
|
264 |
+
"2008_jesień": 38.38383838383838,
|
265 |
+
"2012_wiosna": 34.5360824742268,
|
266 |
+
"2010_jesień": 40.7035175879397,
|
267 |
+
"2009_wiosna": 44.44444444444444,
|
268 |
+
"2010_wiosna": 46.5,
|
269 |
+
"2011_wiosna": 34.84848484848485,
|
270 |
+
"2012_jesień": 46.42857142857143,
|
271 |
+
"2011_jesień": 38.88888888888889,
|
272 |
+
"2009_jesień": 45.0,
|
273 |
+
"2022_wiosna": 38.88888888888889,
|
274 |
+
"2014_wiosna": 34.69387755102041,
|
275 |
+
"2022_jesien": 42.857142857142854,
|
276 |
+
"2014_jesien": 37.82383419689119,
|
277 |
+
"2024_wiosna": 44.16243654822335,
|
278 |
+
"2015_wiosna": 38.17204301075269,
|
279 |
+
"2023_wiosna": 41.41414141414141,
|
280 |
+
"2021_jesien": 42.42424242424242,
|
281 |
+
"2015_jesien": 42.10526315789473,
|
282 |
+
"2023_jesien": 40.0,
|
283 |
+
"2021_wiosna": 41.3265306122449,
|
284 |
+
"2013_wiosna": 43.29896907216495,
|
285 |
+
"2013_jesien": 44.50261780104712,
|
286 |
+
"overall_accuracy": 40.98398700394523
|
287 |
+
},
|
288 |
+
{
|
289 |
+
"model_name": "model-gpt-4o-2024-08-06",
|
290 |
+
"2008_jesień": 78.78787878787878,
|
291 |
+
"2012_wiosna": 77.83505154639175,
|
292 |
+
"2010_jesień": 74.37185929648241,
|
293 |
+
"2009_wiosna": 85.85858585858585,
|
294 |
+
"2010_wiosna": 83.0,
|
295 |
+
"2011_wiosna": 72.22222222222221,
|
296 |
+
"2012_jesień": 76.53061224489795,
|
297 |
+
"2011_jesień": 72.72727272727273,
|
298 |
+
"2009_jesień": 81.5,
|
299 |
+
"2022_wiosna": 77.27272727272727,
|
300 |
+
"2014_wiosna": 79.08163265306123,
|
301 |
+
"2022_jesien": 69.38775510204081,
|
302 |
+
"2014_jesien": 77.2020725388601,
|
303 |
+
"2024_wiosna": 70.55837563451777,
|
304 |
+
"2015_wiosna": 72.04301075268818,
|
305 |
+
"2023_wiosna": 72.72727272727273,
|
306 |
+
"2021_jesien": 72.22222222222221,
|
307 |
+
"2015_jesien": 75.78947368421053,
|
308 |
+
"2023_jesien": 69.74358974358974,
|
309 |
+
"2021_wiosna": 73.9795918367347,
|
310 |
+
"2013_wiosna": 76.28865979381443,
|
311 |
+
"2013_jesien": 74.3455497382199,
|
312 |
+
"overall_accuracy": 75.63239730796009
|
313 |
+
},
|
314 |
+
{
|
315 |
+
"model_name": "model-speakleash-Bielik-11B-v2.2-Instruct",
|
316 |
+
"2008_jesień": 45.45454545454545,
|
317 |
+
"2012_wiosna": 46.391752577319586,
|
318 |
+
"2010_jesień": 52.26130653266332,
|
319 |
+
"2009_wiosna": 51.515151515151516,
|
320 |
+
"2010_wiosna": 48.5,
|
321 |
+
"2011_wiosna": 41.91919191919192,
|
322 |
+
"2012_jesień": 57.6530612244898,
|
323 |
+
"2011_jesień": 45.95959595959596,
|
324 |
+
"2009_jesień": 49.5,
|
325 |
+
"2022_wiosna": 40.4040404040404,
|
326 |
+
"2014_wiosna": 34.69387755102041,
|
327 |
+
"2022_jesien": 43.36734693877551,
|
328 |
+
"2014_jesien": 44.04145077720207,
|
329 |
+
"2024_wiosna": 50.76142131979695,
|
330 |
+
"2015_wiosna": 43.54838709677419,
|
331 |
+
"2023_wiosna": 41.91919191919192,
|
332 |
+
"2021_jesien": 43.93939393939394,
|
333 |
+
"2015_jesien": 40.0,
|
334 |
+
"2023_jesien": 37.94871794871795,
|
335 |
+
"2021_wiosna": 50.0,
|
336 |
+
"2013_wiosna": 47.93814432989691,
|
337 |
+
"2013_jesien": 42.93193717277487,
|
338 |
+
"overall_accuracy": 45.50939893246693
|
339 |
+
},
|
340 |
+
{
|
341 |
+
"model_name": "model-meta-llama-Llama-3.2-3B-Instruct",
|
342 |
+
"2008_jesień": 36.36363636363637,
|
343 |
+
"2012_wiosna": 30.927835051546392,
|
344 |
+
"2010_jesień": 36.18090452261307,
|
345 |
+
"2009_wiosna": 34.34343434343434,
|
346 |
+
"2010_wiosna": 40.5,
|
347 |
+
"2011_wiosna": 32.82828282828283,
|
348 |
+
"2012_jesień": 40.816326530612244,
|
349 |
+
"2011_jesień": 29.292929292929294,
|
350 |
+
"2009_jesień": 43.0,
|
351 |
+
"2022_wiosna": 29.797979797979796,
|
352 |
+
"2014_wiosna": 28.061224489795915,
|
353 |
+
"2022_jesien": 36.224489795918366,
|
354 |
+
"2014_jesien": 29.533678756476682,
|
355 |
+
"2024_wiosna": 35.53299492385787,
|
356 |
+
"2015_wiosna": 36.55913978494624,
|
357 |
+
"2023_wiosna": 35.35353535353536,
|
358 |
+
"2021_jesien": 27.77777777777778,
|
359 |
+
"2015_jesien": 30.526315789473685,
|
360 |
+
"2023_jesien": 29.230769230769234,
|
361 |
+
"2021_wiosna": 31.122448979591837,
|
362 |
+
"2013_wiosna": 33.50515463917525,
|
363 |
+
"2013_jesien": 35.07853403141361,
|
364 |
+
"overall_accuracy": 33.766535158969596
|
365 |
+
},
|
366 |
+
{
|
367 |
+
"model_name": "model-Qwen-Qwen2.5-7B-Instruct",
|
368 |
+
"2008_jesień": 41.41414141414141,
|
369 |
+
"2012_wiosna": 40.20618556701031,
|
370 |
+
"2010_jesień": 43.21608040201005,
|
371 |
+
"2009_wiosna": 40.4040404040404,
|
372 |
+
"2010_wiosna": 41.5,
|
373 |
+
"2011_wiosna": 38.38383838383838,
|
374 |
+
"2012_jesień": 48.97959183673469,
|
375 |
+
"2011_jesień": 38.88888888888889,
|
376 |
+
"2009_jesień": 43.5,
|
377 |
+
"2022_wiosna": 43.93939393939394,
|
378 |
+
"2014_wiosna": 35.714285714285715,
|
379 |
+
"2022_jesien": 42.857142857142854,
|
380 |
+
"2014_jesien": 46.63212435233161,
|
381 |
+
"2024_wiosna": 45.68527918781726,
|
382 |
+
"2015_wiosna": 42.473118279569896,
|
383 |
+
"2023_wiosna": 44.94949494949495,
|
384 |
+
"2021_jesien": 43.43434343434344,
|
385 |
+
"2015_jesien": 40.0,
|
386 |
+
"2023_jesien": 46.15384615384615,
|
387 |
+
"2021_wiosna": 47.44897959183674,
|
388 |
+
"2013_wiosna": 44.84536082474227,
|
389 |
+
"2013_jesien": 43.97905759162304,
|
390 |
+
"overall_accuracy": 42.93339521930842
|
391 |
+
},
|
392 |
+
{
|
393 |
+
"model_name": "model-johnsnowlabs-JSL-MedLlama-3-8B-v2.0",
|
394 |
+
"2008_jesień": 29.292929292929294,
|
395 |
+
"2012_wiosna": 31.958762886597935,
|
396 |
+
"2010_jesień": 28.14070351758794,
|
397 |
+
"2009_wiosna": 31.313131313131315,
|
398 |
+
"2010_wiosna": 35.0,
|
399 |
+
"2011_wiosna": 23.737373737373737,
|
400 |
+
"2012_jesień": 38.265306122448976,
|
401 |
+
"2011_jesień": 25.757575757575758,
|
402 |
+
"2009_jesień": 35.0,
|
403 |
+
"2022_wiosna": 30.808080808080806,
|
404 |
+
"2014_wiosna": 31.122448979591837,
|
405 |
+
"2022_jesien": 34.69387755102041,
|
406 |
+
"2014_jesien": 34.196891191709845,
|
407 |
+
"2024_wiosna": 29.949238578680205,
|
408 |
+
"2015_wiosna": 31.182795698924732,
|
409 |
+
"2023_wiosna": 30.808080808080806,
|
410 |
+
"2021_jesien": 29.797979797979796,
|
411 |
+
"2015_jesien": 26.31578947368421,
|
412 |
+
"2023_jesien": 32.82051282051282,
|
413 |
+
"2021_wiosna": 33.6734693877551,
|
414 |
+
"2013_wiosna": 30.927835051546392,
|
415 |
+
"2013_jesien": 30.89005235602094,
|
416 |
+
"overall_accuracy": 31.16732420515201
|
417 |
+
},
|
418 |
+
{
|
419 |
+
"model_name": "model-BioMistral-BioMistral-7B",
|
420 |
+
"2008_jesień": 23.232323232323232,
|
421 |
+
"2012_wiosna": 21.1340206185567,
|
422 |
+
"2010_jesień": 23.115577889447238,
|
423 |
+
"2009_wiosna": 25.757575757575758,
|
424 |
+
"2010_wiosna": 23.0,
|
425 |
+
"2011_wiosna": 23.737373737373737,
|
426 |
+
"2012_jesień": 28.57142857142857,
|
427 |
+
"2011_jesień": 24.242424242424242,
|
428 |
+
"2009_jesień": 23.5,
|
429 |
+
"2022_wiosna": 20.2020202020202,
|
430 |
+
"2014_wiosna": 24.489795918367346,
|
431 |
+
"2022_jesien": 28.57142857142857,
|
432 |
+
"2014_jesien": 22.279792746113987,
|
433 |
+
"2024_wiosna": 25.888324873096447,
|
434 |
+
"2015_wiosna": 24.731182795698924,
|
435 |
+
"2023_wiosna": 24.747474747474747,
|
436 |
+
"2021_jesien": 26.767676767676768,
|
437 |
+
"2015_jesien": 28.421052631578945,
|
438 |
+
"2023_jesien": 25.64102564102564,
|
439 |
+
"2021_wiosna": 19.387755102040817,
|
440 |
+
"2013_wiosna": 23.711340206185564,
|
441 |
+
"2013_jesien": 29.84293193717277,
|
442 |
+
"overall_accuracy": 24.576467857971686
|
443 |
+
}
|
444 |
+
]
|
leaderboards/lek_accs.json
ADDED
@@ -0,0 +1,444 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
[
|
2 |
+
{
|
3 |
+
"model_name": "model-meta-llama-Meta-Llama-3.1-8B-Instruct",
|
4 |
+
"2011_wiosna": 53.03030303030303,
|
5 |
+
"2010_wiosna": 54.0,
|
6 |
+
"2008_jesień": 51.26903553299492,
|
7 |
+
"2011_jesień": 56.56565656565656,
|
8 |
+
"2009_jesień": 47.20812182741117,
|
9 |
+
"2010_jesień": 43.43434343434344,
|
10 |
+
"2012_wiosna": 53.0,
|
11 |
+
"2009_wiosna": 45.22613065326633,
|
12 |
+
"2012_jesień": 52.55102040816326,
|
13 |
+
"2022_wiosna": 45.91836734693878,
|
14 |
+
"2014_wiosna": 52.307692307692314,
|
15 |
+
"2022_jesien": 53.06122448979592,
|
16 |
+
"2014_jesien": 53.125,
|
17 |
+
"2024_wiosna": 57.868020304568525,
|
18 |
+
"2015_wiosna": 54.54545454545454,
|
19 |
+
"2023_wiosna": 51.03092783505154,
|
20 |
+
"2021_jesien": 52.0618556701031,
|
21 |
+
"2015_jesien": 44.73684210526316,
|
22 |
+
"2023_jesien": 48.45360824742268,
|
23 |
+
"2021_wiosna": 47.0,
|
24 |
+
"2013_wiosna": 54.166666666666664,
|
25 |
+
"2013_jesien": 51.832460732984295,
|
26 |
+
"overall_accuracy": 51.02040816326531
|
27 |
+
},
|
28 |
+
{
|
29 |
+
"model_name": "model-meta-llama-Meta-Llama-3.1-70B-Instruct",
|
30 |
+
"2011_wiosna": 77.27272727272727,
|
31 |
+
"2010_wiosna": 82.0,
|
32 |
+
"2008_jesień": 79.69543147208121,
|
33 |
+
"2011_jesień": 83.33333333333334,
|
34 |
+
"2009_jesień": 81.21827411167513,
|
35 |
+
"2010_jesień": 80.8080808080808,
|
36 |
+
"2012_wiosna": 80.0,
|
37 |
+
"2009_wiosna": 72.8643216080402,
|
38 |
+
"2012_jesień": 81.12244897959184,
|
39 |
+
"2022_wiosna": 79.59183673469387,
|
40 |
+
"2014_wiosna": 76.41025641025641,
|
41 |
+
"2022_jesien": 82.14285714285714,
|
42 |
+
"2014_jesien": 87.5,
|
43 |
+
"2024_wiosna": 86.29441624365482,
|
44 |
+
"2015_wiosna": 77.77777777777779,
|
45 |
+
"2023_wiosna": 78.8659793814433,
|
46 |
+
"2021_jesien": 81.44329896907216,
|
47 |
+
"2015_jesien": 78.42105263157895,
|
48 |
+
"2023_jesien": 83.50515463917526,
|
49 |
+
"2021_wiosna": 84.5,
|
50 |
+
"2013_wiosna": 77.60416666666666,
|
51 |
+
"2013_jesien": 78.01047120418848,
|
52 |
+
"overall_accuracy": 80.47309833024119
|
53 |
+
},
|
54 |
+
{
|
55 |
+
"model_name": "model-Qwen-Qwen2.5-72B-Instruct",
|
56 |
+
"2011_wiosna": 75.25252525252525,
|
57 |
+
"2010_wiosna": 76.0,
|
58 |
+
"2008_jesień": 80.71065989847716,
|
59 |
+
"2011_jesień": 73.73737373737373,
|
60 |
+
"2009_jesień": 71.06598984771574,
|
61 |
+
"2010_jesień": 74.74747474747475,
|
62 |
+
"2012_wiosna": 79.0,
|
63 |
+
"2009_wiosna": 74.87437185929649,
|
64 |
+
"2012_jesień": 76.0204081632653,
|
65 |
+
"2022_wiosna": 72.95918367346938,
|
66 |
+
"2014_wiosna": 77.43589743589745,
|
67 |
+
"2022_jesien": 77.04081632653062,
|
68 |
+
"2014_jesien": 84.375,
|
69 |
+
"2024_wiosna": 81.21827411167513,
|
70 |
+
"2015_wiosna": 75.25252525252525,
|
71 |
+
"2023_wiosna": 77.83505154639175,
|
72 |
+
"2021_jesien": 73.19587628865979,
|
73 |
+
"2015_jesien": 73.15789473684211,
|
74 |
+
"2023_jesien": 76.28865979381443,
|
75 |
+
"2021_wiosna": 78.5,
|
76 |
+
"2013_wiosna": 72.91666666666666,
|
77 |
+
"2013_jesien": 79.05759162303664,
|
78 |
+
"overall_accuracy": 76.39146567717997
|
79 |
+
},
|
80 |
+
{
|
81 |
+
"model_name": "model-gpt-4o-mini-2024-07-18",
|
82 |
+
"2011_wiosna": 75.75757575757575,
|
83 |
+
"2010_wiosna": 74.5,
|
84 |
+
"2008_jesień": 77.15736040609137,
|
85 |
+
"2011_jesień": 72.72727272727273,
|
86 |
+
"2009_jesień": 71.06598984771574,
|
87 |
+
"2010_jesień": 75.75757575757575,
|
88 |
+
"2012_wiosna": 75.0,
|
89 |
+
"2009_wiosna": 72.8643216080402,
|
90 |
+
"2012_jesień": 78.57142857142857,
|
91 |
+
"2022_wiosna": 70.40816326530613,
|
92 |
+
"2014_wiosna": 72.82051282051282,
|
93 |
+
"2022_jesien": 76.53061224489795,
|
94 |
+
"2014_jesien": 76.5625,
|
95 |
+
"2024_wiosna": 82.23350253807106,
|
96 |
+
"2015_wiosna": 73.23232323232324,
|
97 |
+
"2023_wiosna": 75.25773195876289,
|
98 |
+
"2021_jesien": 72.16494845360825,
|
99 |
+
"2015_jesien": 75.78947368421053,
|
100 |
+
"2023_jesien": 78.35051546391753,
|
101 |
+
"2021_wiosna": 80.5,
|
102 |
+
"2013_wiosna": 74.47916666666666,
|
103 |
+
"2013_jesien": 78.01047120418848,
|
104 |
+
"overall_accuracy": 75.44063079777365
|
105 |
+
},
|
106 |
+
{
|
107 |
+
"model_name": "model-aaditya-Llama3-OpenBioLLM-70B",
|
108 |
+
"2011_wiosna": 23.232323232323232,
|
109 |
+
"2010_wiosna": 18.0,
|
110 |
+
"2008_jesień": 36.04060913705584,
|
111 |
+
"2011_jesień": 58.58585858585859,
|
112 |
+
"2009_jesień": 54.314720812182735,
|
113 |
+
"2010_jesień": 54.04040404040404,
|
114 |
+
"2012_wiosna": 61.0,
|
115 |
+
"2009_wiosna": 54.2713567839196,
|
116 |
+
"2012_jesień": 58.16326530612245,
|
117 |
+
"2022_wiosna": 60.204081632653065,
|
118 |
+
"2014_wiosna": 57.43589743589743,
|
119 |
+
"2022_jesien": 57.6530612244898,
|
120 |
+
"2014_jesien": 63.541666666666664,
|
121 |
+
"2024_wiosna": 68.02030456852792,
|
122 |
+
"2015_wiosna": 62.121212121212125,
|
123 |
+
"2023_wiosna": 62.371134020618555,
|
124 |
+
"2021_jesien": 61.34020618556701,
|
125 |
+
"2015_jesien": 57.89473684210527,
|
126 |
+
"2023_jesien": 62.371134020618555,
|
127 |
+
"2021_wiosna": 65.0,
|
128 |
+
"2013_wiosna": 57.8125,
|
129 |
+
"2013_jesien": 61.25654450261781,
|
130 |
+
"overall_accuracy": 55.14842300556586
|
131 |
+
},
|
132 |
+
{
|
133 |
+
"model_name": "model-mistralai-Mistral-Large-Instruct-2407",
|
134 |
+
"2011_wiosna": 76.26262626262627,
|
135 |
+
"2010_wiosna": 76.5,
|
136 |
+
"2008_jesień": 76.6497461928934,
|
137 |
+
"2011_jesień": 79.29292929292929,
|
138 |
+
"2009_jesień": 71.57360406091371,
|
139 |
+
"2010_jesień": 74.24242424242425,
|
140 |
+
"2012_wiosna": 77.5,
|
141 |
+
"2009_wiosna": 72.8643216080402,
|
142 |
+
"2012_jesień": 76.53061224489795,
|
143 |
+
"2022_wiosna": 72.95918367346938,
|
144 |
+
"2014_wiosna": 80.0,
|
145 |
+
"2022_jesien": 75.0,
|
146 |
+
"2014_jesien": 76.5625,
|
147 |
+
"2024_wiosna": 86.80203045685279,
|
148 |
+
"2015_wiosna": 75.25252525252525,
|
149 |
+
"2023_wiosna": 79.38144329896907,
|
150 |
+
"2021_jesien": 76.28865979381443,
|
151 |
+
"2015_jesien": 71.05263157894737,
|
152 |
+
"2023_jesien": 76.80412371134021,
|
153 |
+
"2021_wiosna": 79.5,
|
154 |
+
"2013_wiosna": 71.875,
|
155 |
+
"2013_jesien": 75.91623036649214,
|
156 |
+
"overall_accuracy": 76.32189239332097
|
157 |
+
},
|
158 |
+
{
|
159 |
+
"model_name": "model-OpenMeditron-Meditron3-8B",
|
160 |
+
"2011_wiosna": 43.93939393939394,
|
161 |
+
"2010_wiosna": 48.0,
|
162 |
+
"2008_jesień": 46.192893401015226,
|
163 |
+
"2011_jesień": 47.474747474747474,
|
164 |
+
"2009_jesień": 46.7005076142132,
|
165 |
+
"2010_jesień": 40.4040404040404,
|
166 |
+
"2012_wiosna": 43.5,
|
167 |
+
"2009_wiosna": 43.21608040201005,
|
168 |
+
"2012_jesień": 45.40816326530612,
|
169 |
+
"2022_wiosna": 41.83673469387755,
|
170 |
+
"2014_wiosna": 42.05128205128205,
|
171 |
+
"2022_jesien": 43.36734693877551,
|
172 |
+
"2014_jesien": 52.604166666666664,
|
173 |
+
"2024_wiosna": 51.26903553299492,
|
174 |
+
"2015_wiosna": 44.94949494949495,
|
175 |
+
"2023_wiosna": 47.93814432989691,
|
176 |
+
"2021_jesien": 44.329896907216494,
|
177 |
+
"2015_jesien": 42.63157894736842,
|
178 |
+
"2023_jesien": 42.2680412371134,
|
179 |
+
"2021_wiosna": 44.0,
|
180 |
+
"2013_wiosna": 48.95833333333333,
|
181 |
+
"2013_jesien": 51.832460732984295,
|
182 |
+
"overall_accuracy": 45.570500927643785
|
183 |
+
},
|
184 |
+
{
|
185 |
+
"model_name": "model-meta-llama-Llama-3.2-1B-Instruct",
|
186 |
+
"2011_wiosna": 18.181818181818183,
|
187 |
+
"2010_wiosna": 25.5,
|
188 |
+
"2008_jesień": 20.304568527918782,
|
189 |
+
"2011_jesień": 30.303030303030305,
|
190 |
+
"2009_jesień": 25.380710659898476,
|
191 |
+
"2010_jesień": 23.737373737373737,
|
192 |
+
"2012_wiosna": 29.5,
|
193 |
+
"2009_wiosna": 29.145728643216078,
|
194 |
+
"2012_jesień": 26.53061224489796,
|
195 |
+
"2022_wiosna": 20.918367346938776,
|
196 |
+
"2014_wiosna": 25.64102564102564,
|
197 |
+
"2022_jesien": 23.46938775510204,
|
198 |
+
"2014_jesien": 26.041666666666668,
|
199 |
+
"2024_wiosna": 25.380710659898476,
|
200 |
+
"2015_wiosna": 26.767676767676768,
|
201 |
+
"2023_wiosna": 22.68041237113402,
|
202 |
+
"2021_jesien": 23.195876288659793,
|
203 |
+
"2015_jesien": 23.684210526315788,
|
204 |
+
"2023_jesien": 27.835051546391753,
|
205 |
+
"2021_wiosna": 26.5,
|
206 |
+
"2013_wiosna": 21.875,
|
207 |
+
"2013_jesien": 23.036649214659686,
|
208 |
+
"overall_accuracy": 24.81447124304267
|
209 |
+
},
|
210 |
+
{
|
211 |
+
"model_name": "model-OpenMeditron-Meditron3-70B",
|
212 |
+
"2011_wiosna": 64.14141414141415,
|
213 |
+
"2010_wiosna": 73.5,
|
214 |
+
"2008_jesień": 62.43654822335025,
|
215 |
+
"2011_jesień": 69.1919191919192,
|
216 |
+
"2009_jesień": 58.88324873096447,
|
217 |
+
"2010_jesień": 61.111111111111114,
|
218 |
+
"2012_wiosna": 68.5,
|
219 |
+
"2009_wiosna": 59.2964824120603,
|
220 |
+
"2012_jesień": 66.83673469387756,
|
221 |
+
"2022_wiosna": 70.91836734693877,
|
222 |
+
"2014_wiosna": 70.25641025641025,
|
223 |
+
"2022_jesien": 63.775510204081634,
|
224 |
+
"2014_jesien": 69.27083333333334,
|
225 |
+
"2024_wiosna": 77.66497461928934,
|
226 |
+
"2015_wiosna": 67.67676767676768,
|
227 |
+
"2023_wiosna": 67.0103092783505,
|
228 |
+
"2021_jesien": 64.43298969072166,
|
229 |
+
"2015_jesien": 66.3157894736842,
|
230 |
+
"2023_jesien": 68.55670103092784,
|
231 |
+
"2021_wiosna": 70.5,
|
232 |
+
"2013_wiosna": 65.625,
|
233 |
+
"2013_jesien": 66.49214659685863,
|
234 |
+
"overall_accuracy": 66.92949907235621
|
235 |
+
},
|
236 |
+
{
|
237 |
+
"model_name": "model-mistralai-Mistral-Small-Instruct-2409",
|
238 |
+
"2011_wiosna": 46.464646464646464,
|
239 |
+
"2010_wiosna": 54.0,
|
240 |
+
"2008_jesień": 51.26903553299492,
|
241 |
+
"2011_jesień": 52.02020202020202,
|
242 |
+
"2009_jesień": 45.68527918781726,
|
243 |
+
"2010_jesień": 50.0,
|
244 |
+
"2012_wiosna": 56.49999999999999,
|
245 |
+
"2009_wiosna": 52.26130653266332,
|
246 |
+
"2012_jesień": 49.48979591836735,
|
247 |
+
"2022_wiosna": 48.97959183673469,
|
248 |
+
"2014_wiosna": 48.205128205128204,
|
249 |
+
"2022_jesien": 52.04081632653062,
|
250 |
+
"2014_jesien": 48.95833333333333,
|
251 |
+
"2024_wiosna": 58.37563451776649,
|
252 |
+
"2015_wiosna": 52.02020202020202,
|
253 |
+
"2023_wiosna": 53.09278350515464,
|
254 |
+
"2021_jesien": 53.608247422680414,
|
255 |
+
"2015_jesien": 47.89473684210526,
|
256 |
+
"2023_jesien": 52.0618556701031,
|
257 |
+
"2021_wiosna": 55.00000000000001,
|
258 |
+
"2013_wiosna": 49.47916666666667,
|
259 |
+
"2013_jesien": 52.35602094240838,
|
260 |
+
"overall_accuracy": 51.36827458256029
|
261 |
+
},
|
262 |
+
{
|
263 |
+
"model_name": "model-ProbeMedicalYonseiMAILab-medllama3-v20",
|
264 |
+
"2011_wiosna": 39.8989898989899,
|
265 |
+
"2010_wiosna": 46.0,
|
266 |
+
"2008_jesień": 38.07106598984771,
|
267 |
+
"2011_jesień": 40.4040404040404,
|
268 |
+
"2009_jesień": 36.04060913705584,
|
269 |
+
"2010_jesień": 38.38383838383838,
|
270 |
+
"2012_wiosna": 40.5,
|
271 |
+
"2009_wiosna": 35.678391959798994,
|
272 |
+
"2012_jesień": 46.42857142857143,
|
273 |
+
"2022_wiosna": 39.285714285714285,
|
274 |
+
"2014_wiosna": 37.94871794871795,
|
275 |
+
"2022_jesien": 41.83673469387755,
|
276 |
+
"2014_jesien": 43.75,
|
277 |
+
"2024_wiosna": 44.67005076142132,
|
278 |
+
"2015_wiosna": 38.38383838383838,
|
279 |
+
"2023_wiosna": 41.23711340206185,
|
280 |
+
"2021_jesien": 45.36082474226804,
|
281 |
+
"2015_jesien": 32.631578947368425,
|
282 |
+
"2023_jesien": 44.84536082474227,
|
283 |
+
"2021_wiosna": 40.5,
|
284 |
+
"2013_wiosna": 41.14583333333333,
|
285 |
+
"2013_jesien": 40.31413612565445,
|
286 |
+
"overall_accuracy": 40.60760667903525
|
287 |
+
},
|
288 |
+
{
|
289 |
+
"model_name": "model-gpt-4o-2024-08-06",
|
290 |
+
"2011_wiosna": 87.37373737373737,
|
291 |
+
"2010_wiosna": 88.5,
|
292 |
+
"2008_jesień": 88.3248730964467,
|
293 |
+
"2011_jesień": 90.40404040404042,
|
294 |
+
"2009_jesień": 87.81725888324873,
|
295 |
+
"2010_jesień": 89.39393939393939,
|
296 |
+
"2012_wiosna": 90.0,
|
297 |
+
"2009_wiosna": 86.93467336683418,
|
298 |
+
"2012_jesień": 88.77551020408163,
|
299 |
+
"2022_wiosna": 89.28571428571429,
|
300 |
+
"2014_wiosna": 88.71794871794872,
|
301 |
+
"2022_jesien": 91.3265306122449,
|
302 |
+
"2014_jesien": 91.66666666666666,
|
303 |
+
"2024_wiosna": 93.4010152284264,
|
304 |
+
"2015_wiosna": 89.8989898989899,
|
305 |
+
"2023_wiosna": 90.72164948453609,
|
306 |
+
"2021_jesien": 86.5979381443299,
|
307 |
+
"2015_jesien": 87.89473684210526,
|
308 |
+
"2023_jesien": 91.23711340206185,
|
309 |
+
"2021_wiosna": 91.0,
|
310 |
+
"2013_wiosna": 89.0625,
|
311 |
+
"2013_jesien": 88.48167539267016,
|
312 |
+
"overall_accuracy": 89.40166975881262
|
313 |
+
},
|
314 |
+
{
|
315 |
+
"model_name": "model-speakleash-Bielik-11B-v2.2-Instruct",
|
316 |
+
"2011_wiosna": 59.59595959595959,
|
317 |
+
"2010_wiosna": 62.0,
|
318 |
+
"2008_jesień": 59.89847715736041,
|
319 |
+
"2011_jesień": 60.1010101010101,
|
320 |
+
"2009_jesień": 58.37563451776649,
|
321 |
+
"2010_jesień": 63.13131313131313,
|
322 |
+
"2012_wiosna": 61.0,
|
323 |
+
"2009_wiosna": 63.31658291457286,
|
324 |
+
"2012_jesień": 63.26530612244898,
|
325 |
+
"2022_wiosna": 58.16326530612245,
|
326 |
+
"2014_wiosna": 57.948717948717956,
|
327 |
+
"2022_jesien": 67.85714285714286,
|
328 |
+
"2014_jesien": 63.541666666666664,
|
329 |
+
"2024_wiosna": 65.48223350253807,
|
330 |
+
"2015_wiosna": 59.59595959595959,
|
331 |
+
"2023_wiosna": 63.4020618556701,
|
332 |
+
"2021_jesien": 62.371134020618555,
|
333 |
+
"2015_jesien": 61.578947368421055,
|
334 |
+
"2023_jesien": 62.88659793814433,
|
335 |
+
"2021_wiosna": 64.5,
|
336 |
+
"2013_wiosna": 61.458333333333336,
|
337 |
+
"2013_jesien": 61.78010471204188,
|
338 |
+
"overall_accuracy": 61.87384044526901
|
339 |
+
},
|
340 |
+
{
|
341 |
+
"model_name": "model-meta-llama-Llama-3.2-3B-Instruct",
|
342 |
+
"2011_wiosna": 36.868686868686865,
|
343 |
+
"2010_wiosna": 38.0,
|
344 |
+
"2008_jesień": 38.578680203045685,
|
345 |
+
"2011_jesień": 47.97979797979798,
|
346 |
+
"2009_jesień": 38.578680203045685,
|
347 |
+
"2010_jesień": 38.38383838383838,
|
348 |
+
"2012_wiosna": 36.0,
|
349 |
+
"2009_wiosna": 40.20100502512563,
|
350 |
+
"2012_jesień": 40.30612244897959,
|
351 |
+
"2022_wiosna": 38.265306122448976,
|
352 |
+
"2014_wiosna": 37.94871794871795,
|
353 |
+
"2022_jesien": 38.775510204081634,
|
354 |
+
"2014_jesien": 36.97916666666667,
|
355 |
+
"2024_wiosna": 42.63959390862944,
|
356 |
+
"2015_wiosna": 40.4040404040404,
|
357 |
+
"2023_wiosna": 37.628865979381445,
|
358 |
+
"2021_jesien": 42.2680412371134,
|
359 |
+
"2015_jesien": 34.73684210526316,
|
360 |
+
"2023_jesien": 42.78350515463917,
|
361 |
+
"2021_wiosna": 39.0,
|
362 |
+
"2013_wiosna": 34.375,
|
363 |
+
"2013_jesien": 43.97905759162304,
|
364 |
+
"overall_accuracy": 39.308905380333954
|
365 |
+
},
|
366 |
+
{
|
367 |
+
"model_name": "model-Qwen-Qwen2.5-7B-Instruct",
|
368 |
+
"2011_wiosna": 50.0,
|
369 |
+
"2010_wiosna": 52.5,
|
370 |
+
"2008_jesień": 54.314720812182735,
|
371 |
+
"2011_jesień": 59.59595959595959,
|
372 |
+
"2009_jesień": 45.68527918781726,
|
373 |
+
"2010_jesień": 48.484848484848484,
|
374 |
+
"2012_wiosna": 45.0,
|
375 |
+
"2009_wiosna": 51.75879396984925,
|
376 |
+
"2012_jesień": 48.97959183673469,
|
377 |
+
"2022_wiosna": 50.0,
|
378 |
+
"2014_wiosna": 48.717948717948715,
|
379 |
+
"2022_jesien": 52.55102040816326,
|
380 |
+
"2014_jesien": 53.645833333333336,
|
381 |
+
"2024_wiosna": 55.32994923857868,
|
382 |
+
"2015_wiosna": 47.474747474747474,
|
383 |
+
"2023_wiosna": 51.546391752577314,
|
384 |
+
"2021_jesien": 58.24742268041238,
|
385 |
+
"2015_jesien": 50.0,
|
386 |
+
"2023_jesien": 50.0,
|
387 |
+
"2021_wiosna": 50.5,
|
388 |
+
"2013_wiosna": 56.770833333333336,
|
389 |
+
"2013_jesien": 50.26178010471204,
|
390 |
+
"overall_accuracy": 51.41465677179963
|
391 |
+
},
|
392 |
+
{
|
393 |
+
"model_name": "model-johnsnowlabs-JSL-MedLlama-3-8B-v2.0",
|
394 |
+
"2011_wiosna": 37.37373737373738,
|
395 |
+
"2010_wiosna": 38.5,
|
396 |
+
"2008_jesień": 38.07106598984771,
|
397 |
+
"2011_jesień": 42.92929292929293,
|
398 |
+
"2009_jesień": 31.979695431472084,
|
399 |
+
"2010_jesień": 34.84848484848485,
|
400 |
+
"2012_wiosna": 37.0,
|
401 |
+
"2009_wiosna": 34.17085427135678,
|
402 |
+
"2012_jesień": 39.285714285714285,
|
403 |
+
"2022_wiosna": 34.183673469387756,
|
404 |
+
"2014_wiosna": 36.92307692307693,
|
405 |
+
"2022_jesien": 41.83673469387755,
|
406 |
+
"2014_jesien": 35.9375,
|
407 |
+
"2024_wiosna": 37.055837563451774,
|
408 |
+
"2015_wiosna": 33.83838383838384,
|
409 |
+
"2023_wiosna": 32.98969072164948,
|
410 |
+
"2021_jesien": 36.597938144329895,
|
411 |
+
"2015_jesien": 33.1578947368421,
|
412 |
+
"2023_jesien": 38.659793814432994,
|
413 |
+
"2021_wiosna": 33.5,
|
414 |
+
"2013_wiosna": 32.8125,
|
415 |
+
"2013_jesien": 40.31413612565445,
|
416 |
+
"overall_accuracy": 36.45640074211503
|
417 |
+
},
|
418 |
+
{
|
419 |
+
"model_name": "model-BioMistral-BioMistral-7B",
|
420 |
+
"2011_wiosna": 22.727272727272727,
|
421 |
+
"2010_wiosna": 25.5,
|
422 |
+
"2008_jesień": 20.812182741116754,
|
423 |
+
"2011_jesień": 27.77777777777778,
|
424 |
+
"2009_jesień": 24.36548223350254,
|
425 |
+
"2010_jesień": 27.27272727272727,
|
426 |
+
"2012_wiosna": 27.500000000000004,
|
427 |
+
"2009_wiosna": 28.643216080402013,
|
428 |
+
"2012_jesień": 22.95918367346939,
|
429 |
+
"2022_wiosna": 22.95918367346939,
|
430 |
+
"2014_wiosna": 26.666666666666668,
|
431 |
+
"2022_jesien": 24.489795918367346,
|
432 |
+
"2014_jesien": 25.520833333333332,
|
433 |
+
"2024_wiosna": 28.426395939086298,
|
434 |
+
"2015_wiosna": 27.77777777777778,
|
435 |
+
"2023_wiosna": 26.288659793814436,
|
436 |
+
"2021_jesien": 26.288659793814436,
|
437 |
+
"2015_jesien": 30.0,
|
438 |
+
"2023_jesien": 24.742268041237114,
|
439 |
+
"2021_wiosna": 28.000000000000004,
|
440 |
+
"2013_wiosna": 27.604166666666668,
|
441 |
+
"2013_jesien": 22.5130890052356,
|
442 |
+
"overall_accuracy": 25.858070500927642
|
443 |
+
}
|
444 |
+
]
|
leaderboards/pes_accs.json
ADDED
@@ -0,0 +1,1277 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
[
|
2 |
+
{
|
3 |
+
"model_name": "model-meta-llama-Meta-Llama-3.1-70B-Instruct",
|
4 |
+
"neurologia": 73.94957983193278,
|
5 |
+
"medycyna pracy": 47.45762711864407,
|
6 |
+
"medycyna rodzinna": 61.66666666666667,
|
7 |
+
"patomorfologia": 81.66666666666667,
|
8 |
+
"radiologia i diagnostyka obrazowa": 75.83333333333333,
|
9 |
+
"medycyna sportowa": 74.16666666666667,
|
10 |
+
"neonatologia": 68.0672268907563,
|
11 |
+
"ortopedia": 61.73913043478261,
|
12 |
+
"medycyna paliatywna": 70.0,
|
13 |
+
"chirurgia stomatologiczna": 56.30252100840336,
|
14 |
+
"dermatologia i wenerologia": 60.0,
|
15 |
+
"diabetologia": 51.66666666666667,
|
16 |
+
"hematologia": 64.16666666666667,
|
17 |
+
"onkologia kliniczna": 60.50420168067227,
|
18 |
+
"protetyka stomatologiczna": 52.5,
|
19 |
+
"neurochirurgia": 47.05882352941176,
|
20 |
+
"alergologia": 61.66666666666667,
|
21 |
+
"geriatria": 69.16666666666667,
|
22 |
+
"ginekologia onkologiczna": 50.42016806722689,
|
23 |
+
"otolaryngologia": 54.700854700854705,
|
24 |
+
"ortodoncja": 40.67796610169492,
|
25 |
+
"anestezjologia": 65.54621848739495,
|
26 |
+
"endokrynologia": 57.49999999999999,
|
27 |
+
"periodontologia": 46.21848739495798,
|
28 |
+
"psychiatria": 61.66666666666667,
|
29 |
+
"rehabilitacja medyczna": 71.66666666666667,
|
30 |
+
"perinatologia": 56.666666666666664,
|
31 |
+
"balneologia i medycyna fizykalna": 55.00000000000001,
|
32 |
+
"pediatria": 70.58823529411765,
|
33 |
+
"nefrologia": 56.666666666666664,
|
34 |
+
"choroby płuc": 74.57627118644068,
|
35 |
+
"okulistyka": 60.16949152542372,
|
36 |
+
"kardiochirurgia": 62.5,
|
37 |
+
"chirurgia naczyniowa": 63.33333333333333,
|
38 |
+
"reumatologia": 64.16666666666667,
|
39 |
+
"chirurgia onkologiczna": 50.0,
|
40 |
+
"transplantologia kliniczna": 47.008547008547005,
|
41 |
+
"radioterapia onkologiczna": 55.00000000000001,
|
42 |
+
"kardiologia": 54.700854700854705,
|
43 |
+
"angiologia": 63.33333333333333,
|
44 |
+
"gastroenterologia": 61.016949152542374,
|
45 |
+
"hipertensjologia": 68.0672268907563,
|
46 |
+
"stomatologia zachowawcza": 47.05882352941176,
|
47 |
+
"choroby płuc dzieci": 62.5,
|
48 |
+
"medycyna ratunkowa": 71.29629629629629,
|
49 |
+
"nefrologia dziecięca": 73.10924369747899,
|
50 |
+
"endokrynologia ginekologiczna i rozrodczość": 63.24786324786324,
|
51 |
+
"anestezjologia i intensywna terapia": 61.53846153846154,
|
52 |
+
"stomatologia dziecięca": 43.69747899159664,
|
53 |
+
"ortopedia i traumatologia narządu ruchu": 56.52173913043478,
|
54 |
+
"położnictwo i ginekologia": 62.93103448275862,
|
55 |
+
"neurologia dziecięca": 73.10924369747899,
|
56 |
+
"choroby zakaźne": 55.00000000000001,
|
57 |
+
"gastroenterologia dziecięca": 66.66666666666666,
|
58 |
+
"stomatologia zachowawcza z endodoncją": 42.016806722689076,
|
59 |
+
"endokrynologia i diabetologia dziecięca": 60.16949152542372,
|
60 |
+
"otorynolaryngologia": 56.41025641025641,
|
61 |
+
"psychiatria dzieci i młodzieży": 76.27118644067797,
|
62 |
+
"chirurgia ogólna": 66.66666666666666,
|
63 |
+
"choroby wewnętrzne": 78.33333333333333,
|
64 |
+
"diagnostyka laboratoryjna": 77.96610169491525,
|
65 |
+
"chirurgia dziecięca": 61.86440677966102,
|
66 |
+
"urologia dziecięca": 54.86725663716814,
|
67 |
+
"zdrowie publiczne": 75.63025210084034,
|
68 |
+
"genetyka kliniczna": 65.2542372881356,
|
69 |
+
"medycyna nuklearna": 75.21367521367522,
|
70 |
+
"kardiologia dziecięca": 58.77192982456141,
|
71 |
+
"chirurgia plastyczna": 64.16666666666667,
|
72 |
+
"chirurgia klatki piersiowej": 65.83333333333333,
|
73 |
+
"audiologia i foniatria": 60.526315789473685,
|
74 |
+
"intensywna terapia": 74.16666666666667,
|
75 |
+
"overall_accuracy": 61.974340698503205
|
76 |
+
},
|
77 |
+
{
|
78 |
+
"model_name": "model-meta-llama-Meta-Llama-3.1-8B-Instruct",
|
79 |
+
"neurologia": 51.26050420168067,
|
80 |
+
"medycyna pracy": 38.983050847457626,
|
81 |
+
"medycyna rodzinna": 34.166666666666664,
|
82 |
+
"patomorfologia": 46.666666666666664,
|
83 |
+
"radiologia i diagnostyka obrazowa": 41.66666666666667,
|
84 |
+
"medycyna sportowa": 45.0,
|
85 |
+
"neonatologia": 45.378151260504204,
|
86 |
+
"ortopedia": 40.0,
|
87 |
+
"medycyna paliatywna": 55.00000000000001,
|
88 |
+
"chirurgia stomatologiczna": 31.092436974789916,
|
89 |
+
"dermatologia i wenerologia": 34.166666666666664,
|
90 |
+
"diabetologia": 40.833333333333336,
|
91 |
+
"hematologia": 40.833333333333336,
|
92 |
+
"onkologia kliniczna": 36.134453781512605,
|
93 |
+
"protetyka stomatologiczna": 40.0,
|
94 |
+
"neurochirurgia": 26.05042016806723,
|
95 |
+
"alergologia": 35.833333333333336,
|
96 |
+
"geriatria": 44.166666666666664,
|
97 |
+
"ginekologia onkologiczna": 42.016806722689076,
|
98 |
+
"otolaryngologia": 27.350427350427353,
|
99 |
+
"ortodoncja": 24.576271186440678,
|
100 |
+
"anestezjologia": 50.42016806722689,
|
101 |
+
"endokrynologia": 31.666666666666664,
|
102 |
+
"periodontologia": 38.655462184873954,
|
103 |
+
"psychiatria": 32.5,
|
104 |
+
"rehabilitacja medyczna": 46.666666666666664,
|
105 |
+
"perinatologia": 36.666666666666664,
|
106 |
+
"balneologia i medycyna fizykalna": 40.0,
|
107 |
+
"pediatria": 39.49579831932773,
|
108 |
+
"nefrologia": 36.666666666666664,
|
109 |
+
"choroby płuc": 50.847457627118644,
|
110 |
+
"okulistyka": 44.06779661016949,
|
111 |
+
"kardiochirurgia": 42.5,
|
112 |
+
"chirurgia naczyniowa": 36.666666666666664,
|
113 |
+
"reumatologia": 40.0,
|
114 |
+
"chirurgia onkologiczna": 36.666666666666664,
|
115 |
+
"transplantologia kliniczna": 34.18803418803419,
|
116 |
+
"radioterapia onkologiczna": 35.0,
|
117 |
+
"kardiologia": 38.46153846153847,
|
118 |
+
"angiologia": 39.166666666666664,
|
119 |
+
"gastroenterologia": 38.13559322033898,
|
120 |
+
"hipertensjologia": 46.21848739495798,
|
121 |
+
"stomatologia zachowawcza": 37.81512605042017,
|
122 |
+
"choroby płuc dzieci": 38.333333333333336,
|
123 |
+
"medycyna ratunkowa": 49.074074074074076,
|
124 |
+
"nefrologia dziecięca": 45.378151260504204,
|
125 |
+
"endokrynologia ginekologiczna i rozrodczość": 42.73504273504273,
|
126 |
+
"anestezjologia i intensywna terapia": 35.04273504273504,
|
127 |
+
"stomatologia dziecięca": 31.932773109243694,
|
128 |
+
"ortopedia i traumatologia narządu ruchu": 37.391304347826086,
|
129 |
+
"położnictwo i ginekologia": 39.6551724137931,
|
130 |
+
"neurologia dziecięca": 41.17647058823529,
|
131 |
+
"choroby zakaźne": 30.833333333333336,
|
132 |
+
"gastroenterologia dziecięca": 39.166666666666664,
|
133 |
+
"stomatologia zachowawcza z endodoncją": 26.89075630252101,
|
134 |
+
"endokrynologia i diabetologia dziecięca": 41.52542372881356,
|
135 |
+
"otorynolaryngologia": 36.75213675213676,
|
136 |
+
"psychiatria dzieci i młodzieży": 52.54237288135594,
|
137 |
+
"chirurgia ogólna": 41.66666666666667,
|
138 |
+
"choroby wewnętrzne": 43.333333333333336,
|
139 |
+
"diagnostyka laboratoryjna": 48.30508474576271,
|
140 |
+
"chirurgia dziecięca": 33.05084745762712,
|
141 |
+
"urologia dziecięca": 36.283185840707965,
|
142 |
+
"zdrowie publiczne": 60.50420168067227,
|
143 |
+
"genetyka kliniczna": 46.61016949152542,
|
144 |
+
"medycyna nuklearna": 43.58974358974359,
|
145 |
+
"kardiologia dziecięca": 40.35087719298245,
|
146 |
+
"chirurgia plastyczna": 43.333333333333336,
|
147 |
+
"chirurgia klatki piersiowej": 36.666666666666664,
|
148 |
+
"audiologia i foniatria": 47.368421052631575,
|
149 |
+
"intensywna terapia": 44.166666666666664,
|
150 |
+
"overall_accuracy": 40.092658588738416
|
151 |
+
},
|
152 |
+
{
|
153 |
+
"model_name": "model-Qwen-Qwen2.5-72B-Instruct",
|
154 |
+
"neurologia": 67.22689075630252,
|
155 |
+
"medycyna pracy": 48.30508474576271,
|
156 |
+
"medycyna rodzinna": 59.166666666666664,
|
157 |
+
"patomorfologia": 67.5,
|
158 |
+
"radiologia i diagnostyka obrazowa": 70.83333333333334,
|
159 |
+
"medycyna sportowa": 70.0,
|
160 |
+
"neonatologia": 56.30252100840336,
|
161 |
+
"ortopedia": 58.26086956521739,
|
162 |
+
"medycyna paliatywna": 68.33333333333333,
|
163 |
+
"chirurgia stomatologiczna": 50.42016806722689,
|
164 |
+
"dermatologia i wenerologia": 53.333333333333336,
|
165 |
+
"diabetologia": 50.0,
|
166 |
+
"hematologia": 55.833333333333336,
|
167 |
+
"onkologia kliniczna": 54.621848739495796,
|
168 |
+
"protetyka stomatologiczna": 54.166666666666664,
|
169 |
+
"neurochirurgia": 50.42016806722689,
|
170 |
+
"alergologia": 59.166666666666664,
|
171 |
+
"geriatria": 66.66666666666666,
|
172 |
+
"ginekologia onkologiczna": 53.78151260504202,
|
173 |
+
"otolaryngologia": 48.717948717948715,
|
174 |
+
"ortodoncja": 48.30508474576271,
|
175 |
+
"anestezjologia": 62.18487394957983,
|
176 |
+
"endokrynologia": 47.5,
|
177 |
+
"periodontologia": 51.26050420168067,
|
178 |
+
"psychiatria": 54.166666666666664,
|
179 |
+
"rehabilitacja medyczna": 61.66666666666667,
|
180 |
+
"perinatologia": 58.333333333333336,
|
181 |
+
"balneologia i medycyna fizykalna": 54.166666666666664,
|
182 |
+
"pediatria": 70.58823529411765,
|
183 |
+
"nefrologia": 54.166666666666664,
|
184 |
+
"choroby płuc": 81.35593220338984,
|
185 |
+
"okulistyka": 54.23728813559322,
|
186 |
+
"kardiochirurgia": 55.833333333333336,
|
187 |
+
"chirurgia naczyniowa": 67.5,
|
188 |
+
"reumatologia": 49.166666666666664,
|
189 |
+
"chirurgia onkologiczna": 61.66666666666667,
|
190 |
+
"transplantologia kliniczna": 47.008547008547005,
|
191 |
+
"radioterapia onkologiczna": 55.00000000000001,
|
192 |
+
"kardiologia": 58.97435897435898,
|
193 |
+
"angiologia": 61.66666666666667,
|
194 |
+
"gastroenterologia": 55.08474576271186,
|
195 |
+
"hipertensjologia": 62.18487394957983,
|
196 |
+
"stomatologia zachowawcza": 45.378151260504204,
|
197 |
+
"choroby płuc dzieci": 58.333333333333336,
|
198 |
+
"medycyna ratunkowa": 69.44444444444444,
|
199 |
+
"nefrologia dziecięca": 68.0672268907563,
|
200 |
+
"endokrynologia ginekologiczna i rozrodczość": 58.97435897435898,
|
201 |
+
"anestezjologia i intensywna terapia": 63.24786324786324,
|
202 |
+
"stomatologia dziecięca": 48.739495798319325,
|
203 |
+
"ortopedia i traumatologia narządu ruchu": 55.65217391304348,
|
204 |
+
"położnictwo i ginekologia": 62.93103448275862,
|
205 |
+
"neurologia dziecięca": 66.38655462184873,
|
206 |
+
"choroby zakaźne": 64.16666666666667,
|
207 |
+
"gastroenterologia dziecięca": 60.0,
|
208 |
+
"stomatologia zachowawcza z endodoncją": 40.33613445378151,
|
209 |
+
"endokrynologia i diabetologia dziecięca": 60.16949152542372,
|
210 |
+
"otorynolaryngologia": 57.26495726495726,
|
211 |
+
"psychiatria dzieci i młodzieży": 68.64406779661016,
|
212 |
+
"chirurgia ogólna": 63.33333333333333,
|
213 |
+
"choroby wewnętrzne": 66.66666666666666,
|
214 |
+
"diagnostyka laboratoryjna": 79.66101694915254,
|
215 |
+
"chirurgia dziecięca": 49.152542372881356,
|
216 |
+
"urologia dziecięca": 56.63716814159292,
|
217 |
+
"zdrowie publiczne": 76.47058823529412,
|
218 |
+
"genetyka kliniczna": 62.71186440677966,
|
219 |
+
"medycyna nuklearna": 64.1025641025641,
|
220 |
+
"kardiologia dziecięca": 60.526315789473685,
|
221 |
+
"chirurgia plastyczna": 60.83333333333333,
|
222 |
+
"chirurgia klatki piersiowej": 59.166666666666664,
|
223 |
+
"audiologia i foniatria": 59.64912280701754,
|
224 |
+
"intensywna terapia": 78.33333333333333,
|
225 |
+
"overall_accuracy": 59.43216916132098
|
226 |
+
},
|
227 |
+
{
|
228 |
+
"model_name": "model-gpt-4o-mini-2024-07-18",
|
229 |
+
"neurologia": 66.38655462184873,
|
230 |
+
"medycyna pracy": 47.45762711864407,
|
231 |
+
"medycyna rodzinna": 54.166666666666664,
|
232 |
+
"patomorfologia": 69.16666666666667,
|
233 |
+
"radiologia i diagnostyka obrazowa": 68.33333333333333,
|
234 |
+
"medycyna sportowa": 61.66666666666667,
|
235 |
+
"neonatologia": 59.66386554621849,
|
236 |
+
"ortopedia": 51.30434782608696,
|
237 |
+
"medycyna paliatywna": 64.16666666666667,
|
238 |
+
"chirurgia stomatologiczna": 52.10084033613446,
|
239 |
+
"dermatologia i wenerologia": 46.666666666666664,
|
240 |
+
"diabetologia": 50.0,
|
241 |
+
"hematologia": 49.166666666666664,
|
242 |
+
"onkologia kliniczna": 50.42016806722689,
|
243 |
+
"protetyka stomatologiczna": 49.166666666666664,
|
244 |
+
"neurochirurgia": 43.69747899159664,
|
245 |
+
"alergologia": 55.833333333333336,
|
246 |
+
"geriatria": 60.83333333333333,
|
247 |
+
"ginekologia onkologiczna": 49.57983193277311,
|
248 |
+
"otolaryngologia": 55.55555555555556,
|
249 |
+
"ortodoncja": 33.89830508474576,
|
250 |
+
"anestezjologia": 64.70588235294117,
|
251 |
+
"endokrynologia": 50.0,
|
252 |
+
"periodontologia": 42.857142857142854,
|
253 |
+
"psychiatria": 51.66666666666667,
|
254 |
+
"rehabilitacja medyczna": 65.0,
|
255 |
+
"perinatologia": 50.0,
|
256 |
+
"balneologia i medycyna fizykalna": 55.833333333333336,
|
257 |
+
"pediatria": 68.90756302521008,
|
258 |
+
"nefrologia": 53.333333333333336,
|
259 |
+
"choroby płuc": 75.42372881355932,
|
260 |
+
"okulistyka": 55.08474576271186,
|
261 |
+
"kardiochirurgia": 55.00000000000001,
|
262 |
+
"chirurgia naczyniowa": 52.5,
|
263 |
+
"reumatologia": 52.5,
|
264 |
+
"chirurgia onkologiczna": 48.333333333333336,
|
265 |
+
"transplantologia kliniczna": 44.44444444444444,
|
266 |
+
"radioterapia onkologiczna": 46.666666666666664,
|
267 |
+
"kardiologia": 46.15384615384615,
|
268 |
+
"angiologia": 47.5,
|
269 |
+
"gastroenterologia": 55.08474576271186,
|
270 |
+
"hipertensjologia": 64.70588235294117,
|
271 |
+
"stomatologia zachowawcza": 45.378151260504204,
|
272 |
+
"choroby płuc dzieci": 47.5,
|
273 |
+
"medycyna ratunkowa": 67.5925925925926,
|
274 |
+
"nefrologia dziecięca": 63.02521008403361,
|
275 |
+
"endokrynologia ginekologiczna i rozrodczość": 58.119658119658126,
|
276 |
+
"anestezjologia i intensywna terapia": 51.28205128205128,
|
277 |
+
"stomatologia dziecięca": 36.97478991596639,
|
278 |
+
"ortopedia i traumatologia narządu ruchu": 47.82608695652174,
|
279 |
+
"położnictwo i ginekologia": 58.620689655172406,
|
280 |
+
"neurologia dziecięca": 56.30252100840336,
|
281 |
+
"choroby zakaźne": 54.166666666666664,
|
282 |
+
"gastroenterologia dziecięca": 56.666666666666664,
|
283 |
+
"stomatologia zachowawcza z endodoncją": 34.45378151260504,
|
284 |
+
"endokrynologia i diabetologia dziecięca": 53.38983050847458,
|
285 |
+
"otorynolaryngologia": 51.28205128205128,
|
286 |
+
"psychiatria dzieci i młodzieży": 66.94915254237289,
|
287 |
+
"chirurgia ogólna": 68.33333333333333,
|
288 |
+
"choroby wewnętrzne": 60.0,
|
289 |
+
"diagnostyka laboratoryjna": 73.72881355932203,
|
290 |
+
"chirurgia dziecięca": 47.45762711864407,
|
291 |
+
"urologia dziecięca": 56.63716814159292,
|
292 |
+
"zdrowie publiczne": 71.42857142857143,
|
293 |
+
"genetyka kliniczna": 56.779661016949156,
|
294 |
+
"medycyna nuklearna": 59.82905982905983,
|
295 |
+
"kardiologia dziecięca": 57.01754385964912,
|
296 |
+
"chirurgia plastyczna": 61.66666666666667,
|
297 |
+
"chirurgia klatki piersiowej": 52.5,
|
298 |
+
"audiologia i foniatria": 57.01754385964912,
|
299 |
+
"intensywna terapia": 65.0,
|
300 |
+
"overall_accuracy": 55.226894749346634
|
301 |
+
},
|
302 |
+
{
|
303 |
+
"model_name": "model-aaditya-Llama3-OpenBioLLM-70B",
|
304 |
+
"neurologia": 26.05042016806723,
|
305 |
+
"medycyna pracy": 18.64406779661017,
|
306 |
+
"medycyna rodzinna": 20.0,
|
307 |
+
"patomorfologia": 45.0,
|
308 |
+
"radiologia i diagnostyka obrazowa": 49.166666666666664,
|
309 |
+
"medycyna sportowa": 43.333333333333336,
|
310 |
+
"neonatologia": 40.33613445378151,
|
311 |
+
"ortopedia": 29.565217391304348,
|
312 |
+
"medycyna paliatywna": 53.333333333333336,
|
313 |
+
"chirurgia stomatologiczna": 31.932773109243694,
|
314 |
+
"dermatologia i wenerologia": 40.833333333333336,
|
315 |
+
"diabetologia": 39.166666666666664,
|
316 |
+
"hematologia": 39.166666666666664,
|
317 |
+
"onkologia kliniczna": 42.857142857142854,
|
318 |
+
"protetyka stomatologiczna": 33.33333333333333,
|
319 |
+
"neurochirurgia": 29.411764705882355,
|
320 |
+
"alergologia": 41.66666666666667,
|
321 |
+
"geriatria": 35.0,
|
322 |
+
"ginekologia onkologiczna": 33.61344537815126,
|
323 |
+
"otolaryngologia": 24.786324786324787,
|
324 |
+
"ortodoncja": 27.11864406779661,
|
325 |
+
"anestezjologia": 49.57983193277311,
|
326 |
+
"endokrynologia": 35.0,
|
327 |
+
"periodontologia": 37.81512605042017,
|
328 |
+
"psychiatria": 38.333333333333336,
|
329 |
+
"rehabilitacja medyczna": 38.333333333333336,
|
330 |
+
"perinatologia": 30.0,
|
331 |
+
"balneologia i medycyna fizykalna": 36.666666666666664,
|
332 |
+
"pediatria": 51.26050420168067,
|
333 |
+
"nefrologia": 42.5,
|
334 |
+
"choroby płuc": 53.38983050847458,
|
335 |
+
"okulistyka": 37.28813559322034,
|
336 |
+
"kardiochirurgia": 41.66666666666667,
|
337 |
+
"chirurgia naczyniowa": 45.83333333333333,
|
338 |
+
"reumatologia": 32.5,
|
339 |
+
"chirurgia onkologiczna": 45.83333333333333,
|
340 |
+
"transplantologia kliniczna": 35.8974358974359,
|
341 |
+
"radioterapia onkologiczna": 40.833333333333336,
|
342 |
+
"kardiologia": 42.73504273504273,
|
343 |
+
"angiologia": 37.5,
|
344 |
+
"gastroenterologia": 38.13559322033898,
|
345 |
+
"hipertensjologia": 46.21848739495798,
|
346 |
+
"stomatologia zachowawcza": 32.773109243697476,
|
347 |
+
"choroby płuc dzieci": 40.0,
|
348 |
+
"medycyna ratunkowa": 48.148148148148145,
|
349 |
+
"nefrologia dziecięca": 58.82352941176471,
|
350 |
+
"endokrynologia ginekologiczna i rozrodczość": 49.572649572649574,
|
351 |
+
"anestezjologia i intensywna terapia": 45.2991452991453,
|
352 |
+
"stomatologia dziecięca": 29.411764705882355,
|
353 |
+
"ortopedia i traumatologia narządu ruchu": 40.869565217391305,
|
354 |
+
"położnictwo i ginekologia": 37.06896551724138,
|
355 |
+
"neurologia dziecięca": 48.739495798319325,
|
356 |
+
"choroby zakaźne": 36.666666666666664,
|
357 |
+
"gastroenterologia dziecięca": 43.333333333333336,
|
358 |
+
"stomatologia zachowawcza z endodoncją": 31.092436974789916,
|
359 |
+
"endokrynologia i diabetologia dziecięca": 40.67796610169492,
|
360 |
+
"otorynolaryngologia": 35.8974358974359,
|
361 |
+
"psychiatria dzieci i młodzieży": 50.847457627118644,
|
362 |
+
"chirurgia ogólna": 49.166666666666664,
|
363 |
+
"choroby wewnętrzne": 47.5,
|
364 |
+
"diagnostyka laboratoryjna": 55.08474576271186,
|
365 |
+
"chirurgia dziecięca": 38.983050847457626,
|
366 |
+
"urologia dziecięca": 44.24778761061947,
|
367 |
+
"zdrowie publiczne": 56.30252100840336,
|
368 |
+
"genetyka kliniczna": 43.22033898305085,
|
369 |
+
"medycyna nuklearna": 45.2991452991453,
|
370 |
+
"kardiologia dziecięca": 42.10526315789473,
|
371 |
+
"chirurgia plastyczna": 46.666666666666664,
|
372 |
+
"chirurgia klatki piersiowej": 35.0,
|
373 |
+
"audiologia i foniatria": 34.21052631578947,
|
374 |
+
"intensywna terapia": 45.83333333333333,
|
375 |
+
"overall_accuracy": 40.19957234497505
|
376 |
+
},
|
377 |
+
{
|
378 |
+
"model_name": "model-mistralai-Mistral-Large-Instruct-2407",
|
379 |
+
"neurologia": 74.78991596638656,
|
380 |
+
"medycyna pracy": 47.45762711864407,
|
381 |
+
"medycyna rodzinna": 62.5,
|
382 |
+
"patomorfologia": 70.83333333333334,
|
383 |
+
"radiologia i diagnostyka obrazowa": 75.0,
|
384 |
+
"medycyna sportowa": 75.0,
|
385 |
+
"neonatologia": 59.66386554621849,
|
386 |
+
"ortopedia": 59.130434782608695,
|
387 |
+
"medycyna paliatywna": 75.0,
|
388 |
+
"chirurgia stomatologiczna": 50.42016806722689,
|
389 |
+
"dermatologia i wenerologia": 56.666666666666664,
|
390 |
+
"diabetologia": 54.166666666666664,
|
391 |
+
"hematologia": 59.166666666666664,
|
392 |
+
"onkologia kliniczna": 57.98319327731093,
|
393 |
+
"protetyka stomatologiczna": 50.83333333333333,
|
394 |
+
"neurochirurgia": 47.05882352941176,
|
395 |
+
"alergologia": 58.333333333333336,
|
396 |
+
"geriatria": 65.83333333333333,
|
397 |
+
"ginekologia onkologiczna": 56.30252100840336,
|
398 |
+
"otolaryngologia": 51.28205128205128,
|
399 |
+
"ortodoncja": 44.91525423728814,
|
400 |
+
"anestezjologia": 67.22689075630252,
|
401 |
+
"endokrynologia": 51.66666666666667,
|
402 |
+
"periodontologia": 43.69747899159664,
|
403 |
+
"psychiatria": 54.166666666666664,
|
404 |
+
"rehabilitacja medyczna": 65.83333333333333,
|
405 |
+
"perinatologia": 50.83333333333333,
|
406 |
+
"balneologia i medycyna fizykalna": 55.833333333333336,
|
407 |
+
"pediatria": 70.58823529411765,
|
408 |
+
"nefrologia": 51.66666666666667,
|
409 |
+
"choroby płuc": 79.66101694915254,
|
410 |
+
"okulistyka": 55.08474576271186,
|
411 |
+
"kardiochirurgia": 56.666666666666664,
|
412 |
+
"chirurgia naczyniowa": 65.0,
|
413 |
+
"reumatologia": 55.833333333333336,
|
414 |
+
"chirurgia onkologiczna": 60.83333333333333,
|
415 |
+
"transplantologia kliniczna": 49.572649572649574,
|
416 |
+
"radioterapia onkologiczna": 56.666666666666664,
|
417 |
+
"kardiologia": 58.97435897435898,
|
418 |
+
"angiologia": 53.333333333333336,
|
419 |
+
"gastroenterologia": 59.32203389830508,
|
420 |
+
"hipertensjologia": 71.42857142857143,
|
421 |
+
"stomatologia zachowawcza": 40.33613445378151,
|
422 |
+
"choroby płuc dzieci": 57.49999999999999,
|
423 |
+
"medycyna ratunkowa": 72.22222222222221,
|
424 |
+
"nefrologia dziecięca": 63.86554621848739,
|
425 |
+
"endokrynologia ginekologiczna i rozrodczość": 62.39316239316239,
|
426 |
+
"anestezjologia i intensywna terapia": 59.82905982905983,
|
427 |
+
"stomatologia dziecięca": 42.857142857142854,
|
428 |
+
"ortopedia i traumatologia narządu ruchu": 53.91304347826087,
|
429 |
+
"położnictwo i ginekologia": 56.03448275862068,
|
430 |
+
"neurologia dziecięca": 66.38655462184873,
|
431 |
+
"choroby zakaźne": 63.33333333333333,
|
432 |
+
"gastroenterologia dziecięca": 60.0,
|
433 |
+
"stomatologia zachowawcza z endodoncją": 39.49579831932773,
|
434 |
+
"endokrynologia i diabetologia dziecięca": 61.016949152542374,
|
435 |
+
"otorynolaryngologia": 55.55555555555556,
|
436 |
+
"psychiatria dzieci i młodzieży": 70.33898305084746,
|
437 |
+
"chirurgia ogólna": 68.33333333333333,
|
438 |
+
"choroby wewnętrzne": 70.83333333333334,
|
439 |
+
"diagnostyka laboratoryjna": 77.11864406779661,
|
440 |
+
"chirurgia dziecięca": 52.54237288135594,
|
441 |
+
"urologia dziecięca": 51.32743362831859,
|
442 |
+
"zdrowie publiczne": 74.78991596638656,
|
443 |
+
"genetyka kliniczna": 61.86440677966102,
|
444 |
+
"medycyna nuklearna": 64.1025641025641,
|
445 |
+
"kardiologia dziecięca": 57.01754385964912,
|
446 |
+
"chirurgia plastyczna": 58.333333333333336,
|
447 |
+
"chirurgia klatki piersiowej": 61.66666666666667,
|
448 |
+
"audiologia i foniatria": 59.64912280701754,
|
449 |
+
"intensywna terapia": 75.83333333333333,
|
450 |
+
"overall_accuracy": 59.78854834877643
|
451 |
+
},
|
452 |
+
{
|
453 |
+
"model_name": "model-OpenMeditron-Meditron3-8B",
|
454 |
+
"neurologia": 46.21848739495798,
|
455 |
+
"medycyna pracy": 31.35593220338983,
|
456 |
+
"medycyna rodzinna": 30.833333333333336,
|
457 |
+
"patomorfologia": 40.0,
|
458 |
+
"radiologia i diagnostyka obrazowa": 38.333333333333336,
|
459 |
+
"medycyna sportowa": 43.333333333333336,
|
460 |
+
"neonatologia": 42.857142857142854,
|
461 |
+
"ortopedia": 39.130434782608695,
|
462 |
+
"medycyna paliatywna": 51.66666666666667,
|
463 |
+
"chirurgia stomatologiczna": 31.092436974789916,
|
464 |
+
"dermatologia i wenerologia": 26.666666666666668,
|
465 |
+
"diabetologia": 45.0,
|
466 |
+
"hematologia": 34.166666666666664,
|
467 |
+
"onkologia kliniczna": 33.61344537815126,
|
468 |
+
"protetyka stomatologiczna": 39.166666666666664,
|
469 |
+
"neurochirurgia": 31.092436974789916,
|
470 |
+
"alergologia": 30.833333333333336,
|
471 |
+
"geriatria": 36.666666666666664,
|
472 |
+
"ginekologia onkologiczna": 30.252100840336134,
|
473 |
+
"otolaryngologia": 33.33333333333333,
|
474 |
+
"ortodoncja": 27.11864406779661,
|
475 |
+
"anestezjologia": 47.05882352941176,
|
476 |
+
"endokrynologia": 27.500000000000004,
|
477 |
+
"periodontologia": 38.655462184873954,
|
478 |
+
"psychiatria": 32.5,
|
479 |
+
"rehabilitacja medyczna": 40.0,
|
480 |
+
"perinatologia": 18.333333333333332,
|
481 |
+
"balneologia i medycyna fizykalna": 40.833333333333336,
|
482 |
+
"pediatria": 39.49579831932773,
|
483 |
+
"nefrologia": 31.666666666666664,
|
484 |
+
"choroby płuc": 46.61016949152542,
|
485 |
+
"okulistyka": 36.440677966101696,
|
486 |
+
"kardiochirurgia": 42.5,
|
487 |
+
"chirurgia naczyniowa": 39.166666666666664,
|
488 |
+
"reumatologia": 37.5,
|
489 |
+
"chirurgia onkologiczna": 34.166666666666664,
|
490 |
+
"transplantologia kliniczna": 34.18803418803419,
|
491 |
+
"radioterapia onkologiczna": 36.666666666666664,
|
492 |
+
"kardiologia": 28.205128205128204,
|
493 |
+
"angiologia": 38.333333333333336,
|
494 |
+
"gastroenterologia": 38.983050847457626,
|
495 |
+
"hipertensjologia": 41.17647058823529,
|
496 |
+
"stomatologia zachowawcza": 29.411764705882355,
|
497 |
+
"choroby płuc dzieci": 36.666666666666664,
|
498 |
+
"medycyna ratunkowa": 47.22222222222222,
|
499 |
+
"nefrologia dziecięca": 43.69747899159664,
|
500 |
+
"endokrynologia ginekologiczna i rozrodczość": 35.04273504273504,
|
501 |
+
"anestezjologia i intensywna terapia": 34.18803418803419,
|
502 |
+
"stomatologia dziecięca": 29.411764705882355,
|
503 |
+
"ortopedia i traumatologia narządu ruchu": 34.78260869565217,
|
504 |
+
"położnictwo i ginekologia": 32.758620689655174,
|
505 |
+
"neurologia dziecięca": 39.49579831932773,
|
506 |
+
"choroby zakaźne": 26.666666666666668,
|
507 |
+
"gastroenterologia dziecięca": 40.0,
|
508 |
+
"stomatologia zachowawcza z endodoncją": 24.369747899159663,
|
509 |
+
"endokrynologia i diabetologia dziecięca": 37.28813559322034,
|
510 |
+
"otorynolaryngologia": 31.62393162393162,
|
511 |
+
"psychiatria dzieci i młodzieży": 54.23728813559322,
|
512 |
+
"chirurgia ogólna": 36.666666666666664,
|
513 |
+
"choroby wewnętrzne": 35.0,
|
514 |
+
"diagnostyka laboratoryjna": 50.0,
|
515 |
+
"chirurgia dziecięca": 32.20338983050847,
|
516 |
+
"urologia dziecięca": 38.93805309734513,
|
517 |
+
"zdrowie publiczne": 56.30252100840336,
|
518 |
+
"genetyka kliniczna": 30.508474576271187,
|
519 |
+
"medycyna nuklearna": 47.008547008547005,
|
520 |
+
"kardiologia dziecięca": 33.33333333333333,
|
521 |
+
"chirurgia plastyczna": 38.333333333333336,
|
522 |
+
"chirurgia klatki piersiowej": 37.5,
|
523 |
+
"audiologia i foniatria": 45.614035087719294,
|
524 |
+
"intensywna terapia": 46.666666666666664,
|
525 |
+
"overall_accuracy": 37.13471133285816
|
526 |
+
},
|
527 |
+
{
|
528 |
+
"model_name": "model-meta-llama-Llama-3.2-1B-Instruct",
|
529 |
+
"neurologia": 23.52941176470588,
|
530 |
+
"medycyna pracy": 21.1864406779661,
|
531 |
+
"medycyna rodzinna": 24.166666666666668,
|
532 |
+
"patomorfologia": 24.166666666666668,
|
533 |
+
"radiologia i diagnostyka obrazowa": 20.0,
|
534 |
+
"medycyna sportowa": 20.0,
|
535 |
+
"neonatologia": 21.84873949579832,
|
536 |
+
"ortopedia": 14.782608695652174,
|
537 |
+
"medycyna paliatywna": 25.833333333333336,
|
538 |
+
"chirurgia stomatologiczna": 23.52941176470588,
|
539 |
+
"dermatologia i wenerologia": 26.666666666666668,
|
540 |
+
"diabetologia": 25.0,
|
541 |
+
"hematologia": 22.5,
|
542 |
+
"onkologia kliniczna": 24.369747899159663,
|
543 |
+
"protetyka stomatologiczna": 17.5,
|
544 |
+
"neurochirurgia": 21.008403361344538,
|
545 |
+
"alergologia": 20.833333333333336,
|
546 |
+
"geriatria": 22.5,
|
547 |
+
"ginekologia onkologiczna": 21.84873949579832,
|
548 |
+
"otolaryngologia": 14.529914529914532,
|
549 |
+
"ortodoncja": 22.033898305084744,
|
550 |
+
"anestezjologia": 19.327731092436977,
|
551 |
+
"endokrynologia": 17.5,
|
552 |
+
"periodontologia": 20.168067226890756,
|
553 |
+
"psychiatria": 15.0,
|
554 |
+
"rehabilitacja medyczna": 20.0,
|
555 |
+
"perinatologia": 22.5,
|
556 |
+
"balneologia i medycyna fizykalna": 25.833333333333336,
|
557 |
+
"pediatria": 22.689075630252102,
|
558 |
+
"nefrologia": 20.0,
|
559 |
+
"choroby płuc": 27.966101694915253,
|
560 |
+
"okulistyka": 25.423728813559322,
|
561 |
+
"kardiochirurgia": 25.833333333333336,
|
562 |
+
"chirurgia naczyniowa": 23.333333333333332,
|
563 |
+
"reumatologia": 26.666666666666668,
|
564 |
+
"chirurgia onkologiczna": 28.333333333333332,
|
565 |
+
"transplantologia kliniczna": 19.65811965811966,
|
566 |
+
"radioterapia onkologiczna": 21.666666666666668,
|
567 |
+
"kardiologia": 26.495726495726498,
|
568 |
+
"angiologia": 19.166666666666668,
|
569 |
+
"gastroenterologia": 16.101694915254235,
|
570 |
+
"hipertensjologia": 18.487394957983195,
|
571 |
+
"stomatologia zachowawcza": 24.369747899159663,
|
572 |
+
"choroby płuc dzieci": 25.0,
|
573 |
+
"medycyna ratunkowa": 27.77777777777778,
|
574 |
+
"nefrologia dziecięca": 23.52941176470588,
|
575 |
+
"endokrynologia ginekologiczna i rozrodczość": 27.350427350427353,
|
576 |
+
"anestezjologia i intensywna terapia": 24.786324786324787,
|
577 |
+
"stomatologia dziecięca": 18.487394957983195,
|
578 |
+
"ortopedia i traumatologia narządu ruchu": 25.217391304347824,
|
579 |
+
"położnictwo i ginekologia": 18.96551724137931,
|
580 |
+
"neurologia dziecięca": 30.252100840336134,
|
581 |
+
"choroby zakaźne": 20.0,
|
582 |
+
"gastroenterologia dziecięca": 26.666666666666668,
|
583 |
+
"stomatologia zachowawcza z endodoncją": 22.689075630252102,
|
584 |
+
"endokrynologia i diabetologia dziecięca": 24.576271186440678,
|
585 |
+
"otorynolaryngologia": 25.64102564102564,
|
586 |
+
"psychiatria dzieci i młodzieży": 27.11864406779661,
|
587 |
+
"chirurgia ogólna": 22.5,
|
588 |
+
"choroby wewnętrzne": 23.333333333333332,
|
589 |
+
"diagnostyka laboratoryjna": 27.966101694915253,
|
590 |
+
"chirurgia dziecięca": 28.8135593220339,
|
591 |
+
"urologia dziecięca": 26.548672566371685,
|
592 |
+
"zdrowie publiczne": 24.369747899159663,
|
593 |
+
"genetyka kliniczna": 23.728813559322035,
|
594 |
+
"medycyna nuklearna": 23.931623931623932,
|
595 |
+
"kardiologia dziecięca": 31.57894736842105,
|
596 |
+
"chirurgia plastyczna": 20.0,
|
597 |
+
"chirurgia klatki piersiowej": 19.166666666666668,
|
598 |
+
"audiologia i foniatria": 21.929824561403507,
|
599 |
+
"intensywna terapia": 20.833333333333336,
|
600 |
+
"overall_accuracy": 22.903302447137087
|
601 |
+
},
|
602 |
+
{
|
603 |
+
"model_name": "model-OpenMeditron-Meditron3-70B",
|
604 |
+
"neurologia": 61.34453781512605,
|
605 |
+
"medycyna pracy": 34.74576271186441,
|
606 |
+
"medycyna rodzinna": 44.166666666666664,
|
607 |
+
"patomorfologia": 73.33333333333333,
|
608 |
+
"radiologia i diagnostyka obrazowa": 63.33333333333333,
|
609 |
+
"medycyna sportowa": 50.83333333333333,
|
610 |
+
"neonatologia": 57.14285714285714,
|
611 |
+
"ortopedia": 32.17391304347826,
|
612 |
+
"medycyna paliatywna": 55.00000000000001,
|
613 |
+
"chirurgia stomatologiczna": 39.49579831932773,
|
614 |
+
"dermatologia i wenerologia": 45.0,
|
615 |
+
"diabetologia": 42.5,
|
616 |
+
"hematologia": 48.333333333333336,
|
617 |
+
"onkologia kliniczna": 47.05882352941176,
|
618 |
+
"protetyka stomatologiczna": 34.166666666666664,
|
619 |
+
"neurochirurgia": 33.61344537815126,
|
620 |
+
"alergologia": 50.83333333333333,
|
621 |
+
"geriatria": 51.66666666666667,
|
622 |
+
"ginekologia onkologiczna": 35.294117647058826,
|
623 |
+
"otolaryngologia": 33.33333333333333,
|
624 |
+
"ortodoncja": 29.66101694915254,
|
625 |
+
"anestezjologia": 45.378151260504204,
|
626 |
+
"endokrynologia": 40.833333333333336,
|
627 |
+
"periodontologia": 36.134453781512605,
|
628 |
+
"psychiatria": 45.0,
|
629 |
+
"rehabilitacja medyczna": 41.66666666666667,
|
630 |
+
"perinatologia": 35.833333333333336,
|
631 |
+
"balneologia i medycyna fizykalna": 45.83333333333333,
|
632 |
+
"pediatria": 62.18487394957983,
|
633 |
+
"nefrologia": 50.0,
|
634 |
+
"choroby płuc": 53.38983050847458,
|
635 |
+
"okulistyka": 48.30508474576271,
|
636 |
+
"kardiochirurgia": 53.333333333333336,
|
637 |
+
"chirurgia naczyniowa": 45.83333333333333,
|
638 |
+
"reumatologia": 49.166666666666664,
|
639 |
+
"chirurgia onkologiczna": 50.83333333333333,
|
640 |
+
"transplantologia kliniczna": 40.17094017094017,
|
641 |
+
"radioterapia onkologiczna": 35.833333333333336,
|
642 |
+
"kardiologia": 41.88034188034188,
|
643 |
+
"angiologia": 41.66666666666667,
|
644 |
+
"gastroenterologia": 44.91525423728814,
|
645 |
+
"hipertensjologia": 50.42016806722689,
|
646 |
+
"stomatologia zachowawcza": 35.294117647058826,
|
647 |
+
"choroby płuc dzieci": 45.83333333333333,
|
648 |
+
"medycyna ratunkowa": 57.407407407407405,
|
649 |
+
"nefrologia dziecięca": 64.70588235294117,
|
650 |
+
"endokrynologia ginekologiczna i rozrodczość": 55.55555555555556,
|
651 |
+
"anestezjologia i intensywna terapia": 53.84615384615385,
|
652 |
+
"stomatologia dziecięca": 31.932773109243694,
|
653 |
+
"ortopedia i traumatologia narządu ruchu": 46.08695652173913,
|
654 |
+
"położnictwo i ginekologia": 46.55172413793103,
|
655 |
+
"neurologia dziecięca": 57.98319327731093,
|
656 |
+
"choroby zakaźne": 45.83333333333333,
|
657 |
+
"gastroenterologia dziecięca": 48.333333333333336,
|
658 |
+
"stomatologia zachowawcza z endodoncją": 31.932773109243694,
|
659 |
+
"endokrynologia i diabetologia dziecięca": 50.0,
|
660 |
+
"otorynolaryngologia": 43.58974358974359,
|
661 |
+
"psychiatria dzieci i młodzieży": 59.32203389830508,
|
662 |
+
"chirurgia ogólna": 50.0,
|
663 |
+
"choroby wewnętrzne": 60.83333333333333,
|
664 |
+
"diagnostyka laboratoryjna": 58.47457627118644,
|
665 |
+
"chirurgia dziecięca": 51.69491525423729,
|
666 |
+
"urologia dziecięca": 44.24778761061947,
|
667 |
+
"zdrowie publiczne": 62.18487394957983,
|
668 |
+
"genetyka kliniczna": 58.47457627118644,
|
669 |
+
"medycyna nuklearna": 55.55555555555556,
|
670 |
+
"kardiologia dziecięca": 54.385964912280706,
|
671 |
+
"chirurgia plastyczna": 47.5,
|
672 |
+
"chirurgia klatki piersiowej": 40.833333333333336,
|
673 |
+
"audiologia i foniatria": 42.10526315789473,
|
674 |
+
"intensywna terapia": 56.666666666666664,
|
675 |
+
"overall_accuracy": 47.58850083155144
|
676 |
+
},
|
677 |
+
{
|
678 |
+
"model_name": "model-ProbeMedicalYonseiMAILab-medllama3-v20",
|
679 |
+
"neurologia": 41.17647058823529,
|
680 |
+
"medycyna pracy": 31.35593220338983,
|
681 |
+
"medycyna rodzinna": 25.833333333333336,
|
682 |
+
"patomorfologia": 39.166666666666664,
|
683 |
+
"radiologia i diagnostyka obrazowa": 39.166666666666664,
|
684 |
+
"medycyna sportowa": 35.0,
|
685 |
+
"neonatologia": 34.45378151260504,
|
686 |
+
"ortopedia": 33.91304347826087,
|
687 |
+
"medycyna paliatywna": 34.166666666666664,
|
688 |
+
"chirurgia stomatologiczna": 28.57142857142857,
|
689 |
+
"dermatologia i wenerologia": 26.666666666666668,
|
690 |
+
"diabetologia": 36.666666666666664,
|
691 |
+
"hematologia": 19.166666666666668,
|
692 |
+
"onkologia kliniczna": 26.89075630252101,
|
693 |
+
"protetyka stomatologiczna": 35.0,
|
694 |
+
"neurochirurgia": 24.369747899159663,
|
695 |
+
"alergologia": 35.0,
|
696 |
+
"geriatria": 28.333333333333332,
|
697 |
+
"ginekologia onkologiczna": 27.73109243697479,
|
698 |
+
"otolaryngologia": 24.786324786324787,
|
699 |
+
"ortodoncja": 22.88135593220339,
|
700 |
+
"anestezjologia": 41.17647058823529,
|
701 |
+
"endokrynologia": 30.0,
|
702 |
+
"periodontologia": 26.05042016806723,
|
703 |
+
"psychiatria": 30.0,
|
704 |
+
"rehabilitacja medyczna": 38.333333333333336,
|
705 |
+
"perinatologia": 22.5,
|
706 |
+
"balneologia i medycyna fizykalna": 35.833333333333336,
|
707 |
+
"pediatria": 31.092436974789916,
|
708 |
+
"nefrologia": 30.833333333333336,
|
709 |
+
"choroby płuc": 42.3728813559322,
|
710 |
+
"okulistyka": 38.983050847457626,
|
711 |
+
"kardiochirurgia": 34.166666666666664,
|
712 |
+
"chirurgia naczyniowa": 36.666666666666664,
|
713 |
+
"reumatologia": 27.500000000000004,
|
714 |
+
"chirurgia onkologiczna": 30.833333333333336,
|
715 |
+
"transplantologia kliniczna": 27.350427350427353,
|
716 |
+
"radioterapia onkologiczna": 30.833333333333336,
|
717 |
+
"kardiologia": 23.931623931623932,
|
718 |
+
"angiologia": 23.333333333333332,
|
719 |
+
"gastroenterologia": 40.67796610169492,
|
720 |
+
"hipertensjologia": 42.857142857142854,
|
721 |
+
"stomatologia zachowawcza": 23.52941176470588,
|
722 |
+
"choroby płuc dzieci": 34.166666666666664,
|
723 |
+
"medycyna ratunkowa": 32.407407407407405,
|
724 |
+
"nefrologia dziecięca": 36.97478991596639,
|
725 |
+
"endokrynologia ginekologiczna i rozrodczość": 32.47863247863248,
|
726 |
+
"anestezjologia i intensywna terapia": 35.8974358974359,
|
727 |
+
"stomatologia dziecięca": 22.689075630252102,
|
728 |
+
"ortopedia i traumatologia narządu ruchu": 32.17391304347826,
|
729 |
+
"położnictwo i ginekologia": 27.586206896551722,
|
730 |
+
"neurologia dziecięca": 33.61344537815126,
|
731 |
+
"choroby zakaźne": 24.166666666666668,
|
732 |
+
"gastroenterologia dziecięca": 30.833333333333336,
|
733 |
+
"stomatologia zachowawcza z endodoncją": 29.411764705882355,
|
734 |
+
"endokrynologia i diabetologia dziecięca": 28.8135593220339,
|
735 |
+
"otorynolaryngologia": 30.76923076923077,
|
736 |
+
"psychiatria dzieci i młodzieży": 38.983050847457626,
|
737 |
+
"chirurgia ogólna": 34.166666666666664,
|
738 |
+
"choroby wewnętrzne": 34.166666666666664,
|
739 |
+
"diagnostyka laboratoryjna": 42.3728813559322,
|
740 |
+
"chirurgia dziecięca": 24.576271186440678,
|
741 |
+
"urologia dziecięca": 30.08849557522124,
|
742 |
+
"zdrowie publiczne": 40.33613445378151,
|
743 |
+
"genetyka kliniczna": 23.728813559322035,
|
744 |
+
"medycyna nuklearna": 23.931623931623932,
|
745 |
+
"kardiologia dziecięca": 34.21052631578947,
|
746 |
+
"chirurgia plastyczna": 34.166666666666664,
|
747 |
+
"chirurgia klatki piersiowej": 25.833333333333336,
|
748 |
+
"audiologia i foniatria": 37.719298245614034,
|
749 |
+
"intensywna terapia": 45.83333333333333,
|
750 |
+
"overall_accuracy": 31.84842005226895
|
751 |
+
},
|
752 |
+
{
|
753 |
+
"model_name": "model-mistralai-Mistral-Small-Instruct-2409",
|
754 |
+
"neurologia": 46.21848739495798,
|
755 |
+
"medycyna pracy": 31.35593220338983,
|
756 |
+
"medycyna rodzinna": 33.33333333333333,
|
757 |
+
"patomorfologia": 41.66666666666667,
|
758 |
+
"radiologia i diagnostyka obrazowa": 45.0,
|
759 |
+
"medycyna sportowa": 45.83333333333333,
|
760 |
+
"neonatologia": 35.294117647058826,
|
761 |
+
"ortopedia": 33.91304347826087,
|
762 |
+
"medycyna paliatywna": 45.0,
|
763 |
+
"chirurgia stomatologiczna": 34.45378151260504,
|
764 |
+
"dermatologia i wenerologia": 36.666666666666664,
|
765 |
+
"diabetologia": 31.666666666666664,
|
766 |
+
"hematologia": 37.5,
|
767 |
+
"onkologia kliniczna": 40.33613445378151,
|
768 |
+
"protetyka stomatologiczna": 36.666666666666664,
|
769 |
+
"neurochirurgia": 33.61344537815126,
|
770 |
+
"alergologia": 36.666666666666664,
|
771 |
+
"geriatria": 36.666666666666664,
|
772 |
+
"ginekologia onkologiczna": 31.092436974789916,
|
773 |
+
"otolaryngologia": 27.350427350427353,
|
774 |
+
"ortodoncja": 31.35593220338983,
|
775 |
+
"anestezjologia": 38.655462184873954,
|
776 |
+
"endokrynologia": 32.5,
|
777 |
+
"periodontologia": 30.252100840336134,
|
778 |
+
"psychiatria": 35.833333333333336,
|
779 |
+
"rehabilitacja medyczna": 38.333333333333336,
|
780 |
+
"perinatologia": 34.166666666666664,
|
781 |
+
"balneologia i medycyna fizykalna": 38.333333333333336,
|
782 |
+
"pediatria": 42.857142857142854,
|
783 |
+
"nefrologia": 35.0,
|
784 |
+
"choroby płuc": 54.23728813559322,
|
785 |
+
"okulistyka": 33.05084745762712,
|
786 |
+
"kardiochirurgia": 36.666666666666664,
|
787 |
+
"chirurgia naczyniowa": 37.5,
|
788 |
+
"reumatologia": 37.5,
|
789 |
+
"chirurgia onkologiczna": 42.5,
|
790 |
+
"transplantologia kliniczna": 35.04273504273504,
|
791 |
+
"radioterapia onkologiczna": 32.5,
|
792 |
+
"kardiologia": 35.8974358974359,
|
793 |
+
"angiologia": 40.0,
|
794 |
+
"gastroenterologia": 38.13559322033898,
|
795 |
+
"hipertensjologia": 46.21848739495798,
|
796 |
+
"stomatologia zachowawcza": 30.252100840336134,
|
797 |
+
"choroby płuc dzieci": 37.5,
|
798 |
+
"medycyna ratunkowa": 44.44444444444444,
|
799 |
+
"nefrologia dziecięca": 52.94117647058824,
|
800 |
+
"endokrynologia ginekologiczna i rozrodczość": 42.73504273504273,
|
801 |
+
"anestezjologia i intensywna terapia": 39.31623931623932,
|
802 |
+
"stomatologia dziecięca": 27.73109243697479,
|
803 |
+
"ortopedia i traumatologia narządu ruchu": 36.52173913043478,
|
804 |
+
"położnictwo i ginekologia": 39.6551724137931,
|
805 |
+
"neurologia dziecięca": 39.49579831932773,
|
806 |
+
"choroby zakaźne": 40.0,
|
807 |
+
"gastroenterologia dziecięca": 42.5,
|
808 |
+
"stomatologia zachowawcza z endodoncją": 30.252100840336134,
|
809 |
+
"endokrynologia i diabetologia dziecięca": 36.440677966101696,
|
810 |
+
"otorynolaryngologia": 29.914529914529915,
|
811 |
+
"psychiatria dzieci i młodzieży": 48.30508474576271,
|
812 |
+
"chirurgia ogólna": 48.333333333333336,
|
813 |
+
"choroby wewnętrzne": 35.0,
|
814 |
+
"diagnostyka laboratoryjna": 49.152542372881356,
|
815 |
+
"chirurgia dziecięca": 41.52542372881356,
|
816 |
+
"urologia dziecięca": 35.39823008849557,
|
817 |
+
"zdrowie publiczne": 58.82352941176471,
|
818 |
+
"genetyka kliniczna": 38.13559322033898,
|
819 |
+
"medycyna nuklearna": 40.17094017094017,
|
820 |
+
"kardiologia dziecięca": 45.614035087719294,
|
821 |
+
"chirurgia plastyczna": 35.833333333333336,
|
822 |
+
"chirurgia klatki piersiowej": 35.833333333333336,
|
823 |
+
"audiologia i foniatria": 35.08771929824561,
|
824 |
+
"intensywna terapia": 48.333333333333336,
|
825 |
+
"overall_accuracy": 38.47707293894037
|
826 |
+
},
|
827 |
+
{
|
828 |
+
"model_name": "model-speakleash-Bielik-11B-v2.2-Instruct",
|
829 |
+
"neurologia": 49.57983193277311,
|
830 |
+
"medycyna pracy": 42.3728813559322,
|
831 |
+
"medycyna rodzinna": 43.333333333333336,
|
832 |
+
"patomorfologia": 50.0,
|
833 |
+
"radiologia i diagnostyka obrazowa": 48.333333333333336,
|
834 |
+
"medycyna sportowa": 55.833333333333336,
|
835 |
+
"neonatologia": 45.378151260504204,
|
836 |
+
"ortopedia": 42.608695652173914,
|
837 |
+
"medycyna paliatywna": 45.83333333333333,
|
838 |
+
"chirurgia stomatologiczna": 36.134453781512605,
|
839 |
+
"dermatologia i wenerologia": 38.333333333333336,
|
840 |
+
"diabetologia": 30.833333333333336,
|
841 |
+
"hematologia": 33.33333333333333,
|
842 |
+
"onkologia kliniczna": 43.69747899159664,
|
843 |
+
"protetyka stomatologiczna": 35.833333333333336,
|
844 |
+
"neurochirurgia": 28.57142857142857,
|
845 |
+
"alergologia": 35.0,
|
846 |
+
"geriatria": 44.166666666666664,
|
847 |
+
"ginekologia onkologiczna": 41.17647058823529,
|
848 |
+
"otolaryngologia": 35.04273504273504,
|
849 |
+
"ortodoncja": 32.20338983050847,
|
850 |
+
"anestezjologia": 52.10084033613446,
|
851 |
+
"endokrynologia": 33.33333333333333,
|
852 |
+
"periodontologia": 36.134453781512605,
|
853 |
+
"psychiatria": 37.5,
|
854 |
+
"rehabilitacja medyczna": 52.5,
|
855 |
+
"perinatologia": 35.833333333333336,
|
856 |
+
"balneologia i medycyna fizykalna": 42.5,
|
857 |
+
"pediatria": 49.57983193277311,
|
858 |
+
"nefrologia": 34.166666666666664,
|
859 |
+
"choroby płuc": 52.54237288135594,
|
860 |
+
"okulistyka": 45.76271186440678,
|
861 |
+
"kardiochirurgia": 37.5,
|
862 |
+
"chirurgia naczyniowa": 45.83333333333333,
|
863 |
+
"reumatologia": 35.833333333333336,
|
864 |
+
"chirurgia onkologiczna": 44.166666666666664,
|
865 |
+
"transplantologia kliniczna": 34.18803418803419,
|
866 |
+
"radioterapia onkologiczna": 42.5,
|
867 |
+
"kardiologia": 40.17094017094017,
|
868 |
+
"angiologia": 47.5,
|
869 |
+
"gastroenterologia": 46.61016949152542,
|
870 |
+
"hipertensjologia": 50.42016806722689,
|
871 |
+
"stomatologia zachowawcza": 27.73109243697479,
|
872 |
+
"choroby płuc dzieci": 46.666666666666664,
|
873 |
+
"medycyna ratunkowa": 48.148148148148145,
|
874 |
+
"nefrologia dziecięca": 50.42016806722689,
|
875 |
+
"endokrynologia ginekologiczna i rozrodczość": 41.02564102564102,
|
876 |
+
"anestezjologia i intensywna terapia": 39.31623931623932,
|
877 |
+
"stomatologia dziecięca": 32.773109243697476,
|
878 |
+
"ortopedia i traumatologia narządu ruchu": 40.0,
|
879 |
+
"położnictwo i ginekologia": 43.96551724137931,
|
880 |
+
"neurologia dziecięca": 42.857142857142854,
|
881 |
+
"choroby zakaźne": 40.833333333333336,
|
882 |
+
"gastroenterologia dziecięca": 40.833333333333336,
|
883 |
+
"stomatologia zachowawcza z endodoncją": 36.134453781512605,
|
884 |
+
"endokrynologia i diabetologia dziecięca": 34.74576271186441,
|
885 |
+
"otorynolaryngologia": 41.02564102564102,
|
886 |
+
"psychiatria dzieci i młodzieży": 59.32203389830508,
|
887 |
+
"chirurgia ogólna": 45.83333333333333,
|
888 |
+
"choroby wewnętrzne": 38.333333333333336,
|
889 |
+
"diagnostyka laboratoryjna": 50.0,
|
890 |
+
"chirurgia dziecięca": 28.8135593220339,
|
891 |
+
"urologia dziecięca": 37.16814159292036,
|
892 |
+
"zdrowie publiczne": 71.42857142857143,
|
893 |
+
"genetyka kliniczna": 37.28813559322034,
|
894 |
+
"medycyna nuklearna": 43.58974358974359,
|
895 |
+
"kardiologia dziecięca": 43.859649122807014,
|
896 |
+
"chirurgia plastyczna": 45.83333333333333,
|
897 |
+
"chirurgia klatki piersiowej": 40.833333333333336,
|
898 |
+
"audiologia i foniatria": 49.122807017543856,
|
899 |
+
"intensywna terapia": 45.83333333333333,
|
900 |
+
"overall_accuracy": 42.219054407222615
|
901 |
+
},
|
902 |
+
{
|
903 |
+
"model_name": "model-gpt-4o-2024-08-06",
|
904 |
+
"neurologia": 83.19327731092437,
|
905 |
+
"medycyna pracy": 61.016949152542374,
|
906 |
+
"medycyna rodzinna": 81.66666666666667,
|
907 |
+
"patomorfologia": 90.0,
|
908 |
+
"radiologia i diagnostyka obrazowa": 89.16666666666667,
|
909 |
+
"medycyna sportowa": 85.83333333333333,
|
910 |
+
"neonatologia": 68.90756302521008,
|
911 |
+
"ortopedia": 72.17391304347827,
|
912 |
+
"medycyna paliatywna": 85.0,
|
913 |
+
"chirurgia stomatologiczna": 59.66386554621849,
|
914 |
+
"dermatologia i wenerologia": 73.33333333333333,
|
915 |
+
"diabetologia": 63.33333333333333,
|
916 |
+
"hematologia": 75.0,
|
917 |
+
"onkologia kliniczna": 78.99159663865547,
|
918 |
+
"protetyka stomatologiczna": 75.83333333333333,
|
919 |
+
"neurochirurgia": 68.90756302521008,
|
920 |
+
"alergologia": 77.5,
|
921 |
+
"geriatria": 81.66666666666667,
|
922 |
+
"ginekologia onkologiczna": 67.22689075630252,
|
923 |
+
"otolaryngologia": 70.94017094017094,
|
924 |
+
"ortodoncja": 53.38983050847458,
|
925 |
+
"anestezjologia": 81.5126050420168,
|
926 |
+
"endokrynologia": 71.66666666666667,
|
927 |
+
"periodontologia": 70.58823529411765,
|
928 |
+
"psychiatria": 82.5,
|
929 |
+
"rehabilitacja medyczna": 80.83333333333333,
|
930 |
+
"perinatologia": 70.0,
|
931 |
+
"balneologia i medycyna fizykalna": 60.83333333333333,
|
932 |
+
"pediatria": 85.71428571428571,
|
933 |
+
"nefrologia": 72.5,
|
934 |
+
"choroby płuc": 85.59322033898306,
|
935 |
+
"okulistyka": 77.11864406779661,
|
936 |
+
"kardiochirurgia": 78.33333333333333,
|
937 |
+
"chirurgia naczyniowa": 75.0,
|
938 |
+
"reumatologia": 83.33333333333334,
|
939 |
+
"chirurgia onkologiczna": 73.33333333333333,
|
940 |
+
"transplantologia kliniczna": 64.1025641025641,
|
941 |
+
"radioterapia onkologiczna": 66.66666666666666,
|
942 |
+
"kardiologia": 64.95726495726495,
|
943 |
+
"angiologia": 73.33333333333333,
|
944 |
+
"gastroenterologia": 74.57627118644068,
|
945 |
+
"hipertensjologia": 78.15126050420169,
|
946 |
+
"stomatologia zachowawcza": 60.50420168067227,
|
947 |
+
"choroby płuc dzieci": 71.66666666666667,
|
948 |
+
"medycyna ratunkowa": 87.03703703703704,
|
949 |
+
"nefrologia dziecięca": 78.15126050420169,
|
950 |
+
"endokrynologia ginekologiczna i rozrodczość": 72.64957264957265,
|
951 |
+
"anestezjologia i intensywna terapia": 75.21367521367522,
|
952 |
+
"stomatologia dziecięca": 64.70588235294117,
|
953 |
+
"ortopedia i traumatologia narządu ruchu": 73.91304347826086,
|
954 |
+
"położnictwo i ginekologia": 79.3103448275862,
|
955 |
+
"neurologia dziecięca": 78.99159663865547,
|
956 |
+
"choroby zakaźne": 76.66666666666667,
|
957 |
+
"gastroenterologia dziecięca": 75.83333333333333,
|
958 |
+
"stomatologia zachowawcza z endodoncją": 52.94117647058824,
|
959 |
+
"endokrynologia i diabetologia dziecięca": 82.20338983050848,
|
960 |
+
"otorynolaryngologia": 70.94017094017094,
|
961 |
+
"psychiatria dzieci i młodzieży": 82.20338983050848,
|
962 |
+
"chirurgia ogólna": 87.5,
|
963 |
+
"choroby wewnętrzne": 85.83333333333333,
|
964 |
+
"diagnostyka laboratoryjna": 90.67796610169492,
|
965 |
+
"chirurgia dziecięca": 74.57627118644068,
|
966 |
+
"urologia dziecięca": 76.99115044247787,
|
967 |
+
"zdrowie publiczne": 85.71428571428571,
|
968 |
+
"genetyka kliniczna": 83.89830508474576,
|
969 |
+
"medycyna nuklearna": 73.50427350427351,
|
970 |
+
"kardiologia dziecięca": 78.94736842105263,
|
971 |
+
"chirurgia plastyczna": 75.83333333333333,
|
972 |
+
"chirurgia klatki piersiowej": 80.83333333333333,
|
973 |
+
"audiologia i foniatria": 75.43859649122807,
|
974 |
+
"intensywna terapia": 85.83333333333333,
|
975 |
+
"overall_accuracy": 75.65930149679258
|
976 |
+
},
|
977 |
+
{
|
978 |
+
"model_name": "model-meta-llama-Llama-3.2-3B-Instruct",
|
979 |
+
"neurologia": 36.97478991596639,
|
980 |
+
"medycyna pracy": 34.74576271186441,
|
981 |
+
"medycyna rodzinna": 34.166666666666664,
|
982 |
+
"patomorfologia": 30.833333333333336,
|
983 |
+
"radiologia i diagnostyka obrazowa": 32.5,
|
984 |
+
"medycyna sportowa": 36.666666666666664,
|
985 |
+
"neonatologia": 35.294117647058826,
|
986 |
+
"ortopedia": 27.82608695652174,
|
987 |
+
"medycyna paliatywna": 46.666666666666664,
|
988 |
+
"chirurgia stomatologiczna": 35.294117647058826,
|
989 |
+
"dermatologia i wenerologia": 34.166666666666664,
|
990 |
+
"diabetologia": 37.5,
|
991 |
+
"hematologia": 30.0,
|
992 |
+
"onkologia kliniczna": 40.33613445378151,
|
993 |
+
"protetyka stomatologiczna": 34.166666666666664,
|
994 |
+
"neurochirurgia": 27.73109243697479,
|
995 |
+
"alergologia": 28.333333333333332,
|
996 |
+
"geriatria": 30.833333333333336,
|
997 |
+
"ginekologia onkologiczna": 28.57142857142857,
|
998 |
+
"otolaryngologia": 19.65811965811966,
|
999 |
+
"ortodoncja": 31.35593220338983,
|
1000 |
+
"anestezjologia": 38.655462184873954,
|
1001 |
+
"endokrynologia": 18.333333333333332,
|
1002 |
+
"periodontologia": 34.45378151260504,
|
1003 |
+
"psychiatria": 25.0,
|
1004 |
+
"rehabilitacja medyczna": 30.833333333333336,
|
1005 |
+
"perinatologia": 30.0,
|
1006 |
+
"balneologia i medycyna fizykalna": 35.833333333333336,
|
1007 |
+
"pediatria": 38.655462184873954,
|
1008 |
+
"nefrologia": 31.666666666666664,
|
1009 |
+
"choroby płuc": 44.06779661016949,
|
1010 |
+
"okulistyka": 37.28813559322034,
|
1011 |
+
"kardiochirurgia": 30.833333333333336,
|
1012 |
+
"chirurgia naczyniowa": 36.666666666666664,
|
1013 |
+
"reumatologia": 31.666666666666664,
|
1014 |
+
"chirurgia onkologiczna": 29.166666666666668,
|
1015 |
+
"transplantologia kliniczna": 29.914529914529915,
|
1016 |
+
"radioterapia onkologiczna": 30.0,
|
1017 |
+
"kardiologia": 29.059829059829063,
|
1018 |
+
"angiologia": 24.166666666666668,
|
1019 |
+
"gastroenterologia": 32.20338983050847,
|
1020 |
+
"hipertensjologia": 32.773109243697476,
|
1021 |
+
"stomatologia zachowawcza": 21.84873949579832,
|
1022 |
+
"choroby płuc dzieci": 24.166666666666668,
|
1023 |
+
"medycyna ratunkowa": 32.407407407407405,
|
1024 |
+
"nefrologia dziecięca": 32.773109243697476,
|
1025 |
+
"endokrynologia ginekologiczna i rozrodczość": 30.76923076923077,
|
1026 |
+
"anestezjologia i intensywna terapia": 29.914529914529915,
|
1027 |
+
"stomatologia dziecięca": 24.369747899159663,
|
1028 |
+
"ortopedia i traumatologia narządu ruchu": 39.130434782608695,
|
1029 |
+
"położnictwo i ginekologia": 32.758620689655174,
|
1030 |
+
"neurologia dziecięca": 34.45378151260504,
|
1031 |
+
"choroby zakaźne": 27.500000000000004,
|
1032 |
+
"gastroenterologia dziecięca": 31.666666666666664,
|
1033 |
+
"stomatologia zachowawcza z endodoncją": 29.411764705882355,
|
1034 |
+
"endokrynologia i diabetologia dziecięca": 33.89830508474576,
|
1035 |
+
"otorynolaryngologia": 25.64102564102564,
|
1036 |
+
"psychiatria dzieci i młodzieży": 38.13559322033898,
|
1037 |
+
"chirurgia ogólna": 36.666666666666664,
|
1038 |
+
"choroby wewnętrzne": 34.166666666666664,
|
1039 |
+
"diagnostyka laboratoryjna": 38.13559322033898,
|
1040 |
+
"chirurgia dziecięca": 31.35593220338983,
|
1041 |
+
"urologia dziecięca": 35.39823008849557,
|
1042 |
+
"zdrowie publiczne": 45.378151260504204,
|
1043 |
+
"genetyka kliniczna": 35.59322033898305,
|
1044 |
+
"medycyna nuklearna": 27.350427350427353,
|
1045 |
+
"kardiologia dziecięca": 41.228070175438596,
|
1046 |
+
"chirurgia plastyczna": 39.166666666666664,
|
1047 |
+
"chirurgia klatki piersiowej": 30.0,
|
1048 |
+
"audiologia i foniatria": 33.33333333333333,
|
1049 |
+
"intensywna terapia": 43.333333333333336,
|
1050 |
+
"overall_accuracy": 32.73936802090758
|
1051 |
+
},
|
1052 |
+
{
|
1053 |
+
"model_name": "model-Qwen-Qwen2.5-7B-Instruct",
|
1054 |
+
"neurologia": 45.378151260504204,
|
1055 |
+
"medycyna pracy": 36.440677966101696,
|
1056 |
+
"medycyna rodzinna": 45.0,
|
1057 |
+
"patomorfologia": 38.333333333333336,
|
1058 |
+
"radiologia i diagnostyka obrazowa": 42.5,
|
1059 |
+
"medycyna sportowa": 46.666666666666664,
|
1060 |
+
"neonatologia": 56.30252100840336,
|
1061 |
+
"ortopedia": 38.26086956521739,
|
1062 |
+
"medycyna paliatywna": 55.833333333333336,
|
1063 |
+
"chirurgia stomatologiczna": 35.294117647058826,
|
1064 |
+
"dermatologia i wenerologia": 35.833333333333336,
|
1065 |
+
"diabetologia": 40.0,
|
1066 |
+
"hematologia": 34.166666666666664,
|
1067 |
+
"onkologia kliniczna": 32.773109243697476,
|
1068 |
+
"protetyka stomatologiczna": 41.66666666666667,
|
1069 |
+
"neurochirurgia": 36.97478991596639,
|
1070 |
+
"alergologia": 45.0,
|
1071 |
+
"geriatria": 48.333333333333336,
|
1072 |
+
"ginekologia onkologiczna": 41.17647058823529,
|
1073 |
+
"otolaryngologia": 30.76923076923077,
|
1074 |
+
"ortodoncja": 36.440677966101696,
|
1075 |
+
"anestezjologia": 43.69747899159664,
|
1076 |
+
"endokrynologia": 30.0,
|
1077 |
+
"periodontologia": 37.81512605042017,
|
1078 |
+
"psychiatria": 35.0,
|
1079 |
+
"rehabilitacja medyczna": 50.83333333333333,
|
1080 |
+
"perinatologia": 40.0,
|
1081 |
+
"balneologia i medycyna fizykalna": 37.5,
|
1082 |
+
"pediatria": 39.49579831932773,
|
1083 |
+
"nefrologia": 35.0,
|
1084 |
+
"choroby płuc": 60.16949152542372,
|
1085 |
+
"okulistyka": 38.13559322033898,
|
1086 |
+
"kardiochirurgia": 36.666666666666664,
|
1087 |
+
"chirurgia naczyniowa": 47.5,
|
1088 |
+
"reumatologia": 34.166666666666664,
|
1089 |
+
"chirurgia onkologiczna": 40.0,
|
1090 |
+
"transplantologia kliniczna": 36.75213675213676,
|
1091 |
+
"radioterapia onkologiczna": 45.83333333333333,
|
1092 |
+
"kardiologia": 38.46153846153847,
|
1093 |
+
"angiologia": 37.5,
|
1094 |
+
"gastroenterologia": 44.06779661016949,
|
1095 |
+
"hipertensjologia": 52.10084033613446,
|
1096 |
+
"stomatologia zachowawcza": 36.134453781512605,
|
1097 |
+
"choroby płuc dzieci": 43.333333333333336,
|
1098 |
+
"medycyna ratunkowa": 51.85185185185185,
|
1099 |
+
"nefrologia dziecięca": 47.05882352941176,
|
1100 |
+
"endokrynologia ginekologiczna i rozrodczość": 41.88034188034188,
|
1101 |
+
"anestezjologia i intensywna terapia": 42.73504273504273,
|
1102 |
+
"stomatologia dziecięca": 33.61344537815126,
|
1103 |
+
"ortopedia i traumatologia narządu ruchu": 40.0,
|
1104 |
+
"położnictwo i ginekologia": 41.37931034482759,
|
1105 |
+
"neurologia dziecięca": 41.17647058823529,
|
1106 |
+
"choroby zakaźne": 39.166666666666664,
|
1107 |
+
"gastroenterologia dziecięca": 40.833333333333336,
|
1108 |
+
"stomatologia zachowawcza z endodoncją": 23.52941176470588,
|
1109 |
+
"endokrynologia i diabetologia dziecięca": 47.45762711864407,
|
1110 |
+
"otorynolaryngologia": 40.17094017094017,
|
1111 |
+
"psychiatria dzieci i młodzieży": 52.54237288135594,
|
1112 |
+
"chirurgia ogólna": 45.83333333333333,
|
1113 |
+
"choroby wewnętrzne": 35.833333333333336,
|
1114 |
+
"diagnostyka laboratoryjna": 59.32203389830508,
|
1115 |
+
"chirurgia dziecięca": 34.74576271186441,
|
1116 |
+
"urologia dziecięca": 26.548672566371685,
|
1117 |
+
"zdrowie publiczne": 64.70588235294117,
|
1118 |
+
"genetyka kliniczna": 41.52542372881356,
|
1119 |
+
"medycyna nuklearna": 42.73504273504273,
|
1120 |
+
"kardiologia dziecięca": 42.10526315789473,
|
1121 |
+
"chirurgia plastyczna": 37.5,
|
1122 |
+
"chirurgia klatki piersiowej": 40.833333333333336,
|
1123 |
+
"audiologia i foniatria": 40.35087719298245,
|
1124 |
+
"intensywna terapia": 47.5,
|
1125 |
+
"overall_accuracy": 41.4944167260632
|
1126 |
+
},
|
1127 |
+
{
|
1128 |
+
"model_name": "model-johnsnowlabs-JSL-MedLlama-3-8B-v2.0",
|
1129 |
+
"neurologia": 28.57142857142857,
|
1130 |
+
"medycyna pracy": 32.20338983050847,
|
1131 |
+
"medycyna rodzinna": 20.0,
|
1132 |
+
"patomorfologia": 37.5,
|
1133 |
+
"radiologia i diagnostyka obrazowa": 22.5,
|
1134 |
+
"medycyna sportowa": 35.833333333333336,
|
1135 |
+
"neonatologia": 30.252100840336134,
|
1136 |
+
"ortopedia": 28.695652173913043,
|
1137 |
+
"medycyna paliatywna": 33.33333333333333,
|
1138 |
+
"chirurgia stomatologiczna": 30.252100840336134,
|
1139 |
+
"dermatologia i wenerologia": 17.5,
|
1140 |
+
"diabetologia": 30.0,
|
1141 |
+
"hematologia": 26.666666666666668,
|
1142 |
+
"onkologia kliniczna": 26.89075630252101,
|
1143 |
+
"protetyka stomatologiczna": 30.0,
|
1144 |
+
"neurochirurgia": 21.008403361344538,
|
1145 |
+
"alergologia": 25.0,
|
1146 |
+
"geriatria": 30.0,
|
1147 |
+
"ginekologia onkologiczna": 19.327731092436977,
|
1148 |
+
"otolaryngologia": 25.64102564102564,
|
1149 |
+
"ortodoncja": 27.11864406779661,
|
1150 |
+
"anestezjologia": 37.81512605042017,
|
1151 |
+
"endokrynologia": 25.0,
|
1152 |
+
"periodontologia": 26.05042016806723,
|
1153 |
+
"psychiatria": 21.666666666666668,
|
1154 |
+
"rehabilitacja medyczna": 31.666666666666664,
|
1155 |
+
"perinatologia": 22.5,
|
1156 |
+
"balneologia i medycyna fizykalna": 34.166666666666664,
|
1157 |
+
"pediatria": 31.932773109243694,
|
1158 |
+
"nefrologia": 23.333333333333332,
|
1159 |
+
"choroby płuc": 37.28813559322034,
|
1160 |
+
"okulistyka": 25.423728813559322,
|
1161 |
+
"kardiochirurgia": 32.5,
|
1162 |
+
"chirurgia naczyniowa": 25.833333333333336,
|
1163 |
+
"reumatologia": 29.166666666666668,
|
1164 |
+
"chirurgia onkologiczna": 31.666666666666664,
|
1165 |
+
"transplantologia kliniczna": 27.350427350427353,
|
1166 |
+
"radioterapia onkologiczna": 25.833333333333336,
|
1167 |
+
"kardiologia": 21.367521367521366,
|
1168 |
+
"angiologia": 25.0,
|
1169 |
+
"gastroenterologia": 29.66101694915254,
|
1170 |
+
"hipertensjologia": 31.092436974789916,
|
1171 |
+
"stomatologia zachowawcza": 31.092436974789916,
|
1172 |
+
"choroby płuc dzieci": 23.333333333333332,
|
1173 |
+
"medycyna ratunkowa": 25.0,
|
1174 |
+
"nefrologia dziecięca": 36.134453781512605,
|
1175 |
+
"endokrynologia ginekologiczna i rozrodczość": 30.76923076923077,
|
1176 |
+
"anestezjologia i intensywna terapia": 29.914529914529915,
|
1177 |
+
"stomatologia dziecięca": 17.647058823529413,
|
1178 |
+
"ortopedia i traumatologia narządu ruchu": 26.08695652173913,
|
1179 |
+
"położnictwo i ginekologia": 25.862068965517242,
|
1180 |
+
"neurologia dziecięca": 36.134453781512605,
|
1181 |
+
"choroby zakaźne": 20.833333333333336,
|
1182 |
+
"gastroenterologia dziecięca": 28.333333333333332,
|
1183 |
+
"stomatologia zachowawcza z endodoncją": 26.05042016806723,
|
1184 |
+
"endokrynologia i diabetologia dziecięca": 29.66101694915254,
|
1185 |
+
"otorynolaryngologia": 29.059829059829063,
|
1186 |
+
"psychiatria dzieci i młodzieży": 39.83050847457627,
|
1187 |
+
"chirurgia ogólna": 31.666666666666664,
|
1188 |
+
"choroby wewnętrzne": 30.0,
|
1189 |
+
"diagnostyka laboratoryjna": 40.67796610169492,
|
1190 |
+
"chirurgia dziecięca": 27.966101694915253,
|
1191 |
+
"urologia dziecięca": 29.20353982300885,
|
1192 |
+
"zdrowie publiczne": 42.857142857142854,
|
1193 |
+
"genetyka kliniczna": 22.033898305084744,
|
1194 |
+
"medycyna nuklearna": 34.18803418803419,
|
1195 |
+
"kardiologia dziecięca": 24.561403508771928,
|
1196 |
+
"chirurgia plastyczna": 35.833333333333336,
|
1197 |
+
"chirurgia klatki piersiowej": 28.333333333333332,
|
1198 |
+
"audiologia i foniatria": 36.84210526315789,
|
1199 |
+
"intensywna terapia": 39.166666666666664,
|
1200 |
+
"overall_accuracy": 28.926110715134236
|
1201 |
+
},
|
1202 |
+
{
|
1203 |
+
"model_name": "model-BioMistral-BioMistral-7B",
|
1204 |
+
"neurologia": 24.369747899159663,
|
1205 |
+
"medycyna pracy": 18.64406779661017,
|
1206 |
+
"medycyna rodzinna": 22.5,
|
1207 |
+
"patomorfologia": 22.5,
|
1208 |
+
"radiologia i diagnostyka obrazowa": 23.333333333333332,
|
1209 |
+
"medycyna sportowa": 23.333333333333332,
|
1210 |
+
"neonatologia": 22.689075630252102,
|
1211 |
+
"ortopedia": 20.0,
|
1212 |
+
"medycyna paliatywna": 30.833333333333336,
|
1213 |
+
"chirurgia stomatologiczna": 19.327731092436977,
|
1214 |
+
"dermatologia i wenerologia": 25.0,
|
1215 |
+
"diabetologia": 20.0,
|
1216 |
+
"hematologia": 25.833333333333336,
|
1217 |
+
"onkologia kliniczna": 26.05042016806723,
|
1218 |
+
"protetyka stomatologiczna": 17.5,
|
1219 |
+
"neurochirurgia": 21.84873949579832,
|
1220 |
+
"alergologia": 21.666666666666668,
|
1221 |
+
"geriatria": 24.166666666666668,
|
1222 |
+
"ginekologia onkologiczna": 19.327731092436977,
|
1223 |
+
"otolaryngologia": 15.384615384615385,
|
1224 |
+
"ortodoncja": 21.1864406779661,
|
1225 |
+
"anestezjologia": 20.168067226890756,
|
1226 |
+
"endokrynologia": 17.5,
|
1227 |
+
"periodontologia": 21.84873949579832,
|
1228 |
+
"psychiatria": 22.5,
|
1229 |
+
"rehabilitacja medyczna": 20.833333333333336,
|
1230 |
+
"perinatologia": 24.166666666666668,
|
1231 |
+
"balneologia i medycyna fizykalna": 26.666666666666668,
|
1232 |
+
"pediatria": 30.252100840336134,
|
1233 |
+
"nefrologia": 19.166666666666668,
|
1234 |
+
"choroby płuc": 25.423728813559322,
|
1235 |
+
"okulistyka": 26.27118644067797,
|
1236 |
+
"kardiochirurgia": 25.833333333333336,
|
1237 |
+
"chirurgia naczyniowa": 20.0,
|
1238 |
+
"reumatologia": 24.166666666666668,
|
1239 |
+
"chirurgia onkologiczna": 30.0,
|
1240 |
+
"transplantologia kliniczna": 23.076923076923077,
|
1241 |
+
"radioterapia onkologiczna": 23.333333333333332,
|
1242 |
+
"kardiologia": 23.931623931623932,
|
1243 |
+
"angiologia": 18.333333333333332,
|
1244 |
+
"gastroenterologia": 19.491525423728813,
|
1245 |
+
"hipertensjologia": 26.05042016806723,
|
1246 |
+
"stomatologia zachowawcza": 22.689075630252102,
|
1247 |
+
"choroby płuc dzieci": 19.166666666666668,
|
1248 |
+
"medycyna ratunkowa": 24.074074074074073,
|
1249 |
+
"nefrologia dziecięca": 27.73109243697479,
|
1250 |
+
"endokrynologia ginekologiczna i rozrodczość": 26.495726495726498,
|
1251 |
+
"anestezjologia i intensywna terapia": 22.22222222222222,
|
1252 |
+
"stomatologia dziecięca": 17.647058823529413,
|
1253 |
+
"ortopedia i traumatologia narządu ruchu": 24.347826086956523,
|
1254 |
+
"położnictwo i ginekologia": 23.275862068965516,
|
1255 |
+
"neurologia dziecięca": 33.61344537815126,
|
1256 |
+
"choroby zakaźne": 20.0,
|
1257 |
+
"gastroenterologia dziecięca": 24.166666666666668,
|
1258 |
+
"stomatologia zachowawcza z endodoncją": 22.689075630252102,
|
1259 |
+
"endokrynologia i diabetologia dziecięca": 25.423728813559322,
|
1260 |
+
"otorynolaryngologia": 24.786324786324787,
|
1261 |
+
"psychiatria dzieci i młodzieży": 23.728813559322035,
|
1262 |
+
"chirurgia ogólna": 26.666666666666668,
|
1263 |
+
"choroby wewnętrzne": 20.833333333333336,
|
1264 |
+
"diagnostyka laboratoryjna": 27.966101694915253,
|
1265 |
+
"chirurgia dziecięca": 30.508474576271187,
|
1266 |
+
"urologia dziecięca": 20.353982300884958,
|
1267 |
+
"zdrowie publiczne": 26.05042016806723,
|
1268 |
+
"genetyka kliniczna": 22.88135593220339,
|
1269 |
+
"medycyna nuklearna": 29.059829059829063,
|
1270 |
+
"kardiologia dziecięca": 28.07017543859649,
|
1271 |
+
"chirurgia plastyczna": 19.166666666666668,
|
1272 |
+
"chirurgia klatki piersiowej": 22.5,
|
1273 |
+
"audiologia i foniatria": 21.929824561403507,
|
1274 |
+
"intensywna terapia": 23.333333333333332,
|
1275 |
+
"overall_accuracy": 23.319078165835116
|
1276 |
+
}
|
1277 |
+
]
|
src/structures/ldek_structure.py
CHANGED
@@ -52,7 +52,8 @@ def load_json_data(file_path, ORDER_LIST_LDEK):
|
|
52 |
return LDEK_ACCS
|
53 |
|
54 |
|
55 |
-
file_path = str(abs_path / "leaderboards/r_ldek_report_scores.json")
|
|
|
56 |
with open(file_path, 'r', encoding='utf-8') as file:
|
57 |
sample_data = pd.read_json(file_path).iloc[0].to_dict() # Load the first row as a dict
|
58 |
|
|
|
52 |
return LDEK_ACCS
|
53 |
|
54 |
|
55 |
+
# file_path = str(abs_path / "leaderboards/r_ldek_report_scores.json")
|
56 |
+
file_path = str(abs_path / "leaderboards/r_ldek_accs.json")
|
57 |
with open(file_path, 'r', encoding='utf-8') as file:
|
58 |
sample_data = pd.read_json(file_path).iloc[0].to_dict() # Load the first row as a dict
|
59 |
|
src/structures/lek_structure.py
CHANGED
@@ -52,7 +52,8 @@ def load_json_data(file_path, ORDER_LIST_LEK):
|
|
52 |
return LEK_ACCS
|
53 |
|
54 |
|
55 |
-
file_path = str(abs_path / "leaderboards/r_lek_report_scores.json")
|
|
|
56 |
with open(file_path, 'r', encoding='utf-8') as file:
|
57 |
sample_data = pd.read_json(file_path).iloc[0].to_dict() # Load the first row as a dict
|
58 |
|
|
|
52 |
return LEK_ACCS
|
53 |
|
54 |
|
55 |
+
# file_path = str(abs_path / "leaderboards/r_lek_report_scores.json")
|
56 |
+
file_path = str(abs_path / "leaderboards/r_lek_accs.json")
|
57 |
with open(file_path, 'r', encoding='utf-8') as file:
|
58 |
sample_data = pd.read_json(file_path).iloc[0].to_dict() # Load the first row as a dict
|
59 |
|
src/structures/pes_structure.py
CHANGED
@@ -57,8 +57,8 @@ def load_json_data(file_path, order_list):
|
|
57 |
PES_ACCS = PES_ACCS.sort_values(by="Score", ascending=False)
|
58 |
|
59 |
return PES_ACCS
|
60 |
-
file_path = str(abs_path / "leaderboards/pes_accuracy.json")
|
61 |
-
|
62 |
with open(file_path, 'r', encoding='utf-8') as file:
|
63 |
sample_data = pd.read_json(file_path).iloc[0].to_dict() # Load the first row as a dict
|
64 |
|
|
|
57 |
PES_ACCS = PES_ACCS.sort_values(by="Score", ascending=False)
|
58 |
|
59 |
return PES_ACCS
|
60 |
+
# file_path = str(abs_path / "leaderboards/pes_accuracy.json")
|
61 |
+
file_path = str(abs_path / "leaderboards/pes_accs.json")
|
62 |
with open(file_path, 'r', encoding='utf-8') as file:
|
63 |
sample_data = pd.read_json(file_path).iloc[0].to_dict() # Load the first row as a dict
|
64 |
|