michal commited on
Commit
92395fa
·
1 Parent(s): 56d4acc
leaderboards/ldek_accs.json ADDED
@@ -0,0 +1,444 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "model_name": "model-meta-llama-Meta-Llama-3.1-8B-Instruct",
4
+ "2008_jesień": 40.4040404040404,
5
+ "2012_wiosna": 40.72164948453608,
6
+ "2010_jesień": 43.71859296482412,
7
+ "2009_wiosna": 47.97979797979798,
8
+ "2010_wiosna": 46.0,
9
+ "2011_wiosna": 33.83838383838384,
10
+ "2012_jesień": 50.0,
11
+ "2011_jesień": 41.41414141414141,
12
+ "2009_jesień": 54.0,
13
+ "2022_wiosna": 38.88888888888889,
14
+ "2014_wiosna": 33.16326530612245,
15
+ "2022_jesien": 40.816326530612244,
16
+ "2014_jesien": 42.487046632124354,
17
+ "2024_wiosna": 39.59390862944163,
18
+ "2015_wiosna": 42.473118279569896,
19
+ "2023_wiosna": 44.94949494949495,
20
+ "2021_jesien": 40.909090909090914,
21
+ "2015_jesien": 41.578947368421055,
22
+ "2023_jesien": 42.05128205128205,
23
+ "2021_wiosna": 41.3265306122449,
24
+ "2013_wiosna": 41.23711340206185,
25
+ "2013_jesien": 44.50261780104712,
26
+ "overall_accuracy": 42.37642144349037
27
+ },
28
+ {
29
+ "model_name": "model-meta-llama-Meta-Llama-3.1-70B-Instruct",
30
+ "2008_jesień": 62.121212121212125,
31
+ "2012_wiosna": 61.34020618556701,
32
+ "2010_jesień": 62.8140703517588,
33
+ "2009_wiosna": 69.1919191919192,
34
+ "2010_wiosna": 73.0,
35
+ "2011_wiosna": 59.59595959595959,
36
+ "2012_jesień": 69.89795918367348,
37
+ "2011_jesień": 65.65656565656566,
38
+ "2009_jesień": 68.0,
39
+ "2022_wiosna": 68.68686868686868,
40
+ "2014_wiosna": 54.59183673469388,
41
+ "2022_jesien": 62.755102040816325,
42
+ "2014_jesien": 60.62176165803109,
43
+ "2024_wiosna": 61.42131979695431,
44
+ "2015_wiosna": 60.215053763440864,
45
+ "2023_wiosna": 62.62626262626263,
46
+ "2021_jesien": 64.14141414141415,
47
+ "2015_jesien": 58.42105263157895,
48
+ "2023_jesien": 61.02564102564103,
49
+ "2021_wiosna": 68.36734693877551,
50
+ "2013_wiosna": 62.371134020618555,
51
+ "2013_jesien": 57.06806282722513,
52
+ "overall_accuracy": 63.402181480621955
53
+ },
54
+ {
55
+ "model_name": "model-Qwen-Qwen2.5-72B-Instruct",
56
+ "2008_jesień": 58.58585858585859,
57
+ "2012_wiosna": 56.70103092783505,
58
+ "2010_jesień": 60.80402010050251,
59
+ "2009_wiosna": 60.1010101010101,
60
+ "2010_wiosna": 63.5,
61
+ "2011_wiosna": 58.58585858585859,
62
+ "2012_jesień": 66.83673469387756,
63
+ "2011_jesień": 54.54545454545454,
64
+ "2009_jesień": 70.5,
65
+ "2022_wiosna": 59.59595959595959,
66
+ "2014_wiosna": 53.57142857142857,
67
+ "2022_jesien": 61.73469387755102,
68
+ "2014_jesien": 61.6580310880829,
69
+ "2024_wiosna": 57.360406091370564,
70
+ "2015_wiosna": 58.602150537634415,
71
+ "2023_wiosna": 56.56565656565656,
72
+ "2021_jesien": 59.59595959595959,
73
+ "2015_jesien": 57.36842105263158,
74
+ "2023_jesien": 54.871794871794876,
75
+ "2021_wiosna": 58.673469387755105,
76
+ "2013_wiosna": 61.855670103092784,
77
+ "2013_jesien": 57.06806282722513,
78
+ "overall_accuracy": 59.503365049895564
79
+ },
80
+ {
81
+ "model_name": "model-gpt-4o-mini-2024-07-18",
82
+ "2008_jesień": 59.09090909090909,
83
+ "2012_wiosna": 55.670103092783506,
84
+ "2010_jesień": 55.27638190954774,
85
+ "2009_wiosna": 68.18181818181817,
86
+ "2010_wiosna": 62.5,
87
+ "2011_wiosna": 50.0,
88
+ "2012_jesień": 65.3061224489796,
89
+ "2011_jesień": 55.05050505050505,
90
+ "2009_jesień": 64.0,
91
+ "2022_wiosna": 52.52525252525253,
92
+ "2014_wiosna": 46.93877551020408,
93
+ "2022_jesien": 54.08163265306123,
94
+ "2014_jesien": 57.51295336787565,
95
+ "2024_wiosna": 56.34517766497462,
96
+ "2015_wiosna": 52.68817204301075,
97
+ "2023_wiosna": 53.535353535353536,
98
+ "2021_jesien": 58.080808080808076,
99
+ "2015_jesien": 57.89473684210527,
100
+ "2023_jesien": 58.46153846153847,
101
+ "2021_wiosna": 59.693877551020414,
102
+ "2013_wiosna": 55.154639175257735,
103
+ "2013_jesien": 51.30890052356021,
104
+ "overall_accuracy": 56.811325133441635
105
+ },
106
+ {
107
+ "model_name": "model-aaditya-Llama3-OpenBioLLM-70B",
108
+ "2008_jesień": 19.19191919191919,
109
+ "2012_wiosna": 19.072164948453608,
110
+ "2010_jesień": 35.175879396984925,
111
+ "2009_wiosna": 50.0,
112
+ "2010_wiosna": 43.0,
113
+ "2011_wiosna": 38.88888888888889,
114
+ "2012_jesień": 43.36734693877551,
115
+ "2011_jesień": 35.35353535353536,
116
+ "2009_jesień": 48.0,
117
+ "2022_wiosna": 45.95959595959596,
118
+ "2014_wiosna": 39.285714285714285,
119
+ "2022_jesien": 43.36734693877551,
120
+ "2014_jesien": 39.37823834196891,
121
+ "2024_wiosna": 44.16243654822335,
122
+ "2015_wiosna": 41.39784946236559,
123
+ "2023_wiosna": 42.92929292929293,
124
+ "2021_jesien": 42.92929292929293,
125
+ "2015_jesien": 38.421052631578945,
126
+ "2023_jesien": 38.97435897435898,
127
+ "2021_wiosna": 41.83673469387755,
128
+ "2013_wiosna": 41.23711340206185,
129
+ "2013_jesien": 42.93193717277487,
130
+ "overall_accuracy": 39.777210489672775
131
+ },
132
+ {
133
+ "model_name": "model-mistralai-Mistral-Large-Instruct-2407",
134
+ "2008_jesień": 61.61616161616161,
135
+ "2012_wiosna": 54.123711340206185,
136
+ "2010_jesień": 62.311557788944725,
137
+ "2009_wiosna": 67.67676767676768,
138
+ "2010_wiosna": 69.5,
139
+ "2011_wiosna": 56.56565656565656,
140
+ "2012_jesień": 66.3265306122449,
141
+ "2011_jesień": 58.080808080808076,
142
+ "2009_jesień": 63.0,
143
+ "2022_wiosna": 54.54545454545454,
144
+ "2014_wiosna": 54.08163265306123,
145
+ "2022_jesien": 56.63265306122449,
146
+ "2014_jesien": 56.476683937823836,
147
+ "2024_wiosna": 55.83756345177665,
148
+ "2015_wiosna": 58.602150537634415,
149
+ "2023_wiosna": 57.57575757575758,
150
+ "2021_jesien": 56.060606060606055,
151
+ "2015_jesien": 60.0,
152
+ "2023_jesien": 48.205128205128204,
153
+ "2021_wiosna": 57.14285714285714,
154
+ "2013_wiosna": 61.34020618556701,
155
+ "2013_jesien": 55.497382198952884,
156
+ "overall_accuracy": 58.71431886748666
157
+ },
158
+ {
159
+ "model_name": "model-OpenMeditron-Meditron3-8B",
160
+ "2008_jesień": 38.88888888888889,
161
+ "2012_wiosna": 39.69072164948454,
162
+ "2010_jesień": 36.18090452261307,
163
+ "2009_wiosna": 41.41414141414141,
164
+ "2010_wiosna": 43.0,
165
+ "2011_wiosna": 32.82828282828283,
166
+ "2012_jesień": 42.3469387755102,
167
+ "2011_jesień": 33.33333333333333,
168
+ "2009_jesień": 41.5,
169
+ "2022_wiosna": 34.34343434343434,
170
+ "2014_wiosna": 30.102040816326532,
171
+ "2022_jesien": 36.734693877551024,
172
+ "2014_jesien": 39.89637305699482,
173
+ "2024_wiosna": 38.07106598984771,
174
+ "2015_wiosna": 36.55913978494624,
175
+ "2023_wiosna": 38.38383838383838,
176
+ "2021_jesien": 41.41414141414141,
177
+ "2015_jesien": 39.473684210526315,
178
+ "2023_jesien": 34.35897435897436,
179
+ "2021_wiosna": 40.816326530612244,
180
+ "2013_wiosna": 42.78350515463917,
181
+ "2013_jesien": 40.83769633507853,
182
+ "overall_accuracy": 38.31515432815038
183
+ },
184
+ {
185
+ "model_name": "model-meta-llama-Llama-3.2-1B-Instruct",
186
+ "2008_jesień": 24.242424242424242,
187
+ "2012_wiosna": 20.618556701030926,
188
+ "2010_jesień": 23.618090452261306,
189
+ "2009_wiosna": 24.242424242424242,
190
+ "2010_wiosna": 23.0,
191
+ "2011_wiosna": 24.747474747474747,
192
+ "2012_jesień": 28.57142857142857,
193
+ "2011_jesień": 21.71717171717172,
194
+ "2009_jesień": 25.5,
195
+ "2022_wiosna": 21.21212121212121,
196
+ "2014_wiosna": 22.448979591836736,
197
+ "2022_jesien": 29.591836734693878,
198
+ "2014_jesien": 23.316062176165804,
199
+ "2024_wiosna": 33.50253807106599,
200
+ "2015_wiosna": 23.655913978494624,
201
+ "2023_wiosna": 28.28282828282828,
202
+ "2021_jesien": 27.27272727272727,
203
+ "2015_jesien": 24.736842105263158,
204
+ "2023_jesien": 27.692307692307693,
205
+ "2021_wiosna": 22.448979591836736,
206
+ "2013_wiosna": 23.711340206185564,
207
+ "2013_jesien": 27.748691099476442,
208
+ "overall_accuracy": 25.08702715247157
209
+ },
210
+ {
211
+ "model_name": "model-OpenMeditron-Meditron3-70B",
212
+ "2008_jesień": 45.95959595959596,
213
+ "2012_wiosna": 43.29896907216495,
214
+ "2010_jesień": 46.733668341708544,
215
+ "2009_wiosna": 51.010101010101,
216
+ "2010_wiosna": 49.0,
217
+ "2011_wiosna": 42.42424242424242,
218
+ "2012_jesień": 47.44897959183674,
219
+ "2011_jesień": 46.96969696969697,
220
+ "2009_jesień": 49.0,
221
+ "2022_wiosna": 45.95959595959596,
222
+ "2014_wiosna": 41.83673469387755,
223
+ "2022_jesien": 48.46938775510204,
224
+ "2014_jesien": 47.15025906735752,
225
+ "2024_wiosna": 52.28426395939086,
226
+ "2015_wiosna": 50.53763440860215,
227
+ "2023_wiosna": 47.474747474747474,
228
+ "2021_jesien": 48.98989898989899,
229
+ "2015_jesien": 51.05263157894737,
230
+ "2023_jesien": 42.56410256410256,
231
+ "2021_wiosna": 45.40816326530612,
232
+ "2013_wiosna": 49.48453608247423,
233
+ "2013_jesien": 45.54973821989529,
234
+ "overall_accuracy": 47.203527500580186
235
+ },
236
+ {
237
+ "model_name": "model-ProbeMedicalYonseiMAILab-medllama3-v20",
238
+ "2008_jesień": 30.303030303030305,
239
+ "2012_wiosna": 31.958762886597935,
240
+ "2010_jesień": 30.15075376884422,
241
+ "2009_wiosna": 37.37373737373738,
242
+ "2010_wiosna": 31.5,
243
+ "2011_wiosna": 30.808080808080806,
244
+ "2012_jesień": 34.69387755102041,
245
+ "2011_jesień": 30.808080808080806,
246
+ "2009_jesień": 35.5,
247
+ "2022_wiosna": 34.84848484848485,
248
+ "2014_wiosna": 26.53061224489796,
249
+ "2022_jesien": 34.183673469387756,
250
+ "2014_jesien": 35.233160621761655,
251
+ "2024_wiosna": 35.025380710659896,
252
+ "2015_wiosna": 33.33333333333333,
253
+ "2023_wiosna": 35.35353535353536,
254
+ "2021_jesien": 31.818181818181817,
255
+ "2015_jesien": 37.89473684210527,
256
+ "2023_jesien": 31.28205128205128,
257
+ "2021_wiosna": 42.857142857142854,
258
+ "2013_wiosna": 38.659793814432994,
259
+ "2013_jesien": 39.26701570680628,
260
+ "overall_accuracy": 34.04502204687863
261
+ },
262
+ {
263
+ "model_name": "model-mistralai-Mistral-Small-Instruct-2409",
264
+ "2008_jesień": 38.38383838383838,
265
+ "2012_wiosna": 34.5360824742268,
266
+ "2010_jesień": 40.7035175879397,
267
+ "2009_wiosna": 44.44444444444444,
268
+ "2010_wiosna": 46.5,
269
+ "2011_wiosna": 34.84848484848485,
270
+ "2012_jesień": 46.42857142857143,
271
+ "2011_jesień": 38.88888888888889,
272
+ "2009_jesień": 45.0,
273
+ "2022_wiosna": 38.88888888888889,
274
+ "2014_wiosna": 34.69387755102041,
275
+ "2022_jesien": 42.857142857142854,
276
+ "2014_jesien": 37.82383419689119,
277
+ "2024_wiosna": 44.16243654822335,
278
+ "2015_wiosna": 38.17204301075269,
279
+ "2023_wiosna": 41.41414141414141,
280
+ "2021_jesien": 42.42424242424242,
281
+ "2015_jesien": 42.10526315789473,
282
+ "2023_jesien": 40.0,
283
+ "2021_wiosna": 41.3265306122449,
284
+ "2013_wiosna": 43.29896907216495,
285
+ "2013_jesien": 44.50261780104712,
286
+ "overall_accuracy": 40.98398700394523
287
+ },
288
+ {
289
+ "model_name": "model-gpt-4o-2024-08-06",
290
+ "2008_jesień": 78.78787878787878,
291
+ "2012_wiosna": 77.83505154639175,
292
+ "2010_jesień": 74.37185929648241,
293
+ "2009_wiosna": 85.85858585858585,
294
+ "2010_wiosna": 83.0,
295
+ "2011_wiosna": 72.22222222222221,
296
+ "2012_jesień": 76.53061224489795,
297
+ "2011_jesień": 72.72727272727273,
298
+ "2009_jesień": 81.5,
299
+ "2022_wiosna": 77.27272727272727,
300
+ "2014_wiosna": 79.08163265306123,
301
+ "2022_jesien": 69.38775510204081,
302
+ "2014_jesien": 77.2020725388601,
303
+ "2024_wiosna": 70.55837563451777,
304
+ "2015_wiosna": 72.04301075268818,
305
+ "2023_wiosna": 72.72727272727273,
306
+ "2021_jesien": 72.22222222222221,
307
+ "2015_jesien": 75.78947368421053,
308
+ "2023_jesien": 69.74358974358974,
309
+ "2021_wiosna": 73.9795918367347,
310
+ "2013_wiosna": 76.28865979381443,
311
+ "2013_jesien": 74.3455497382199,
312
+ "overall_accuracy": 75.63239730796009
313
+ },
314
+ {
315
+ "model_name": "model-speakleash-Bielik-11B-v2.2-Instruct",
316
+ "2008_jesień": 45.45454545454545,
317
+ "2012_wiosna": 46.391752577319586,
318
+ "2010_jesień": 52.26130653266332,
319
+ "2009_wiosna": 51.515151515151516,
320
+ "2010_wiosna": 48.5,
321
+ "2011_wiosna": 41.91919191919192,
322
+ "2012_jesień": 57.6530612244898,
323
+ "2011_jesień": 45.95959595959596,
324
+ "2009_jesień": 49.5,
325
+ "2022_wiosna": 40.4040404040404,
326
+ "2014_wiosna": 34.69387755102041,
327
+ "2022_jesien": 43.36734693877551,
328
+ "2014_jesien": 44.04145077720207,
329
+ "2024_wiosna": 50.76142131979695,
330
+ "2015_wiosna": 43.54838709677419,
331
+ "2023_wiosna": 41.91919191919192,
332
+ "2021_jesien": 43.93939393939394,
333
+ "2015_jesien": 40.0,
334
+ "2023_jesien": 37.94871794871795,
335
+ "2021_wiosna": 50.0,
336
+ "2013_wiosna": 47.93814432989691,
337
+ "2013_jesien": 42.93193717277487,
338
+ "overall_accuracy": 45.50939893246693
339
+ },
340
+ {
341
+ "model_name": "model-meta-llama-Llama-3.2-3B-Instruct",
342
+ "2008_jesień": 36.36363636363637,
343
+ "2012_wiosna": 30.927835051546392,
344
+ "2010_jesień": 36.18090452261307,
345
+ "2009_wiosna": 34.34343434343434,
346
+ "2010_wiosna": 40.5,
347
+ "2011_wiosna": 32.82828282828283,
348
+ "2012_jesień": 40.816326530612244,
349
+ "2011_jesień": 29.292929292929294,
350
+ "2009_jesień": 43.0,
351
+ "2022_wiosna": 29.797979797979796,
352
+ "2014_wiosna": 28.061224489795915,
353
+ "2022_jesien": 36.224489795918366,
354
+ "2014_jesien": 29.533678756476682,
355
+ "2024_wiosna": 35.53299492385787,
356
+ "2015_wiosna": 36.55913978494624,
357
+ "2023_wiosna": 35.35353535353536,
358
+ "2021_jesien": 27.77777777777778,
359
+ "2015_jesien": 30.526315789473685,
360
+ "2023_jesien": 29.230769230769234,
361
+ "2021_wiosna": 31.122448979591837,
362
+ "2013_wiosna": 33.50515463917525,
363
+ "2013_jesien": 35.07853403141361,
364
+ "overall_accuracy": 33.766535158969596
365
+ },
366
+ {
367
+ "model_name": "model-Qwen-Qwen2.5-7B-Instruct",
368
+ "2008_jesień": 41.41414141414141,
369
+ "2012_wiosna": 40.20618556701031,
370
+ "2010_jesień": 43.21608040201005,
371
+ "2009_wiosna": 40.4040404040404,
372
+ "2010_wiosna": 41.5,
373
+ "2011_wiosna": 38.38383838383838,
374
+ "2012_jesień": 48.97959183673469,
375
+ "2011_jesień": 38.88888888888889,
376
+ "2009_jesień": 43.5,
377
+ "2022_wiosna": 43.93939393939394,
378
+ "2014_wiosna": 35.714285714285715,
379
+ "2022_jesien": 42.857142857142854,
380
+ "2014_jesien": 46.63212435233161,
381
+ "2024_wiosna": 45.68527918781726,
382
+ "2015_wiosna": 42.473118279569896,
383
+ "2023_wiosna": 44.94949494949495,
384
+ "2021_jesien": 43.43434343434344,
385
+ "2015_jesien": 40.0,
386
+ "2023_jesien": 46.15384615384615,
387
+ "2021_wiosna": 47.44897959183674,
388
+ "2013_wiosna": 44.84536082474227,
389
+ "2013_jesien": 43.97905759162304,
390
+ "overall_accuracy": 42.93339521930842
391
+ },
392
+ {
393
+ "model_name": "model-johnsnowlabs-JSL-MedLlama-3-8B-v2.0",
394
+ "2008_jesień": 29.292929292929294,
395
+ "2012_wiosna": 31.958762886597935,
396
+ "2010_jesień": 28.14070351758794,
397
+ "2009_wiosna": 31.313131313131315,
398
+ "2010_wiosna": 35.0,
399
+ "2011_wiosna": 23.737373737373737,
400
+ "2012_jesień": 38.265306122448976,
401
+ "2011_jesień": 25.757575757575758,
402
+ "2009_jesień": 35.0,
403
+ "2022_wiosna": 30.808080808080806,
404
+ "2014_wiosna": 31.122448979591837,
405
+ "2022_jesien": 34.69387755102041,
406
+ "2014_jesien": 34.196891191709845,
407
+ "2024_wiosna": 29.949238578680205,
408
+ "2015_wiosna": 31.182795698924732,
409
+ "2023_wiosna": 30.808080808080806,
410
+ "2021_jesien": 29.797979797979796,
411
+ "2015_jesien": 26.31578947368421,
412
+ "2023_jesien": 32.82051282051282,
413
+ "2021_wiosna": 33.6734693877551,
414
+ "2013_wiosna": 30.927835051546392,
415
+ "2013_jesien": 30.89005235602094,
416
+ "overall_accuracy": 31.16732420515201
417
+ },
418
+ {
419
+ "model_name": "model-BioMistral-BioMistral-7B",
420
+ "2008_jesień": 23.232323232323232,
421
+ "2012_wiosna": 21.1340206185567,
422
+ "2010_jesień": 23.115577889447238,
423
+ "2009_wiosna": 25.757575757575758,
424
+ "2010_wiosna": 23.0,
425
+ "2011_wiosna": 23.737373737373737,
426
+ "2012_jesień": 28.57142857142857,
427
+ "2011_jesień": 24.242424242424242,
428
+ "2009_jesień": 23.5,
429
+ "2022_wiosna": 20.2020202020202,
430
+ "2014_wiosna": 24.489795918367346,
431
+ "2022_jesien": 28.57142857142857,
432
+ "2014_jesien": 22.279792746113987,
433
+ "2024_wiosna": 25.888324873096447,
434
+ "2015_wiosna": 24.731182795698924,
435
+ "2023_wiosna": 24.747474747474747,
436
+ "2021_jesien": 26.767676767676768,
437
+ "2015_jesien": 28.421052631578945,
438
+ "2023_jesien": 25.64102564102564,
439
+ "2021_wiosna": 19.387755102040817,
440
+ "2013_wiosna": 23.711340206185564,
441
+ "2013_jesien": 29.84293193717277,
442
+ "overall_accuracy": 24.576467857971686
443
+ }
444
+ ]
leaderboards/lek_accs.json ADDED
@@ -0,0 +1,444 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "model_name": "model-meta-llama-Meta-Llama-3.1-8B-Instruct",
4
+ "2011_wiosna": 53.03030303030303,
5
+ "2010_wiosna": 54.0,
6
+ "2008_jesień": 51.26903553299492,
7
+ "2011_jesień": 56.56565656565656,
8
+ "2009_jesień": 47.20812182741117,
9
+ "2010_jesień": 43.43434343434344,
10
+ "2012_wiosna": 53.0,
11
+ "2009_wiosna": 45.22613065326633,
12
+ "2012_jesień": 52.55102040816326,
13
+ "2022_wiosna": 45.91836734693878,
14
+ "2014_wiosna": 52.307692307692314,
15
+ "2022_jesien": 53.06122448979592,
16
+ "2014_jesien": 53.125,
17
+ "2024_wiosna": 57.868020304568525,
18
+ "2015_wiosna": 54.54545454545454,
19
+ "2023_wiosna": 51.03092783505154,
20
+ "2021_jesien": 52.0618556701031,
21
+ "2015_jesien": 44.73684210526316,
22
+ "2023_jesien": 48.45360824742268,
23
+ "2021_wiosna": 47.0,
24
+ "2013_wiosna": 54.166666666666664,
25
+ "2013_jesien": 51.832460732984295,
26
+ "overall_accuracy": 51.02040816326531
27
+ },
28
+ {
29
+ "model_name": "model-meta-llama-Meta-Llama-3.1-70B-Instruct",
30
+ "2011_wiosna": 77.27272727272727,
31
+ "2010_wiosna": 82.0,
32
+ "2008_jesień": 79.69543147208121,
33
+ "2011_jesień": 83.33333333333334,
34
+ "2009_jesień": 81.21827411167513,
35
+ "2010_jesień": 80.8080808080808,
36
+ "2012_wiosna": 80.0,
37
+ "2009_wiosna": 72.8643216080402,
38
+ "2012_jesień": 81.12244897959184,
39
+ "2022_wiosna": 79.59183673469387,
40
+ "2014_wiosna": 76.41025641025641,
41
+ "2022_jesien": 82.14285714285714,
42
+ "2014_jesien": 87.5,
43
+ "2024_wiosna": 86.29441624365482,
44
+ "2015_wiosna": 77.77777777777779,
45
+ "2023_wiosna": 78.8659793814433,
46
+ "2021_jesien": 81.44329896907216,
47
+ "2015_jesien": 78.42105263157895,
48
+ "2023_jesien": 83.50515463917526,
49
+ "2021_wiosna": 84.5,
50
+ "2013_wiosna": 77.60416666666666,
51
+ "2013_jesien": 78.01047120418848,
52
+ "overall_accuracy": 80.47309833024119
53
+ },
54
+ {
55
+ "model_name": "model-Qwen-Qwen2.5-72B-Instruct",
56
+ "2011_wiosna": 75.25252525252525,
57
+ "2010_wiosna": 76.0,
58
+ "2008_jesień": 80.71065989847716,
59
+ "2011_jesień": 73.73737373737373,
60
+ "2009_jesień": 71.06598984771574,
61
+ "2010_jesień": 74.74747474747475,
62
+ "2012_wiosna": 79.0,
63
+ "2009_wiosna": 74.87437185929649,
64
+ "2012_jesień": 76.0204081632653,
65
+ "2022_wiosna": 72.95918367346938,
66
+ "2014_wiosna": 77.43589743589745,
67
+ "2022_jesien": 77.04081632653062,
68
+ "2014_jesien": 84.375,
69
+ "2024_wiosna": 81.21827411167513,
70
+ "2015_wiosna": 75.25252525252525,
71
+ "2023_wiosna": 77.83505154639175,
72
+ "2021_jesien": 73.19587628865979,
73
+ "2015_jesien": 73.15789473684211,
74
+ "2023_jesien": 76.28865979381443,
75
+ "2021_wiosna": 78.5,
76
+ "2013_wiosna": 72.91666666666666,
77
+ "2013_jesien": 79.05759162303664,
78
+ "overall_accuracy": 76.39146567717997
79
+ },
80
+ {
81
+ "model_name": "model-gpt-4o-mini-2024-07-18",
82
+ "2011_wiosna": 75.75757575757575,
83
+ "2010_wiosna": 74.5,
84
+ "2008_jesień": 77.15736040609137,
85
+ "2011_jesień": 72.72727272727273,
86
+ "2009_jesień": 71.06598984771574,
87
+ "2010_jesień": 75.75757575757575,
88
+ "2012_wiosna": 75.0,
89
+ "2009_wiosna": 72.8643216080402,
90
+ "2012_jesień": 78.57142857142857,
91
+ "2022_wiosna": 70.40816326530613,
92
+ "2014_wiosna": 72.82051282051282,
93
+ "2022_jesien": 76.53061224489795,
94
+ "2014_jesien": 76.5625,
95
+ "2024_wiosna": 82.23350253807106,
96
+ "2015_wiosna": 73.23232323232324,
97
+ "2023_wiosna": 75.25773195876289,
98
+ "2021_jesien": 72.16494845360825,
99
+ "2015_jesien": 75.78947368421053,
100
+ "2023_jesien": 78.35051546391753,
101
+ "2021_wiosna": 80.5,
102
+ "2013_wiosna": 74.47916666666666,
103
+ "2013_jesien": 78.01047120418848,
104
+ "overall_accuracy": 75.44063079777365
105
+ },
106
+ {
107
+ "model_name": "model-aaditya-Llama3-OpenBioLLM-70B",
108
+ "2011_wiosna": 23.232323232323232,
109
+ "2010_wiosna": 18.0,
110
+ "2008_jesień": 36.04060913705584,
111
+ "2011_jesień": 58.58585858585859,
112
+ "2009_jesień": 54.314720812182735,
113
+ "2010_jesień": 54.04040404040404,
114
+ "2012_wiosna": 61.0,
115
+ "2009_wiosna": 54.2713567839196,
116
+ "2012_jesień": 58.16326530612245,
117
+ "2022_wiosna": 60.204081632653065,
118
+ "2014_wiosna": 57.43589743589743,
119
+ "2022_jesien": 57.6530612244898,
120
+ "2014_jesien": 63.541666666666664,
121
+ "2024_wiosna": 68.02030456852792,
122
+ "2015_wiosna": 62.121212121212125,
123
+ "2023_wiosna": 62.371134020618555,
124
+ "2021_jesien": 61.34020618556701,
125
+ "2015_jesien": 57.89473684210527,
126
+ "2023_jesien": 62.371134020618555,
127
+ "2021_wiosna": 65.0,
128
+ "2013_wiosna": 57.8125,
129
+ "2013_jesien": 61.25654450261781,
130
+ "overall_accuracy": 55.14842300556586
131
+ },
132
+ {
133
+ "model_name": "model-mistralai-Mistral-Large-Instruct-2407",
134
+ "2011_wiosna": 76.26262626262627,
135
+ "2010_wiosna": 76.5,
136
+ "2008_jesień": 76.6497461928934,
137
+ "2011_jesień": 79.29292929292929,
138
+ "2009_jesień": 71.57360406091371,
139
+ "2010_jesień": 74.24242424242425,
140
+ "2012_wiosna": 77.5,
141
+ "2009_wiosna": 72.8643216080402,
142
+ "2012_jesień": 76.53061224489795,
143
+ "2022_wiosna": 72.95918367346938,
144
+ "2014_wiosna": 80.0,
145
+ "2022_jesien": 75.0,
146
+ "2014_jesien": 76.5625,
147
+ "2024_wiosna": 86.80203045685279,
148
+ "2015_wiosna": 75.25252525252525,
149
+ "2023_wiosna": 79.38144329896907,
150
+ "2021_jesien": 76.28865979381443,
151
+ "2015_jesien": 71.05263157894737,
152
+ "2023_jesien": 76.80412371134021,
153
+ "2021_wiosna": 79.5,
154
+ "2013_wiosna": 71.875,
155
+ "2013_jesien": 75.91623036649214,
156
+ "overall_accuracy": 76.32189239332097
157
+ },
158
+ {
159
+ "model_name": "model-OpenMeditron-Meditron3-8B",
160
+ "2011_wiosna": 43.93939393939394,
161
+ "2010_wiosna": 48.0,
162
+ "2008_jesień": 46.192893401015226,
163
+ "2011_jesień": 47.474747474747474,
164
+ "2009_jesień": 46.7005076142132,
165
+ "2010_jesień": 40.4040404040404,
166
+ "2012_wiosna": 43.5,
167
+ "2009_wiosna": 43.21608040201005,
168
+ "2012_jesień": 45.40816326530612,
169
+ "2022_wiosna": 41.83673469387755,
170
+ "2014_wiosna": 42.05128205128205,
171
+ "2022_jesien": 43.36734693877551,
172
+ "2014_jesien": 52.604166666666664,
173
+ "2024_wiosna": 51.26903553299492,
174
+ "2015_wiosna": 44.94949494949495,
175
+ "2023_wiosna": 47.93814432989691,
176
+ "2021_jesien": 44.329896907216494,
177
+ "2015_jesien": 42.63157894736842,
178
+ "2023_jesien": 42.2680412371134,
179
+ "2021_wiosna": 44.0,
180
+ "2013_wiosna": 48.95833333333333,
181
+ "2013_jesien": 51.832460732984295,
182
+ "overall_accuracy": 45.570500927643785
183
+ },
184
+ {
185
+ "model_name": "model-meta-llama-Llama-3.2-1B-Instruct",
186
+ "2011_wiosna": 18.181818181818183,
187
+ "2010_wiosna": 25.5,
188
+ "2008_jesień": 20.304568527918782,
189
+ "2011_jesień": 30.303030303030305,
190
+ "2009_jesień": 25.380710659898476,
191
+ "2010_jesień": 23.737373737373737,
192
+ "2012_wiosna": 29.5,
193
+ "2009_wiosna": 29.145728643216078,
194
+ "2012_jesień": 26.53061224489796,
195
+ "2022_wiosna": 20.918367346938776,
196
+ "2014_wiosna": 25.64102564102564,
197
+ "2022_jesien": 23.46938775510204,
198
+ "2014_jesien": 26.041666666666668,
199
+ "2024_wiosna": 25.380710659898476,
200
+ "2015_wiosna": 26.767676767676768,
201
+ "2023_wiosna": 22.68041237113402,
202
+ "2021_jesien": 23.195876288659793,
203
+ "2015_jesien": 23.684210526315788,
204
+ "2023_jesien": 27.835051546391753,
205
+ "2021_wiosna": 26.5,
206
+ "2013_wiosna": 21.875,
207
+ "2013_jesien": 23.036649214659686,
208
+ "overall_accuracy": 24.81447124304267
209
+ },
210
+ {
211
+ "model_name": "model-OpenMeditron-Meditron3-70B",
212
+ "2011_wiosna": 64.14141414141415,
213
+ "2010_wiosna": 73.5,
214
+ "2008_jesień": 62.43654822335025,
215
+ "2011_jesień": 69.1919191919192,
216
+ "2009_jesień": 58.88324873096447,
217
+ "2010_jesień": 61.111111111111114,
218
+ "2012_wiosna": 68.5,
219
+ "2009_wiosna": 59.2964824120603,
220
+ "2012_jesień": 66.83673469387756,
221
+ "2022_wiosna": 70.91836734693877,
222
+ "2014_wiosna": 70.25641025641025,
223
+ "2022_jesien": 63.775510204081634,
224
+ "2014_jesien": 69.27083333333334,
225
+ "2024_wiosna": 77.66497461928934,
226
+ "2015_wiosna": 67.67676767676768,
227
+ "2023_wiosna": 67.0103092783505,
228
+ "2021_jesien": 64.43298969072166,
229
+ "2015_jesien": 66.3157894736842,
230
+ "2023_jesien": 68.55670103092784,
231
+ "2021_wiosna": 70.5,
232
+ "2013_wiosna": 65.625,
233
+ "2013_jesien": 66.49214659685863,
234
+ "overall_accuracy": 66.92949907235621
235
+ },
236
+ {
237
+ "model_name": "model-mistralai-Mistral-Small-Instruct-2409",
238
+ "2011_wiosna": 46.464646464646464,
239
+ "2010_wiosna": 54.0,
240
+ "2008_jesień": 51.26903553299492,
241
+ "2011_jesień": 52.02020202020202,
242
+ "2009_jesień": 45.68527918781726,
243
+ "2010_jesień": 50.0,
244
+ "2012_wiosna": 56.49999999999999,
245
+ "2009_wiosna": 52.26130653266332,
246
+ "2012_jesień": 49.48979591836735,
247
+ "2022_wiosna": 48.97959183673469,
248
+ "2014_wiosna": 48.205128205128204,
249
+ "2022_jesien": 52.04081632653062,
250
+ "2014_jesien": 48.95833333333333,
251
+ "2024_wiosna": 58.37563451776649,
252
+ "2015_wiosna": 52.02020202020202,
253
+ "2023_wiosna": 53.09278350515464,
254
+ "2021_jesien": 53.608247422680414,
255
+ "2015_jesien": 47.89473684210526,
256
+ "2023_jesien": 52.0618556701031,
257
+ "2021_wiosna": 55.00000000000001,
258
+ "2013_wiosna": 49.47916666666667,
259
+ "2013_jesien": 52.35602094240838,
260
+ "overall_accuracy": 51.36827458256029
261
+ },
262
+ {
263
+ "model_name": "model-ProbeMedicalYonseiMAILab-medllama3-v20",
264
+ "2011_wiosna": 39.8989898989899,
265
+ "2010_wiosna": 46.0,
266
+ "2008_jesień": 38.07106598984771,
267
+ "2011_jesień": 40.4040404040404,
268
+ "2009_jesień": 36.04060913705584,
269
+ "2010_jesień": 38.38383838383838,
270
+ "2012_wiosna": 40.5,
271
+ "2009_wiosna": 35.678391959798994,
272
+ "2012_jesień": 46.42857142857143,
273
+ "2022_wiosna": 39.285714285714285,
274
+ "2014_wiosna": 37.94871794871795,
275
+ "2022_jesien": 41.83673469387755,
276
+ "2014_jesien": 43.75,
277
+ "2024_wiosna": 44.67005076142132,
278
+ "2015_wiosna": 38.38383838383838,
279
+ "2023_wiosna": 41.23711340206185,
280
+ "2021_jesien": 45.36082474226804,
281
+ "2015_jesien": 32.631578947368425,
282
+ "2023_jesien": 44.84536082474227,
283
+ "2021_wiosna": 40.5,
284
+ "2013_wiosna": 41.14583333333333,
285
+ "2013_jesien": 40.31413612565445,
286
+ "overall_accuracy": 40.60760667903525
287
+ },
288
+ {
289
+ "model_name": "model-gpt-4o-2024-08-06",
290
+ "2011_wiosna": 87.37373737373737,
291
+ "2010_wiosna": 88.5,
292
+ "2008_jesień": 88.3248730964467,
293
+ "2011_jesień": 90.40404040404042,
294
+ "2009_jesień": 87.81725888324873,
295
+ "2010_jesień": 89.39393939393939,
296
+ "2012_wiosna": 90.0,
297
+ "2009_wiosna": 86.93467336683418,
298
+ "2012_jesień": 88.77551020408163,
299
+ "2022_wiosna": 89.28571428571429,
300
+ "2014_wiosna": 88.71794871794872,
301
+ "2022_jesien": 91.3265306122449,
302
+ "2014_jesien": 91.66666666666666,
303
+ "2024_wiosna": 93.4010152284264,
304
+ "2015_wiosna": 89.8989898989899,
305
+ "2023_wiosna": 90.72164948453609,
306
+ "2021_jesien": 86.5979381443299,
307
+ "2015_jesien": 87.89473684210526,
308
+ "2023_jesien": 91.23711340206185,
309
+ "2021_wiosna": 91.0,
310
+ "2013_wiosna": 89.0625,
311
+ "2013_jesien": 88.48167539267016,
312
+ "overall_accuracy": 89.40166975881262
313
+ },
314
+ {
315
+ "model_name": "model-speakleash-Bielik-11B-v2.2-Instruct",
316
+ "2011_wiosna": 59.59595959595959,
317
+ "2010_wiosna": 62.0,
318
+ "2008_jesień": 59.89847715736041,
319
+ "2011_jesień": 60.1010101010101,
320
+ "2009_jesień": 58.37563451776649,
321
+ "2010_jesień": 63.13131313131313,
322
+ "2012_wiosna": 61.0,
323
+ "2009_wiosna": 63.31658291457286,
324
+ "2012_jesień": 63.26530612244898,
325
+ "2022_wiosna": 58.16326530612245,
326
+ "2014_wiosna": 57.948717948717956,
327
+ "2022_jesien": 67.85714285714286,
328
+ "2014_jesien": 63.541666666666664,
329
+ "2024_wiosna": 65.48223350253807,
330
+ "2015_wiosna": 59.59595959595959,
331
+ "2023_wiosna": 63.4020618556701,
332
+ "2021_jesien": 62.371134020618555,
333
+ "2015_jesien": 61.578947368421055,
334
+ "2023_jesien": 62.88659793814433,
335
+ "2021_wiosna": 64.5,
336
+ "2013_wiosna": 61.458333333333336,
337
+ "2013_jesien": 61.78010471204188,
338
+ "overall_accuracy": 61.87384044526901
339
+ },
340
+ {
341
+ "model_name": "model-meta-llama-Llama-3.2-3B-Instruct",
342
+ "2011_wiosna": 36.868686868686865,
343
+ "2010_wiosna": 38.0,
344
+ "2008_jesień": 38.578680203045685,
345
+ "2011_jesień": 47.97979797979798,
346
+ "2009_jesień": 38.578680203045685,
347
+ "2010_jesień": 38.38383838383838,
348
+ "2012_wiosna": 36.0,
349
+ "2009_wiosna": 40.20100502512563,
350
+ "2012_jesień": 40.30612244897959,
351
+ "2022_wiosna": 38.265306122448976,
352
+ "2014_wiosna": 37.94871794871795,
353
+ "2022_jesien": 38.775510204081634,
354
+ "2014_jesien": 36.97916666666667,
355
+ "2024_wiosna": 42.63959390862944,
356
+ "2015_wiosna": 40.4040404040404,
357
+ "2023_wiosna": 37.628865979381445,
358
+ "2021_jesien": 42.2680412371134,
359
+ "2015_jesien": 34.73684210526316,
360
+ "2023_jesien": 42.78350515463917,
361
+ "2021_wiosna": 39.0,
362
+ "2013_wiosna": 34.375,
363
+ "2013_jesien": 43.97905759162304,
364
+ "overall_accuracy": 39.308905380333954
365
+ },
366
+ {
367
+ "model_name": "model-Qwen-Qwen2.5-7B-Instruct",
368
+ "2011_wiosna": 50.0,
369
+ "2010_wiosna": 52.5,
370
+ "2008_jesień": 54.314720812182735,
371
+ "2011_jesień": 59.59595959595959,
372
+ "2009_jesień": 45.68527918781726,
373
+ "2010_jesień": 48.484848484848484,
374
+ "2012_wiosna": 45.0,
375
+ "2009_wiosna": 51.75879396984925,
376
+ "2012_jesień": 48.97959183673469,
377
+ "2022_wiosna": 50.0,
378
+ "2014_wiosna": 48.717948717948715,
379
+ "2022_jesien": 52.55102040816326,
380
+ "2014_jesien": 53.645833333333336,
381
+ "2024_wiosna": 55.32994923857868,
382
+ "2015_wiosna": 47.474747474747474,
383
+ "2023_wiosna": 51.546391752577314,
384
+ "2021_jesien": 58.24742268041238,
385
+ "2015_jesien": 50.0,
386
+ "2023_jesien": 50.0,
387
+ "2021_wiosna": 50.5,
388
+ "2013_wiosna": 56.770833333333336,
389
+ "2013_jesien": 50.26178010471204,
390
+ "overall_accuracy": 51.41465677179963
391
+ },
392
+ {
393
+ "model_name": "model-johnsnowlabs-JSL-MedLlama-3-8B-v2.0",
394
+ "2011_wiosna": 37.37373737373738,
395
+ "2010_wiosna": 38.5,
396
+ "2008_jesień": 38.07106598984771,
397
+ "2011_jesień": 42.92929292929293,
398
+ "2009_jesień": 31.979695431472084,
399
+ "2010_jesień": 34.84848484848485,
400
+ "2012_wiosna": 37.0,
401
+ "2009_wiosna": 34.17085427135678,
402
+ "2012_jesień": 39.285714285714285,
403
+ "2022_wiosna": 34.183673469387756,
404
+ "2014_wiosna": 36.92307692307693,
405
+ "2022_jesien": 41.83673469387755,
406
+ "2014_jesien": 35.9375,
407
+ "2024_wiosna": 37.055837563451774,
408
+ "2015_wiosna": 33.83838383838384,
409
+ "2023_wiosna": 32.98969072164948,
410
+ "2021_jesien": 36.597938144329895,
411
+ "2015_jesien": 33.1578947368421,
412
+ "2023_jesien": 38.659793814432994,
413
+ "2021_wiosna": 33.5,
414
+ "2013_wiosna": 32.8125,
415
+ "2013_jesien": 40.31413612565445,
416
+ "overall_accuracy": 36.45640074211503
417
+ },
418
+ {
419
+ "model_name": "model-BioMistral-BioMistral-7B",
420
+ "2011_wiosna": 22.727272727272727,
421
+ "2010_wiosna": 25.5,
422
+ "2008_jesień": 20.812182741116754,
423
+ "2011_jesień": 27.77777777777778,
424
+ "2009_jesień": 24.36548223350254,
425
+ "2010_jesień": 27.27272727272727,
426
+ "2012_wiosna": 27.500000000000004,
427
+ "2009_wiosna": 28.643216080402013,
428
+ "2012_jesień": 22.95918367346939,
429
+ "2022_wiosna": 22.95918367346939,
430
+ "2014_wiosna": 26.666666666666668,
431
+ "2022_jesien": 24.489795918367346,
432
+ "2014_jesien": 25.520833333333332,
433
+ "2024_wiosna": 28.426395939086298,
434
+ "2015_wiosna": 27.77777777777778,
435
+ "2023_wiosna": 26.288659793814436,
436
+ "2021_jesien": 26.288659793814436,
437
+ "2015_jesien": 30.0,
438
+ "2023_jesien": 24.742268041237114,
439
+ "2021_wiosna": 28.000000000000004,
440
+ "2013_wiosna": 27.604166666666668,
441
+ "2013_jesien": 22.5130890052356,
442
+ "overall_accuracy": 25.858070500927642
443
+ }
444
+ ]
leaderboards/pes_accs.json ADDED
@@ -0,0 +1,1277 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "model_name": "model-meta-llama-Meta-Llama-3.1-70B-Instruct",
4
+ "neurologia": 73.94957983193278,
5
+ "medycyna pracy": 47.45762711864407,
6
+ "medycyna rodzinna": 61.66666666666667,
7
+ "patomorfologia": 81.66666666666667,
8
+ "radiologia i diagnostyka obrazowa": 75.83333333333333,
9
+ "medycyna sportowa": 74.16666666666667,
10
+ "neonatologia": 68.0672268907563,
11
+ "ortopedia": 61.73913043478261,
12
+ "medycyna paliatywna": 70.0,
13
+ "chirurgia stomatologiczna": 56.30252100840336,
14
+ "dermatologia i wenerologia": 60.0,
15
+ "diabetologia": 51.66666666666667,
16
+ "hematologia": 64.16666666666667,
17
+ "onkologia kliniczna": 60.50420168067227,
18
+ "protetyka stomatologiczna": 52.5,
19
+ "neurochirurgia": 47.05882352941176,
20
+ "alergologia": 61.66666666666667,
21
+ "geriatria": 69.16666666666667,
22
+ "ginekologia onkologiczna": 50.42016806722689,
23
+ "otolaryngologia": 54.700854700854705,
24
+ "ortodoncja": 40.67796610169492,
25
+ "anestezjologia": 65.54621848739495,
26
+ "endokrynologia": 57.49999999999999,
27
+ "periodontologia": 46.21848739495798,
28
+ "psychiatria": 61.66666666666667,
29
+ "rehabilitacja medyczna": 71.66666666666667,
30
+ "perinatologia": 56.666666666666664,
31
+ "balneologia i medycyna fizykalna": 55.00000000000001,
32
+ "pediatria": 70.58823529411765,
33
+ "nefrologia": 56.666666666666664,
34
+ "choroby płuc": 74.57627118644068,
35
+ "okulistyka": 60.16949152542372,
36
+ "kardiochirurgia": 62.5,
37
+ "chirurgia naczyniowa": 63.33333333333333,
38
+ "reumatologia": 64.16666666666667,
39
+ "chirurgia onkologiczna": 50.0,
40
+ "transplantologia kliniczna": 47.008547008547005,
41
+ "radioterapia onkologiczna": 55.00000000000001,
42
+ "kardiologia": 54.700854700854705,
43
+ "angiologia": 63.33333333333333,
44
+ "gastroenterologia": 61.016949152542374,
45
+ "hipertensjologia": 68.0672268907563,
46
+ "stomatologia zachowawcza": 47.05882352941176,
47
+ "choroby płuc dzieci": 62.5,
48
+ "medycyna ratunkowa": 71.29629629629629,
49
+ "nefrologia dziecięca": 73.10924369747899,
50
+ "endokrynologia ginekologiczna i rozrodczość": 63.24786324786324,
51
+ "anestezjologia i intensywna terapia": 61.53846153846154,
52
+ "stomatologia dziecięca": 43.69747899159664,
53
+ "ortopedia i traumatologia narządu ruchu": 56.52173913043478,
54
+ "położnictwo i ginekologia": 62.93103448275862,
55
+ "neurologia dziecięca": 73.10924369747899,
56
+ "choroby zakaźne": 55.00000000000001,
57
+ "gastroenterologia dziecięca": 66.66666666666666,
58
+ "stomatologia zachowawcza z endodoncją": 42.016806722689076,
59
+ "endokrynologia i diabetologia dziecięca": 60.16949152542372,
60
+ "otorynolaryngologia": 56.41025641025641,
61
+ "psychiatria dzieci i młodzieży": 76.27118644067797,
62
+ "chirurgia ogólna": 66.66666666666666,
63
+ "choroby wewnętrzne": 78.33333333333333,
64
+ "diagnostyka laboratoryjna": 77.96610169491525,
65
+ "chirurgia dziecięca": 61.86440677966102,
66
+ "urologia dziecięca": 54.86725663716814,
67
+ "zdrowie publiczne": 75.63025210084034,
68
+ "genetyka kliniczna": 65.2542372881356,
69
+ "medycyna nuklearna": 75.21367521367522,
70
+ "kardiologia dziecięca": 58.77192982456141,
71
+ "chirurgia plastyczna": 64.16666666666667,
72
+ "chirurgia klatki piersiowej": 65.83333333333333,
73
+ "audiologia i foniatria": 60.526315789473685,
74
+ "intensywna terapia": 74.16666666666667,
75
+ "overall_accuracy": 61.974340698503205
76
+ },
77
+ {
78
+ "model_name": "model-meta-llama-Meta-Llama-3.1-8B-Instruct",
79
+ "neurologia": 51.26050420168067,
80
+ "medycyna pracy": 38.983050847457626,
81
+ "medycyna rodzinna": 34.166666666666664,
82
+ "patomorfologia": 46.666666666666664,
83
+ "radiologia i diagnostyka obrazowa": 41.66666666666667,
84
+ "medycyna sportowa": 45.0,
85
+ "neonatologia": 45.378151260504204,
86
+ "ortopedia": 40.0,
87
+ "medycyna paliatywna": 55.00000000000001,
88
+ "chirurgia stomatologiczna": 31.092436974789916,
89
+ "dermatologia i wenerologia": 34.166666666666664,
90
+ "diabetologia": 40.833333333333336,
91
+ "hematologia": 40.833333333333336,
92
+ "onkologia kliniczna": 36.134453781512605,
93
+ "protetyka stomatologiczna": 40.0,
94
+ "neurochirurgia": 26.05042016806723,
95
+ "alergologia": 35.833333333333336,
96
+ "geriatria": 44.166666666666664,
97
+ "ginekologia onkologiczna": 42.016806722689076,
98
+ "otolaryngologia": 27.350427350427353,
99
+ "ortodoncja": 24.576271186440678,
100
+ "anestezjologia": 50.42016806722689,
101
+ "endokrynologia": 31.666666666666664,
102
+ "periodontologia": 38.655462184873954,
103
+ "psychiatria": 32.5,
104
+ "rehabilitacja medyczna": 46.666666666666664,
105
+ "perinatologia": 36.666666666666664,
106
+ "balneologia i medycyna fizykalna": 40.0,
107
+ "pediatria": 39.49579831932773,
108
+ "nefrologia": 36.666666666666664,
109
+ "choroby płuc": 50.847457627118644,
110
+ "okulistyka": 44.06779661016949,
111
+ "kardiochirurgia": 42.5,
112
+ "chirurgia naczyniowa": 36.666666666666664,
113
+ "reumatologia": 40.0,
114
+ "chirurgia onkologiczna": 36.666666666666664,
115
+ "transplantologia kliniczna": 34.18803418803419,
116
+ "radioterapia onkologiczna": 35.0,
117
+ "kardiologia": 38.46153846153847,
118
+ "angiologia": 39.166666666666664,
119
+ "gastroenterologia": 38.13559322033898,
120
+ "hipertensjologia": 46.21848739495798,
121
+ "stomatologia zachowawcza": 37.81512605042017,
122
+ "choroby płuc dzieci": 38.333333333333336,
123
+ "medycyna ratunkowa": 49.074074074074076,
124
+ "nefrologia dziecięca": 45.378151260504204,
125
+ "endokrynologia ginekologiczna i rozrodczość": 42.73504273504273,
126
+ "anestezjologia i intensywna terapia": 35.04273504273504,
127
+ "stomatologia dziecięca": 31.932773109243694,
128
+ "ortopedia i traumatologia narządu ruchu": 37.391304347826086,
129
+ "położnictwo i ginekologia": 39.6551724137931,
130
+ "neurologia dziecięca": 41.17647058823529,
131
+ "choroby zakaźne": 30.833333333333336,
132
+ "gastroenterologia dziecięca": 39.166666666666664,
133
+ "stomatologia zachowawcza z endodoncją": 26.89075630252101,
134
+ "endokrynologia i diabetologia dziecięca": 41.52542372881356,
135
+ "otorynolaryngologia": 36.75213675213676,
136
+ "psychiatria dzieci i młodzieży": 52.54237288135594,
137
+ "chirurgia ogólna": 41.66666666666667,
138
+ "choroby wewnętrzne": 43.333333333333336,
139
+ "diagnostyka laboratoryjna": 48.30508474576271,
140
+ "chirurgia dziecięca": 33.05084745762712,
141
+ "urologia dziecięca": 36.283185840707965,
142
+ "zdrowie publiczne": 60.50420168067227,
143
+ "genetyka kliniczna": 46.61016949152542,
144
+ "medycyna nuklearna": 43.58974358974359,
145
+ "kardiologia dziecięca": 40.35087719298245,
146
+ "chirurgia plastyczna": 43.333333333333336,
147
+ "chirurgia klatki piersiowej": 36.666666666666664,
148
+ "audiologia i foniatria": 47.368421052631575,
149
+ "intensywna terapia": 44.166666666666664,
150
+ "overall_accuracy": 40.092658588738416
151
+ },
152
+ {
153
+ "model_name": "model-Qwen-Qwen2.5-72B-Instruct",
154
+ "neurologia": 67.22689075630252,
155
+ "medycyna pracy": 48.30508474576271,
156
+ "medycyna rodzinna": 59.166666666666664,
157
+ "patomorfologia": 67.5,
158
+ "radiologia i diagnostyka obrazowa": 70.83333333333334,
159
+ "medycyna sportowa": 70.0,
160
+ "neonatologia": 56.30252100840336,
161
+ "ortopedia": 58.26086956521739,
162
+ "medycyna paliatywna": 68.33333333333333,
163
+ "chirurgia stomatologiczna": 50.42016806722689,
164
+ "dermatologia i wenerologia": 53.333333333333336,
165
+ "diabetologia": 50.0,
166
+ "hematologia": 55.833333333333336,
167
+ "onkologia kliniczna": 54.621848739495796,
168
+ "protetyka stomatologiczna": 54.166666666666664,
169
+ "neurochirurgia": 50.42016806722689,
170
+ "alergologia": 59.166666666666664,
171
+ "geriatria": 66.66666666666666,
172
+ "ginekologia onkologiczna": 53.78151260504202,
173
+ "otolaryngologia": 48.717948717948715,
174
+ "ortodoncja": 48.30508474576271,
175
+ "anestezjologia": 62.18487394957983,
176
+ "endokrynologia": 47.5,
177
+ "periodontologia": 51.26050420168067,
178
+ "psychiatria": 54.166666666666664,
179
+ "rehabilitacja medyczna": 61.66666666666667,
180
+ "perinatologia": 58.333333333333336,
181
+ "balneologia i medycyna fizykalna": 54.166666666666664,
182
+ "pediatria": 70.58823529411765,
183
+ "nefrologia": 54.166666666666664,
184
+ "choroby płuc": 81.35593220338984,
185
+ "okulistyka": 54.23728813559322,
186
+ "kardiochirurgia": 55.833333333333336,
187
+ "chirurgia naczyniowa": 67.5,
188
+ "reumatologia": 49.166666666666664,
189
+ "chirurgia onkologiczna": 61.66666666666667,
190
+ "transplantologia kliniczna": 47.008547008547005,
191
+ "radioterapia onkologiczna": 55.00000000000001,
192
+ "kardiologia": 58.97435897435898,
193
+ "angiologia": 61.66666666666667,
194
+ "gastroenterologia": 55.08474576271186,
195
+ "hipertensjologia": 62.18487394957983,
196
+ "stomatologia zachowawcza": 45.378151260504204,
197
+ "choroby płuc dzieci": 58.333333333333336,
198
+ "medycyna ratunkowa": 69.44444444444444,
199
+ "nefrologia dziecięca": 68.0672268907563,
200
+ "endokrynologia ginekologiczna i rozrodczość": 58.97435897435898,
201
+ "anestezjologia i intensywna terapia": 63.24786324786324,
202
+ "stomatologia dziecięca": 48.739495798319325,
203
+ "ortopedia i traumatologia narządu ruchu": 55.65217391304348,
204
+ "położnictwo i ginekologia": 62.93103448275862,
205
+ "neurologia dziecięca": 66.38655462184873,
206
+ "choroby zakaźne": 64.16666666666667,
207
+ "gastroenterologia dziecięca": 60.0,
208
+ "stomatologia zachowawcza z endodoncją": 40.33613445378151,
209
+ "endokrynologia i diabetologia dziecięca": 60.16949152542372,
210
+ "otorynolaryngologia": 57.26495726495726,
211
+ "psychiatria dzieci i młodzieży": 68.64406779661016,
212
+ "chirurgia ogólna": 63.33333333333333,
213
+ "choroby wewnętrzne": 66.66666666666666,
214
+ "diagnostyka laboratoryjna": 79.66101694915254,
215
+ "chirurgia dziecięca": 49.152542372881356,
216
+ "urologia dziecięca": 56.63716814159292,
217
+ "zdrowie publiczne": 76.47058823529412,
218
+ "genetyka kliniczna": 62.71186440677966,
219
+ "medycyna nuklearna": 64.1025641025641,
220
+ "kardiologia dziecięca": 60.526315789473685,
221
+ "chirurgia plastyczna": 60.83333333333333,
222
+ "chirurgia klatki piersiowej": 59.166666666666664,
223
+ "audiologia i foniatria": 59.64912280701754,
224
+ "intensywna terapia": 78.33333333333333,
225
+ "overall_accuracy": 59.43216916132098
226
+ },
227
+ {
228
+ "model_name": "model-gpt-4o-mini-2024-07-18",
229
+ "neurologia": 66.38655462184873,
230
+ "medycyna pracy": 47.45762711864407,
231
+ "medycyna rodzinna": 54.166666666666664,
232
+ "patomorfologia": 69.16666666666667,
233
+ "radiologia i diagnostyka obrazowa": 68.33333333333333,
234
+ "medycyna sportowa": 61.66666666666667,
235
+ "neonatologia": 59.66386554621849,
236
+ "ortopedia": 51.30434782608696,
237
+ "medycyna paliatywna": 64.16666666666667,
238
+ "chirurgia stomatologiczna": 52.10084033613446,
239
+ "dermatologia i wenerologia": 46.666666666666664,
240
+ "diabetologia": 50.0,
241
+ "hematologia": 49.166666666666664,
242
+ "onkologia kliniczna": 50.42016806722689,
243
+ "protetyka stomatologiczna": 49.166666666666664,
244
+ "neurochirurgia": 43.69747899159664,
245
+ "alergologia": 55.833333333333336,
246
+ "geriatria": 60.83333333333333,
247
+ "ginekologia onkologiczna": 49.57983193277311,
248
+ "otolaryngologia": 55.55555555555556,
249
+ "ortodoncja": 33.89830508474576,
250
+ "anestezjologia": 64.70588235294117,
251
+ "endokrynologia": 50.0,
252
+ "periodontologia": 42.857142857142854,
253
+ "psychiatria": 51.66666666666667,
254
+ "rehabilitacja medyczna": 65.0,
255
+ "perinatologia": 50.0,
256
+ "balneologia i medycyna fizykalna": 55.833333333333336,
257
+ "pediatria": 68.90756302521008,
258
+ "nefrologia": 53.333333333333336,
259
+ "choroby płuc": 75.42372881355932,
260
+ "okulistyka": 55.08474576271186,
261
+ "kardiochirurgia": 55.00000000000001,
262
+ "chirurgia naczyniowa": 52.5,
263
+ "reumatologia": 52.5,
264
+ "chirurgia onkologiczna": 48.333333333333336,
265
+ "transplantologia kliniczna": 44.44444444444444,
266
+ "radioterapia onkologiczna": 46.666666666666664,
267
+ "kardiologia": 46.15384615384615,
268
+ "angiologia": 47.5,
269
+ "gastroenterologia": 55.08474576271186,
270
+ "hipertensjologia": 64.70588235294117,
271
+ "stomatologia zachowawcza": 45.378151260504204,
272
+ "choroby płuc dzieci": 47.5,
273
+ "medycyna ratunkowa": 67.5925925925926,
274
+ "nefrologia dziecięca": 63.02521008403361,
275
+ "endokrynologia ginekologiczna i rozrodczość": 58.119658119658126,
276
+ "anestezjologia i intensywna terapia": 51.28205128205128,
277
+ "stomatologia dziecięca": 36.97478991596639,
278
+ "ortopedia i traumatologia narządu ruchu": 47.82608695652174,
279
+ "położnictwo i ginekologia": 58.620689655172406,
280
+ "neurologia dziecięca": 56.30252100840336,
281
+ "choroby zakaźne": 54.166666666666664,
282
+ "gastroenterologia dziecięca": 56.666666666666664,
283
+ "stomatologia zachowawcza z endodoncją": 34.45378151260504,
284
+ "endokrynologia i diabetologia dziecięca": 53.38983050847458,
285
+ "otorynolaryngologia": 51.28205128205128,
286
+ "psychiatria dzieci i młodzieży": 66.94915254237289,
287
+ "chirurgia ogólna": 68.33333333333333,
288
+ "choroby wewnętrzne": 60.0,
289
+ "diagnostyka laboratoryjna": 73.72881355932203,
290
+ "chirurgia dziecięca": 47.45762711864407,
291
+ "urologia dziecięca": 56.63716814159292,
292
+ "zdrowie publiczne": 71.42857142857143,
293
+ "genetyka kliniczna": 56.779661016949156,
294
+ "medycyna nuklearna": 59.82905982905983,
295
+ "kardiologia dziecięca": 57.01754385964912,
296
+ "chirurgia plastyczna": 61.66666666666667,
297
+ "chirurgia klatki piersiowej": 52.5,
298
+ "audiologia i foniatria": 57.01754385964912,
299
+ "intensywna terapia": 65.0,
300
+ "overall_accuracy": 55.226894749346634
301
+ },
302
+ {
303
+ "model_name": "model-aaditya-Llama3-OpenBioLLM-70B",
304
+ "neurologia": 26.05042016806723,
305
+ "medycyna pracy": 18.64406779661017,
306
+ "medycyna rodzinna": 20.0,
307
+ "patomorfologia": 45.0,
308
+ "radiologia i diagnostyka obrazowa": 49.166666666666664,
309
+ "medycyna sportowa": 43.333333333333336,
310
+ "neonatologia": 40.33613445378151,
311
+ "ortopedia": 29.565217391304348,
312
+ "medycyna paliatywna": 53.333333333333336,
313
+ "chirurgia stomatologiczna": 31.932773109243694,
314
+ "dermatologia i wenerologia": 40.833333333333336,
315
+ "diabetologia": 39.166666666666664,
316
+ "hematologia": 39.166666666666664,
317
+ "onkologia kliniczna": 42.857142857142854,
318
+ "protetyka stomatologiczna": 33.33333333333333,
319
+ "neurochirurgia": 29.411764705882355,
320
+ "alergologia": 41.66666666666667,
321
+ "geriatria": 35.0,
322
+ "ginekologia onkologiczna": 33.61344537815126,
323
+ "otolaryngologia": 24.786324786324787,
324
+ "ortodoncja": 27.11864406779661,
325
+ "anestezjologia": 49.57983193277311,
326
+ "endokrynologia": 35.0,
327
+ "periodontologia": 37.81512605042017,
328
+ "psychiatria": 38.333333333333336,
329
+ "rehabilitacja medyczna": 38.333333333333336,
330
+ "perinatologia": 30.0,
331
+ "balneologia i medycyna fizykalna": 36.666666666666664,
332
+ "pediatria": 51.26050420168067,
333
+ "nefrologia": 42.5,
334
+ "choroby płuc": 53.38983050847458,
335
+ "okulistyka": 37.28813559322034,
336
+ "kardiochirurgia": 41.66666666666667,
337
+ "chirurgia naczyniowa": 45.83333333333333,
338
+ "reumatologia": 32.5,
339
+ "chirurgia onkologiczna": 45.83333333333333,
340
+ "transplantologia kliniczna": 35.8974358974359,
341
+ "radioterapia onkologiczna": 40.833333333333336,
342
+ "kardiologia": 42.73504273504273,
343
+ "angiologia": 37.5,
344
+ "gastroenterologia": 38.13559322033898,
345
+ "hipertensjologia": 46.21848739495798,
346
+ "stomatologia zachowawcza": 32.773109243697476,
347
+ "choroby płuc dzieci": 40.0,
348
+ "medycyna ratunkowa": 48.148148148148145,
349
+ "nefrologia dziecięca": 58.82352941176471,
350
+ "endokrynologia ginekologiczna i rozrodczość": 49.572649572649574,
351
+ "anestezjologia i intensywna terapia": 45.2991452991453,
352
+ "stomatologia dziecięca": 29.411764705882355,
353
+ "ortopedia i traumatologia narządu ruchu": 40.869565217391305,
354
+ "położnictwo i ginekologia": 37.06896551724138,
355
+ "neurologia dziecięca": 48.739495798319325,
356
+ "choroby zakaźne": 36.666666666666664,
357
+ "gastroenterologia dziecięca": 43.333333333333336,
358
+ "stomatologia zachowawcza z endodoncją": 31.092436974789916,
359
+ "endokrynologia i diabetologia dziecięca": 40.67796610169492,
360
+ "otorynolaryngologia": 35.8974358974359,
361
+ "psychiatria dzieci i młodzieży": 50.847457627118644,
362
+ "chirurgia ogólna": 49.166666666666664,
363
+ "choroby wewnętrzne": 47.5,
364
+ "diagnostyka laboratoryjna": 55.08474576271186,
365
+ "chirurgia dziecięca": 38.983050847457626,
366
+ "urologia dziecięca": 44.24778761061947,
367
+ "zdrowie publiczne": 56.30252100840336,
368
+ "genetyka kliniczna": 43.22033898305085,
369
+ "medycyna nuklearna": 45.2991452991453,
370
+ "kardiologia dziecięca": 42.10526315789473,
371
+ "chirurgia plastyczna": 46.666666666666664,
372
+ "chirurgia klatki piersiowej": 35.0,
373
+ "audiologia i foniatria": 34.21052631578947,
374
+ "intensywna terapia": 45.83333333333333,
375
+ "overall_accuracy": 40.19957234497505
376
+ },
377
+ {
378
+ "model_name": "model-mistralai-Mistral-Large-Instruct-2407",
379
+ "neurologia": 74.78991596638656,
380
+ "medycyna pracy": 47.45762711864407,
381
+ "medycyna rodzinna": 62.5,
382
+ "patomorfologia": 70.83333333333334,
383
+ "radiologia i diagnostyka obrazowa": 75.0,
384
+ "medycyna sportowa": 75.0,
385
+ "neonatologia": 59.66386554621849,
386
+ "ortopedia": 59.130434782608695,
387
+ "medycyna paliatywna": 75.0,
388
+ "chirurgia stomatologiczna": 50.42016806722689,
389
+ "dermatologia i wenerologia": 56.666666666666664,
390
+ "diabetologia": 54.166666666666664,
391
+ "hematologia": 59.166666666666664,
392
+ "onkologia kliniczna": 57.98319327731093,
393
+ "protetyka stomatologiczna": 50.83333333333333,
394
+ "neurochirurgia": 47.05882352941176,
395
+ "alergologia": 58.333333333333336,
396
+ "geriatria": 65.83333333333333,
397
+ "ginekologia onkologiczna": 56.30252100840336,
398
+ "otolaryngologia": 51.28205128205128,
399
+ "ortodoncja": 44.91525423728814,
400
+ "anestezjologia": 67.22689075630252,
401
+ "endokrynologia": 51.66666666666667,
402
+ "periodontologia": 43.69747899159664,
403
+ "psychiatria": 54.166666666666664,
404
+ "rehabilitacja medyczna": 65.83333333333333,
405
+ "perinatologia": 50.83333333333333,
406
+ "balneologia i medycyna fizykalna": 55.833333333333336,
407
+ "pediatria": 70.58823529411765,
408
+ "nefrologia": 51.66666666666667,
409
+ "choroby płuc": 79.66101694915254,
410
+ "okulistyka": 55.08474576271186,
411
+ "kardiochirurgia": 56.666666666666664,
412
+ "chirurgia naczyniowa": 65.0,
413
+ "reumatologia": 55.833333333333336,
414
+ "chirurgia onkologiczna": 60.83333333333333,
415
+ "transplantologia kliniczna": 49.572649572649574,
416
+ "radioterapia onkologiczna": 56.666666666666664,
417
+ "kardiologia": 58.97435897435898,
418
+ "angiologia": 53.333333333333336,
419
+ "gastroenterologia": 59.32203389830508,
420
+ "hipertensjologia": 71.42857142857143,
421
+ "stomatologia zachowawcza": 40.33613445378151,
422
+ "choroby płuc dzieci": 57.49999999999999,
423
+ "medycyna ratunkowa": 72.22222222222221,
424
+ "nefrologia dziecięca": 63.86554621848739,
425
+ "endokrynologia ginekologiczna i rozrodczość": 62.39316239316239,
426
+ "anestezjologia i intensywna terapia": 59.82905982905983,
427
+ "stomatologia dziecięca": 42.857142857142854,
428
+ "ortopedia i traumatologia narządu ruchu": 53.91304347826087,
429
+ "położnictwo i ginekologia": 56.03448275862068,
430
+ "neurologia dziecięca": 66.38655462184873,
431
+ "choroby zakaźne": 63.33333333333333,
432
+ "gastroenterologia dziecięca": 60.0,
433
+ "stomatologia zachowawcza z endodoncją": 39.49579831932773,
434
+ "endokrynologia i diabetologia dziecięca": 61.016949152542374,
435
+ "otorynolaryngologia": 55.55555555555556,
436
+ "psychiatria dzieci i młodzieży": 70.33898305084746,
437
+ "chirurgia ogólna": 68.33333333333333,
438
+ "choroby wewnętrzne": 70.83333333333334,
439
+ "diagnostyka laboratoryjna": 77.11864406779661,
440
+ "chirurgia dziecięca": 52.54237288135594,
441
+ "urologia dziecięca": 51.32743362831859,
442
+ "zdrowie publiczne": 74.78991596638656,
443
+ "genetyka kliniczna": 61.86440677966102,
444
+ "medycyna nuklearna": 64.1025641025641,
445
+ "kardiologia dziecięca": 57.01754385964912,
446
+ "chirurgia plastyczna": 58.333333333333336,
447
+ "chirurgia klatki piersiowej": 61.66666666666667,
448
+ "audiologia i foniatria": 59.64912280701754,
449
+ "intensywna terapia": 75.83333333333333,
450
+ "overall_accuracy": 59.78854834877643
451
+ },
452
+ {
453
+ "model_name": "model-OpenMeditron-Meditron3-8B",
454
+ "neurologia": 46.21848739495798,
455
+ "medycyna pracy": 31.35593220338983,
456
+ "medycyna rodzinna": 30.833333333333336,
457
+ "patomorfologia": 40.0,
458
+ "radiologia i diagnostyka obrazowa": 38.333333333333336,
459
+ "medycyna sportowa": 43.333333333333336,
460
+ "neonatologia": 42.857142857142854,
461
+ "ortopedia": 39.130434782608695,
462
+ "medycyna paliatywna": 51.66666666666667,
463
+ "chirurgia stomatologiczna": 31.092436974789916,
464
+ "dermatologia i wenerologia": 26.666666666666668,
465
+ "diabetologia": 45.0,
466
+ "hematologia": 34.166666666666664,
467
+ "onkologia kliniczna": 33.61344537815126,
468
+ "protetyka stomatologiczna": 39.166666666666664,
469
+ "neurochirurgia": 31.092436974789916,
470
+ "alergologia": 30.833333333333336,
471
+ "geriatria": 36.666666666666664,
472
+ "ginekologia onkologiczna": 30.252100840336134,
473
+ "otolaryngologia": 33.33333333333333,
474
+ "ortodoncja": 27.11864406779661,
475
+ "anestezjologia": 47.05882352941176,
476
+ "endokrynologia": 27.500000000000004,
477
+ "periodontologia": 38.655462184873954,
478
+ "psychiatria": 32.5,
479
+ "rehabilitacja medyczna": 40.0,
480
+ "perinatologia": 18.333333333333332,
481
+ "balneologia i medycyna fizykalna": 40.833333333333336,
482
+ "pediatria": 39.49579831932773,
483
+ "nefrologia": 31.666666666666664,
484
+ "choroby płuc": 46.61016949152542,
485
+ "okulistyka": 36.440677966101696,
486
+ "kardiochirurgia": 42.5,
487
+ "chirurgia naczyniowa": 39.166666666666664,
488
+ "reumatologia": 37.5,
489
+ "chirurgia onkologiczna": 34.166666666666664,
490
+ "transplantologia kliniczna": 34.18803418803419,
491
+ "radioterapia onkologiczna": 36.666666666666664,
492
+ "kardiologia": 28.205128205128204,
493
+ "angiologia": 38.333333333333336,
494
+ "gastroenterologia": 38.983050847457626,
495
+ "hipertensjologia": 41.17647058823529,
496
+ "stomatologia zachowawcza": 29.411764705882355,
497
+ "choroby płuc dzieci": 36.666666666666664,
498
+ "medycyna ratunkowa": 47.22222222222222,
499
+ "nefrologia dziecięca": 43.69747899159664,
500
+ "endokrynologia ginekologiczna i rozrodczość": 35.04273504273504,
501
+ "anestezjologia i intensywna terapia": 34.18803418803419,
502
+ "stomatologia dziecięca": 29.411764705882355,
503
+ "ortopedia i traumatologia narządu ruchu": 34.78260869565217,
504
+ "położnictwo i ginekologia": 32.758620689655174,
505
+ "neurologia dziecięca": 39.49579831932773,
506
+ "choroby zakaźne": 26.666666666666668,
507
+ "gastroenterologia dziecięca": 40.0,
508
+ "stomatologia zachowawcza z endodoncją": 24.369747899159663,
509
+ "endokrynologia i diabetologia dziecięca": 37.28813559322034,
510
+ "otorynolaryngologia": 31.62393162393162,
511
+ "psychiatria dzieci i młodzieży": 54.23728813559322,
512
+ "chirurgia ogólna": 36.666666666666664,
513
+ "choroby wewnętrzne": 35.0,
514
+ "diagnostyka laboratoryjna": 50.0,
515
+ "chirurgia dziecięca": 32.20338983050847,
516
+ "urologia dziecięca": 38.93805309734513,
517
+ "zdrowie publiczne": 56.30252100840336,
518
+ "genetyka kliniczna": 30.508474576271187,
519
+ "medycyna nuklearna": 47.008547008547005,
520
+ "kardiologia dziecięca": 33.33333333333333,
521
+ "chirurgia plastyczna": 38.333333333333336,
522
+ "chirurgia klatki piersiowej": 37.5,
523
+ "audiologia i foniatria": 45.614035087719294,
524
+ "intensywna terapia": 46.666666666666664,
525
+ "overall_accuracy": 37.13471133285816
526
+ },
527
+ {
528
+ "model_name": "model-meta-llama-Llama-3.2-1B-Instruct",
529
+ "neurologia": 23.52941176470588,
530
+ "medycyna pracy": 21.1864406779661,
531
+ "medycyna rodzinna": 24.166666666666668,
532
+ "patomorfologia": 24.166666666666668,
533
+ "radiologia i diagnostyka obrazowa": 20.0,
534
+ "medycyna sportowa": 20.0,
535
+ "neonatologia": 21.84873949579832,
536
+ "ortopedia": 14.782608695652174,
537
+ "medycyna paliatywna": 25.833333333333336,
538
+ "chirurgia stomatologiczna": 23.52941176470588,
539
+ "dermatologia i wenerologia": 26.666666666666668,
540
+ "diabetologia": 25.0,
541
+ "hematologia": 22.5,
542
+ "onkologia kliniczna": 24.369747899159663,
543
+ "protetyka stomatologiczna": 17.5,
544
+ "neurochirurgia": 21.008403361344538,
545
+ "alergologia": 20.833333333333336,
546
+ "geriatria": 22.5,
547
+ "ginekologia onkologiczna": 21.84873949579832,
548
+ "otolaryngologia": 14.529914529914532,
549
+ "ortodoncja": 22.033898305084744,
550
+ "anestezjologia": 19.327731092436977,
551
+ "endokrynologia": 17.5,
552
+ "periodontologia": 20.168067226890756,
553
+ "psychiatria": 15.0,
554
+ "rehabilitacja medyczna": 20.0,
555
+ "perinatologia": 22.5,
556
+ "balneologia i medycyna fizykalna": 25.833333333333336,
557
+ "pediatria": 22.689075630252102,
558
+ "nefrologia": 20.0,
559
+ "choroby płuc": 27.966101694915253,
560
+ "okulistyka": 25.423728813559322,
561
+ "kardiochirurgia": 25.833333333333336,
562
+ "chirurgia naczyniowa": 23.333333333333332,
563
+ "reumatologia": 26.666666666666668,
564
+ "chirurgia onkologiczna": 28.333333333333332,
565
+ "transplantologia kliniczna": 19.65811965811966,
566
+ "radioterapia onkologiczna": 21.666666666666668,
567
+ "kardiologia": 26.495726495726498,
568
+ "angiologia": 19.166666666666668,
569
+ "gastroenterologia": 16.101694915254235,
570
+ "hipertensjologia": 18.487394957983195,
571
+ "stomatologia zachowawcza": 24.369747899159663,
572
+ "choroby płuc dzieci": 25.0,
573
+ "medycyna ratunkowa": 27.77777777777778,
574
+ "nefrologia dziecięca": 23.52941176470588,
575
+ "endokrynologia ginekologiczna i rozrodczość": 27.350427350427353,
576
+ "anestezjologia i intensywna terapia": 24.786324786324787,
577
+ "stomatologia dziecięca": 18.487394957983195,
578
+ "ortopedia i traumatologia narządu ruchu": 25.217391304347824,
579
+ "położnictwo i ginekologia": 18.96551724137931,
580
+ "neurologia dziecięca": 30.252100840336134,
581
+ "choroby zakaźne": 20.0,
582
+ "gastroenterologia dziecięca": 26.666666666666668,
583
+ "stomatologia zachowawcza z endodoncją": 22.689075630252102,
584
+ "endokrynologia i diabetologia dziecięca": 24.576271186440678,
585
+ "otorynolaryngologia": 25.64102564102564,
586
+ "psychiatria dzieci i młodzieży": 27.11864406779661,
587
+ "chirurgia ogólna": 22.5,
588
+ "choroby wewnętrzne": 23.333333333333332,
589
+ "diagnostyka laboratoryjna": 27.966101694915253,
590
+ "chirurgia dziecięca": 28.8135593220339,
591
+ "urologia dziecięca": 26.548672566371685,
592
+ "zdrowie publiczne": 24.369747899159663,
593
+ "genetyka kliniczna": 23.728813559322035,
594
+ "medycyna nuklearna": 23.931623931623932,
595
+ "kardiologia dziecięca": 31.57894736842105,
596
+ "chirurgia plastyczna": 20.0,
597
+ "chirurgia klatki piersiowej": 19.166666666666668,
598
+ "audiologia i foniatria": 21.929824561403507,
599
+ "intensywna terapia": 20.833333333333336,
600
+ "overall_accuracy": 22.903302447137087
601
+ },
602
+ {
603
+ "model_name": "model-OpenMeditron-Meditron3-70B",
604
+ "neurologia": 61.34453781512605,
605
+ "medycyna pracy": 34.74576271186441,
606
+ "medycyna rodzinna": 44.166666666666664,
607
+ "patomorfologia": 73.33333333333333,
608
+ "radiologia i diagnostyka obrazowa": 63.33333333333333,
609
+ "medycyna sportowa": 50.83333333333333,
610
+ "neonatologia": 57.14285714285714,
611
+ "ortopedia": 32.17391304347826,
612
+ "medycyna paliatywna": 55.00000000000001,
613
+ "chirurgia stomatologiczna": 39.49579831932773,
614
+ "dermatologia i wenerologia": 45.0,
615
+ "diabetologia": 42.5,
616
+ "hematologia": 48.333333333333336,
617
+ "onkologia kliniczna": 47.05882352941176,
618
+ "protetyka stomatologiczna": 34.166666666666664,
619
+ "neurochirurgia": 33.61344537815126,
620
+ "alergologia": 50.83333333333333,
621
+ "geriatria": 51.66666666666667,
622
+ "ginekologia onkologiczna": 35.294117647058826,
623
+ "otolaryngologia": 33.33333333333333,
624
+ "ortodoncja": 29.66101694915254,
625
+ "anestezjologia": 45.378151260504204,
626
+ "endokrynologia": 40.833333333333336,
627
+ "periodontologia": 36.134453781512605,
628
+ "psychiatria": 45.0,
629
+ "rehabilitacja medyczna": 41.66666666666667,
630
+ "perinatologia": 35.833333333333336,
631
+ "balneologia i medycyna fizykalna": 45.83333333333333,
632
+ "pediatria": 62.18487394957983,
633
+ "nefrologia": 50.0,
634
+ "choroby płuc": 53.38983050847458,
635
+ "okulistyka": 48.30508474576271,
636
+ "kardiochirurgia": 53.333333333333336,
637
+ "chirurgia naczyniowa": 45.83333333333333,
638
+ "reumatologia": 49.166666666666664,
639
+ "chirurgia onkologiczna": 50.83333333333333,
640
+ "transplantologia kliniczna": 40.17094017094017,
641
+ "radioterapia onkologiczna": 35.833333333333336,
642
+ "kardiologia": 41.88034188034188,
643
+ "angiologia": 41.66666666666667,
644
+ "gastroenterologia": 44.91525423728814,
645
+ "hipertensjologia": 50.42016806722689,
646
+ "stomatologia zachowawcza": 35.294117647058826,
647
+ "choroby płuc dzieci": 45.83333333333333,
648
+ "medycyna ratunkowa": 57.407407407407405,
649
+ "nefrologia dziecięca": 64.70588235294117,
650
+ "endokrynologia ginekologiczna i rozrodczość": 55.55555555555556,
651
+ "anestezjologia i intensywna terapia": 53.84615384615385,
652
+ "stomatologia dziecięca": 31.932773109243694,
653
+ "ortopedia i traumatologia narządu ruchu": 46.08695652173913,
654
+ "położnictwo i ginekologia": 46.55172413793103,
655
+ "neurologia dziecięca": 57.98319327731093,
656
+ "choroby zakaźne": 45.83333333333333,
657
+ "gastroenterologia dziecięca": 48.333333333333336,
658
+ "stomatologia zachowawcza z endodoncją": 31.932773109243694,
659
+ "endokrynologia i diabetologia dziecięca": 50.0,
660
+ "otorynolaryngologia": 43.58974358974359,
661
+ "psychiatria dzieci i młodzieży": 59.32203389830508,
662
+ "chirurgia ogólna": 50.0,
663
+ "choroby wewnętrzne": 60.83333333333333,
664
+ "diagnostyka laboratoryjna": 58.47457627118644,
665
+ "chirurgia dziecięca": 51.69491525423729,
666
+ "urologia dziecięca": 44.24778761061947,
667
+ "zdrowie publiczne": 62.18487394957983,
668
+ "genetyka kliniczna": 58.47457627118644,
669
+ "medycyna nuklearna": 55.55555555555556,
670
+ "kardiologia dziecięca": 54.385964912280706,
671
+ "chirurgia plastyczna": 47.5,
672
+ "chirurgia klatki piersiowej": 40.833333333333336,
673
+ "audiologia i foniatria": 42.10526315789473,
674
+ "intensywna terapia": 56.666666666666664,
675
+ "overall_accuracy": 47.58850083155144
676
+ },
677
+ {
678
+ "model_name": "model-ProbeMedicalYonseiMAILab-medllama3-v20",
679
+ "neurologia": 41.17647058823529,
680
+ "medycyna pracy": 31.35593220338983,
681
+ "medycyna rodzinna": 25.833333333333336,
682
+ "patomorfologia": 39.166666666666664,
683
+ "radiologia i diagnostyka obrazowa": 39.166666666666664,
684
+ "medycyna sportowa": 35.0,
685
+ "neonatologia": 34.45378151260504,
686
+ "ortopedia": 33.91304347826087,
687
+ "medycyna paliatywna": 34.166666666666664,
688
+ "chirurgia stomatologiczna": 28.57142857142857,
689
+ "dermatologia i wenerologia": 26.666666666666668,
690
+ "diabetologia": 36.666666666666664,
691
+ "hematologia": 19.166666666666668,
692
+ "onkologia kliniczna": 26.89075630252101,
693
+ "protetyka stomatologiczna": 35.0,
694
+ "neurochirurgia": 24.369747899159663,
695
+ "alergologia": 35.0,
696
+ "geriatria": 28.333333333333332,
697
+ "ginekologia onkologiczna": 27.73109243697479,
698
+ "otolaryngologia": 24.786324786324787,
699
+ "ortodoncja": 22.88135593220339,
700
+ "anestezjologia": 41.17647058823529,
701
+ "endokrynologia": 30.0,
702
+ "periodontologia": 26.05042016806723,
703
+ "psychiatria": 30.0,
704
+ "rehabilitacja medyczna": 38.333333333333336,
705
+ "perinatologia": 22.5,
706
+ "balneologia i medycyna fizykalna": 35.833333333333336,
707
+ "pediatria": 31.092436974789916,
708
+ "nefrologia": 30.833333333333336,
709
+ "choroby płuc": 42.3728813559322,
710
+ "okulistyka": 38.983050847457626,
711
+ "kardiochirurgia": 34.166666666666664,
712
+ "chirurgia naczyniowa": 36.666666666666664,
713
+ "reumatologia": 27.500000000000004,
714
+ "chirurgia onkologiczna": 30.833333333333336,
715
+ "transplantologia kliniczna": 27.350427350427353,
716
+ "radioterapia onkologiczna": 30.833333333333336,
717
+ "kardiologia": 23.931623931623932,
718
+ "angiologia": 23.333333333333332,
719
+ "gastroenterologia": 40.67796610169492,
720
+ "hipertensjologia": 42.857142857142854,
721
+ "stomatologia zachowawcza": 23.52941176470588,
722
+ "choroby płuc dzieci": 34.166666666666664,
723
+ "medycyna ratunkowa": 32.407407407407405,
724
+ "nefrologia dziecięca": 36.97478991596639,
725
+ "endokrynologia ginekologiczna i rozrodczość": 32.47863247863248,
726
+ "anestezjologia i intensywna terapia": 35.8974358974359,
727
+ "stomatologia dziecięca": 22.689075630252102,
728
+ "ortopedia i traumatologia narządu ruchu": 32.17391304347826,
729
+ "położnictwo i ginekologia": 27.586206896551722,
730
+ "neurologia dziecięca": 33.61344537815126,
731
+ "choroby zakaźne": 24.166666666666668,
732
+ "gastroenterologia dziecięca": 30.833333333333336,
733
+ "stomatologia zachowawcza z endodoncją": 29.411764705882355,
734
+ "endokrynologia i diabetologia dziecięca": 28.8135593220339,
735
+ "otorynolaryngologia": 30.76923076923077,
736
+ "psychiatria dzieci i młodzieży": 38.983050847457626,
737
+ "chirurgia ogólna": 34.166666666666664,
738
+ "choroby wewnętrzne": 34.166666666666664,
739
+ "diagnostyka laboratoryjna": 42.3728813559322,
740
+ "chirurgia dziecięca": 24.576271186440678,
741
+ "urologia dziecięca": 30.08849557522124,
742
+ "zdrowie publiczne": 40.33613445378151,
743
+ "genetyka kliniczna": 23.728813559322035,
744
+ "medycyna nuklearna": 23.931623931623932,
745
+ "kardiologia dziecięca": 34.21052631578947,
746
+ "chirurgia plastyczna": 34.166666666666664,
747
+ "chirurgia klatki piersiowej": 25.833333333333336,
748
+ "audiologia i foniatria": 37.719298245614034,
749
+ "intensywna terapia": 45.83333333333333,
750
+ "overall_accuracy": 31.84842005226895
751
+ },
752
+ {
753
+ "model_name": "model-mistralai-Mistral-Small-Instruct-2409",
754
+ "neurologia": 46.21848739495798,
755
+ "medycyna pracy": 31.35593220338983,
756
+ "medycyna rodzinna": 33.33333333333333,
757
+ "patomorfologia": 41.66666666666667,
758
+ "radiologia i diagnostyka obrazowa": 45.0,
759
+ "medycyna sportowa": 45.83333333333333,
760
+ "neonatologia": 35.294117647058826,
761
+ "ortopedia": 33.91304347826087,
762
+ "medycyna paliatywna": 45.0,
763
+ "chirurgia stomatologiczna": 34.45378151260504,
764
+ "dermatologia i wenerologia": 36.666666666666664,
765
+ "diabetologia": 31.666666666666664,
766
+ "hematologia": 37.5,
767
+ "onkologia kliniczna": 40.33613445378151,
768
+ "protetyka stomatologiczna": 36.666666666666664,
769
+ "neurochirurgia": 33.61344537815126,
770
+ "alergologia": 36.666666666666664,
771
+ "geriatria": 36.666666666666664,
772
+ "ginekologia onkologiczna": 31.092436974789916,
773
+ "otolaryngologia": 27.350427350427353,
774
+ "ortodoncja": 31.35593220338983,
775
+ "anestezjologia": 38.655462184873954,
776
+ "endokrynologia": 32.5,
777
+ "periodontologia": 30.252100840336134,
778
+ "psychiatria": 35.833333333333336,
779
+ "rehabilitacja medyczna": 38.333333333333336,
780
+ "perinatologia": 34.166666666666664,
781
+ "balneologia i medycyna fizykalna": 38.333333333333336,
782
+ "pediatria": 42.857142857142854,
783
+ "nefrologia": 35.0,
784
+ "choroby płuc": 54.23728813559322,
785
+ "okulistyka": 33.05084745762712,
786
+ "kardiochirurgia": 36.666666666666664,
787
+ "chirurgia naczyniowa": 37.5,
788
+ "reumatologia": 37.5,
789
+ "chirurgia onkologiczna": 42.5,
790
+ "transplantologia kliniczna": 35.04273504273504,
791
+ "radioterapia onkologiczna": 32.5,
792
+ "kardiologia": 35.8974358974359,
793
+ "angiologia": 40.0,
794
+ "gastroenterologia": 38.13559322033898,
795
+ "hipertensjologia": 46.21848739495798,
796
+ "stomatologia zachowawcza": 30.252100840336134,
797
+ "choroby płuc dzieci": 37.5,
798
+ "medycyna ratunkowa": 44.44444444444444,
799
+ "nefrologia dziecięca": 52.94117647058824,
800
+ "endokrynologia ginekologiczna i rozrodczość": 42.73504273504273,
801
+ "anestezjologia i intensywna terapia": 39.31623931623932,
802
+ "stomatologia dziecięca": 27.73109243697479,
803
+ "ortopedia i traumatologia narządu ruchu": 36.52173913043478,
804
+ "położnictwo i ginekologia": 39.6551724137931,
805
+ "neurologia dziecięca": 39.49579831932773,
806
+ "choroby zakaźne": 40.0,
807
+ "gastroenterologia dziecięca": 42.5,
808
+ "stomatologia zachowawcza z endodoncją": 30.252100840336134,
809
+ "endokrynologia i diabetologia dziecięca": 36.440677966101696,
810
+ "otorynolaryngologia": 29.914529914529915,
811
+ "psychiatria dzieci i młodzieży": 48.30508474576271,
812
+ "chirurgia ogólna": 48.333333333333336,
813
+ "choroby wewnętrzne": 35.0,
814
+ "diagnostyka laboratoryjna": 49.152542372881356,
815
+ "chirurgia dziecięca": 41.52542372881356,
816
+ "urologia dziecięca": 35.39823008849557,
817
+ "zdrowie publiczne": 58.82352941176471,
818
+ "genetyka kliniczna": 38.13559322033898,
819
+ "medycyna nuklearna": 40.17094017094017,
820
+ "kardiologia dziecięca": 45.614035087719294,
821
+ "chirurgia plastyczna": 35.833333333333336,
822
+ "chirurgia klatki piersiowej": 35.833333333333336,
823
+ "audiologia i foniatria": 35.08771929824561,
824
+ "intensywna terapia": 48.333333333333336,
825
+ "overall_accuracy": 38.47707293894037
826
+ },
827
+ {
828
+ "model_name": "model-speakleash-Bielik-11B-v2.2-Instruct",
829
+ "neurologia": 49.57983193277311,
830
+ "medycyna pracy": 42.3728813559322,
831
+ "medycyna rodzinna": 43.333333333333336,
832
+ "patomorfologia": 50.0,
833
+ "radiologia i diagnostyka obrazowa": 48.333333333333336,
834
+ "medycyna sportowa": 55.833333333333336,
835
+ "neonatologia": 45.378151260504204,
836
+ "ortopedia": 42.608695652173914,
837
+ "medycyna paliatywna": 45.83333333333333,
838
+ "chirurgia stomatologiczna": 36.134453781512605,
839
+ "dermatologia i wenerologia": 38.333333333333336,
840
+ "diabetologia": 30.833333333333336,
841
+ "hematologia": 33.33333333333333,
842
+ "onkologia kliniczna": 43.69747899159664,
843
+ "protetyka stomatologiczna": 35.833333333333336,
844
+ "neurochirurgia": 28.57142857142857,
845
+ "alergologia": 35.0,
846
+ "geriatria": 44.166666666666664,
847
+ "ginekologia onkologiczna": 41.17647058823529,
848
+ "otolaryngologia": 35.04273504273504,
849
+ "ortodoncja": 32.20338983050847,
850
+ "anestezjologia": 52.10084033613446,
851
+ "endokrynologia": 33.33333333333333,
852
+ "periodontologia": 36.134453781512605,
853
+ "psychiatria": 37.5,
854
+ "rehabilitacja medyczna": 52.5,
855
+ "perinatologia": 35.833333333333336,
856
+ "balneologia i medycyna fizykalna": 42.5,
857
+ "pediatria": 49.57983193277311,
858
+ "nefrologia": 34.166666666666664,
859
+ "choroby płuc": 52.54237288135594,
860
+ "okulistyka": 45.76271186440678,
861
+ "kardiochirurgia": 37.5,
862
+ "chirurgia naczyniowa": 45.83333333333333,
863
+ "reumatologia": 35.833333333333336,
864
+ "chirurgia onkologiczna": 44.166666666666664,
865
+ "transplantologia kliniczna": 34.18803418803419,
866
+ "radioterapia onkologiczna": 42.5,
867
+ "kardiologia": 40.17094017094017,
868
+ "angiologia": 47.5,
869
+ "gastroenterologia": 46.61016949152542,
870
+ "hipertensjologia": 50.42016806722689,
871
+ "stomatologia zachowawcza": 27.73109243697479,
872
+ "choroby płuc dzieci": 46.666666666666664,
873
+ "medycyna ratunkowa": 48.148148148148145,
874
+ "nefrologia dziecięca": 50.42016806722689,
875
+ "endokrynologia ginekologiczna i rozrodczość": 41.02564102564102,
876
+ "anestezjologia i intensywna terapia": 39.31623931623932,
877
+ "stomatologia dziecięca": 32.773109243697476,
878
+ "ortopedia i traumatologia narządu ruchu": 40.0,
879
+ "położnictwo i ginekologia": 43.96551724137931,
880
+ "neurologia dziecięca": 42.857142857142854,
881
+ "choroby zakaźne": 40.833333333333336,
882
+ "gastroenterologia dziecięca": 40.833333333333336,
883
+ "stomatologia zachowawcza z endodoncją": 36.134453781512605,
884
+ "endokrynologia i diabetologia dziecięca": 34.74576271186441,
885
+ "otorynolaryngologia": 41.02564102564102,
886
+ "psychiatria dzieci i młodzieży": 59.32203389830508,
887
+ "chirurgia ogólna": 45.83333333333333,
888
+ "choroby wewnętrzne": 38.333333333333336,
889
+ "diagnostyka laboratoryjna": 50.0,
890
+ "chirurgia dziecięca": 28.8135593220339,
891
+ "urologia dziecięca": 37.16814159292036,
892
+ "zdrowie publiczne": 71.42857142857143,
893
+ "genetyka kliniczna": 37.28813559322034,
894
+ "medycyna nuklearna": 43.58974358974359,
895
+ "kardiologia dziecięca": 43.859649122807014,
896
+ "chirurgia plastyczna": 45.83333333333333,
897
+ "chirurgia klatki piersiowej": 40.833333333333336,
898
+ "audiologia i foniatria": 49.122807017543856,
899
+ "intensywna terapia": 45.83333333333333,
900
+ "overall_accuracy": 42.219054407222615
901
+ },
902
+ {
903
+ "model_name": "model-gpt-4o-2024-08-06",
904
+ "neurologia": 83.19327731092437,
905
+ "medycyna pracy": 61.016949152542374,
906
+ "medycyna rodzinna": 81.66666666666667,
907
+ "patomorfologia": 90.0,
908
+ "radiologia i diagnostyka obrazowa": 89.16666666666667,
909
+ "medycyna sportowa": 85.83333333333333,
910
+ "neonatologia": 68.90756302521008,
911
+ "ortopedia": 72.17391304347827,
912
+ "medycyna paliatywna": 85.0,
913
+ "chirurgia stomatologiczna": 59.66386554621849,
914
+ "dermatologia i wenerologia": 73.33333333333333,
915
+ "diabetologia": 63.33333333333333,
916
+ "hematologia": 75.0,
917
+ "onkologia kliniczna": 78.99159663865547,
918
+ "protetyka stomatologiczna": 75.83333333333333,
919
+ "neurochirurgia": 68.90756302521008,
920
+ "alergologia": 77.5,
921
+ "geriatria": 81.66666666666667,
922
+ "ginekologia onkologiczna": 67.22689075630252,
923
+ "otolaryngologia": 70.94017094017094,
924
+ "ortodoncja": 53.38983050847458,
925
+ "anestezjologia": 81.5126050420168,
926
+ "endokrynologia": 71.66666666666667,
927
+ "periodontologia": 70.58823529411765,
928
+ "psychiatria": 82.5,
929
+ "rehabilitacja medyczna": 80.83333333333333,
930
+ "perinatologia": 70.0,
931
+ "balneologia i medycyna fizykalna": 60.83333333333333,
932
+ "pediatria": 85.71428571428571,
933
+ "nefrologia": 72.5,
934
+ "choroby płuc": 85.59322033898306,
935
+ "okulistyka": 77.11864406779661,
936
+ "kardiochirurgia": 78.33333333333333,
937
+ "chirurgia naczyniowa": 75.0,
938
+ "reumatologia": 83.33333333333334,
939
+ "chirurgia onkologiczna": 73.33333333333333,
940
+ "transplantologia kliniczna": 64.1025641025641,
941
+ "radioterapia onkologiczna": 66.66666666666666,
942
+ "kardiologia": 64.95726495726495,
943
+ "angiologia": 73.33333333333333,
944
+ "gastroenterologia": 74.57627118644068,
945
+ "hipertensjologia": 78.15126050420169,
946
+ "stomatologia zachowawcza": 60.50420168067227,
947
+ "choroby płuc dzieci": 71.66666666666667,
948
+ "medycyna ratunkowa": 87.03703703703704,
949
+ "nefrologia dziecięca": 78.15126050420169,
950
+ "endokrynologia ginekologiczna i rozrodczość": 72.64957264957265,
951
+ "anestezjologia i intensywna terapia": 75.21367521367522,
952
+ "stomatologia dziecięca": 64.70588235294117,
953
+ "ortopedia i traumatologia narządu ruchu": 73.91304347826086,
954
+ "położnictwo i ginekologia": 79.3103448275862,
955
+ "neurologia dziecięca": 78.99159663865547,
956
+ "choroby zakaźne": 76.66666666666667,
957
+ "gastroenterologia dziecięca": 75.83333333333333,
958
+ "stomatologia zachowawcza z endodoncją": 52.94117647058824,
959
+ "endokrynologia i diabetologia dziecięca": 82.20338983050848,
960
+ "otorynolaryngologia": 70.94017094017094,
961
+ "psychiatria dzieci i młodzieży": 82.20338983050848,
962
+ "chirurgia ogólna": 87.5,
963
+ "choroby wewnętrzne": 85.83333333333333,
964
+ "diagnostyka laboratoryjna": 90.67796610169492,
965
+ "chirurgia dziecięca": 74.57627118644068,
966
+ "urologia dziecięca": 76.99115044247787,
967
+ "zdrowie publiczne": 85.71428571428571,
968
+ "genetyka kliniczna": 83.89830508474576,
969
+ "medycyna nuklearna": 73.50427350427351,
970
+ "kardiologia dziecięca": 78.94736842105263,
971
+ "chirurgia plastyczna": 75.83333333333333,
972
+ "chirurgia klatki piersiowej": 80.83333333333333,
973
+ "audiologia i foniatria": 75.43859649122807,
974
+ "intensywna terapia": 85.83333333333333,
975
+ "overall_accuracy": 75.65930149679258
976
+ },
977
+ {
978
+ "model_name": "model-meta-llama-Llama-3.2-3B-Instruct",
979
+ "neurologia": 36.97478991596639,
980
+ "medycyna pracy": 34.74576271186441,
981
+ "medycyna rodzinna": 34.166666666666664,
982
+ "patomorfologia": 30.833333333333336,
983
+ "radiologia i diagnostyka obrazowa": 32.5,
984
+ "medycyna sportowa": 36.666666666666664,
985
+ "neonatologia": 35.294117647058826,
986
+ "ortopedia": 27.82608695652174,
987
+ "medycyna paliatywna": 46.666666666666664,
988
+ "chirurgia stomatologiczna": 35.294117647058826,
989
+ "dermatologia i wenerologia": 34.166666666666664,
990
+ "diabetologia": 37.5,
991
+ "hematologia": 30.0,
992
+ "onkologia kliniczna": 40.33613445378151,
993
+ "protetyka stomatologiczna": 34.166666666666664,
994
+ "neurochirurgia": 27.73109243697479,
995
+ "alergologia": 28.333333333333332,
996
+ "geriatria": 30.833333333333336,
997
+ "ginekologia onkologiczna": 28.57142857142857,
998
+ "otolaryngologia": 19.65811965811966,
999
+ "ortodoncja": 31.35593220338983,
1000
+ "anestezjologia": 38.655462184873954,
1001
+ "endokrynologia": 18.333333333333332,
1002
+ "periodontologia": 34.45378151260504,
1003
+ "psychiatria": 25.0,
1004
+ "rehabilitacja medyczna": 30.833333333333336,
1005
+ "perinatologia": 30.0,
1006
+ "balneologia i medycyna fizykalna": 35.833333333333336,
1007
+ "pediatria": 38.655462184873954,
1008
+ "nefrologia": 31.666666666666664,
1009
+ "choroby płuc": 44.06779661016949,
1010
+ "okulistyka": 37.28813559322034,
1011
+ "kardiochirurgia": 30.833333333333336,
1012
+ "chirurgia naczyniowa": 36.666666666666664,
1013
+ "reumatologia": 31.666666666666664,
1014
+ "chirurgia onkologiczna": 29.166666666666668,
1015
+ "transplantologia kliniczna": 29.914529914529915,
1016
+ "radioterapia onkologiczna": 30.0,
1017
+ "kardiologia": 29.059829059829063,
1018
+ "angiologia": 24.166666666666668,
1019
+ "gastroenterologia": 32.20338983050847,
1020
+ "hipertensjologia": 32.773109243697476,
1021
+ "stomatologia zachowawcza": 21.84873949579832,
1022
+ "choroby płuc dzieci": 24.166666666666668,
1023
+ "medycyna ratunkowa": 32.407407407407405,
1024
+ "nefrologia dziecięca": 32.773109243697476,
1025
+ "endokrynologia ginekologiczna i rozrodczość": 30.76923076923077,
1026
+ "anestezjologia i intensywna terapia": 29.914529914529915,
1027
+ "stomatologia dziecięca": 24.369747899159663,
1028
+ "ortopedia i traumatologia narządu ruchu": 39.130434782608695,
1029
+ "położnictwo i ginekologia": 32.758620689655174,
1030
+ "neurologia dziecięca": 34.45378151260504,
1031
+ "choroby zakaźne": 27.500000000000004,
1032
+ "gastroenterologia dziecięca": 31.666666666666664,
1033
+ "stomatologia zachowawcza z endodoncją": 29.411764705882355,
1034
+ "endokrynologia i diabetologia dziecięca": 33.89830508474576,
1035
+ "otorynolaryngologia": 25.64102564102564,
1036
+ "psychiatria dzieci i młodzieży": 38.13559322033898,
1037
+ "chirurgia ogólna": 36.666666666666664,
1038
+ "choroby wewnętrzne": 34.166666666666664,
1039
+ "diagnostyka laboratoryjna": 38.13559322033898,
1040
+ "chirurgia dziecięca": 31.35593220338983,
1041
+ "urologia dziecięca": 35.39823008849557,
1042
+ "zdrowie publiczne": 45.378151260504204,
1043
+ "genetyka kliniczna": 35.59322033898305,
1044
+ "medycyna nuklearna": 27.350427350427353,
1045
+ "kardiologia dziecięca": 41.228070175438596,
1046
+ "chirurgia plastyczna": 39.166666666666664,
1047
+ "chirurgia klatki piersiowej": 30.0,
1048
+ "audiologia i foniatria": 33.33333333333333,
1049
+ "intensywna terapia": 43.333333333333336,
1050
+ "overall_accuracy": 32.73936802090758
1051
+ },
1052
+ {
1053
+ "model_name": "model-Qwen-Qwen2.5-7B-Instruct",
1054
+ "neurologia": 45.378151260504204,
1055
+ "medycyna pracy": 36.440677966101696,
1056
+ "medycyna rodzinna": 45.0,
1057
+ "patomorfologia": 38.333333333333336,
1058
+ "radiologia i diagnostyka obrazowa": 42.5,
1059
+ "medycyna sportowa": 46.666666666666664,
1060
+ "neonatologia": 56.30252100840336,
1061
+ "ortopedia": 38.26086956521739,
1062
+ "medycyna paliatywna": 55.833333333333336,
1063
+ "chirurgia stomatologiczna": 35.294117647058826,
1064
+ "dermatologia i wenerologia": 35.833333333333336,
1065
+ "diabetologia": 40.0,
1066
+ "hematologia": 34.166666666666664,
1067
+ "onkologia kliniczna": 32.773109243697476,
1068
+ "protetyka stomatologiczna": 41.66666666666667,
1069
+ "neurochirurgia": 36.97478991596639,
1070
+ "alergologia": 45.0,
1071
+ "geriatria": 48.333333333333336,
1072
+ "ginekologia onkologiczna": 41.17647058823529,
1073
+ "otolaryngologia": 30.76923076923077,
1074
+ "ortodoncja": 36.440677966101696,
1075
+ "anestezjologia": 43.69747899159664,
1076
+ "endokrynologia": 30.0,
1077
+ "periodontologia": 37.81512605042017,
1078
+ "psychiatria": 35.0,
1079
+ "rehabilitacja medyczna": 50.83333333333333,
1080
+ "perinatologia": 40.0,
1081
+ "balneologia i medycyna fizykalna": 37.5,
1082
+ "pediatria": 39.49579831932773,
1083
+ "nefrologia": 35.0,
1084
+ "choroby płuc": 60.16949152542372,
1085
+ "okulistyka": 38.13559322033898,
1086
+ "kardiochirurgia": 36.666666666666664,
1087
+ "chirurgia naczyniowa": 47.5,
1088
+ "reumatologia": 34.166666666666664,
1089
+ "chirurgia onkologiczna": 40.0,
1090
+ "transplantologia kliniczna": 36.75213675213676,
1091
+ "radioterapia onkologiczna": 45.83333333333333,
1092
+ "kardiologia": 38.46153846153847,
1093
+ "angiologia": 37.5,
1094
+ "gastroenterologia": 44.06779661016949,
1095
+ "hipertensjologia": 52.10084033613446,
1096
+ "stomatologia zachowawcza": 36.134453781512605,
1097
+ "choroby płuc dzieci": 43.333333333333336,
1098
+ "medycyna ratunkowa": 51.85185185185185,
1099
+ "nefrologia dziecięca": 47.05882352941176,
1100
+ "endokrynologia ginekologiczna i rozrodczość": 41.88034188034188,
1101
+ "anestezjologia i intensywna terapia": 42.73504273504273,
1102
+ "stomatologia dziecięca": 33.61344537815126,
1103
+ "ortopedia i traumatologia narządu ruchu": 40.0,
1104
+ "położnictwo i ginekologia": 41.37931034482759,
1105
+ "neurologia dziecięca": 41.17647058823529,
1106
+ "choroby zakaźne": 39.166666666666664,
1107
+ "gastroenterologia dziecięca": 40.833333333333336,
1108
+ "stomatologia zachowawcza z endodoncją": 23.52941176470588,
1109
+ "endokrynologia i diabetologia dziecięca": 47.45762711864407,
1110
+ "otorynolaryngologia": 40.17094017094017,
1111
+ "psychiatria dzieci i młodzieży": 52.54237288135594,
1112
+ "chirurgia ogólna": 45.83333333333333,
1113
+ "choroby wewnętrzne": 35.833333333333336,
1114
+ "diagnostyka laboratoryjna": 59.32203389830508,
1115
+ "chirurgia dziecięca": 34.74576271186441,
1116
+ "urologia dziecięca": 26.548672566371685,
1117
+ "zdrowie publiczne": 64.70588235294117,
1118
+ "genetyka kliniczna": 41.52542372881356,
1119
+ "medycyna nuklearna": 42.73504273504273,
1120
+ "kardiologia dziecięca": 42.10526315789473,
1121
+ "chirurgia plastyczna": 37.5,
1122
+ "chirurgia klatki piersiowej": 40.833333333333336,
1123
+ "audiologia i foniatria": 40.35087719298245,
1124
+ "intensywna terapia": 47.5,
1125
+ "overall_accuracy": 41.4944167260632
1126
+ },
1127
+ {
1128
+ "model_name": "model-johnsnowlabs-JSL-MedLlama-3-8B-v2.0",
1129
+ "neurologia": 28.57142857142857,
1130
+ "medycyna pracy": 32.20338983050847,
1131
+ "medycyna rodzinna": 20.0,
1132
+ "patomorfologia": 37.5,
1133
+ "radiologia i diagnostyka obrazowa": 22.5,
1134
+ "medycyna sportowa": 35.833333333333336,
1135
+ "neonatologia": 30.252100840336134,
1136
+ "ortopedia": 28.695652173913043,
1137
+ "medycyna paliatywna": 33.33333333333333,
1138
+ "chirurgia stomatologiczna": 30.252100840336134,
1139
+ "dermatologia i wenerologia": 17.5,
1140
+ "diabetologia": 30.0,
1141
+ "hematologia": 26.666666666666668,
1142
+ "onkologia kliniczna": 26.89075630252101,
1143
+ "protetyka stomatologiczna": 30.0,
1144
+ "neurochirurgia": 21.008403361344538,
1145
+ "alergologia": 25.0,
1146
+ "geriatria": 30.0,
1147
+ "ginekologia onkologiczna": 19.327731092436977,
1148
+ "otolaryngologia": 25.64102564102564,
1149
+ "ortodoncja": 27.11864406779661,
1150
+ "anestezjologia": 37.81512605042017,
1151
+ "endokrynologia": 25.0,
1152
+ "periodontologia": 26.05042016806723,
1153
+ "psychiatria": 21.666666666666668,
1154
+ "rehabilitacja medyczna": 31.666666666666664,
1155
+ "perinatologia": 22.5,
1156
+ "balneologia i medycyna fizykalna": 34.166666666666664,
1157
+ "pediatria": 31.932773109243694,
1158
+ "nefrologia": 23.333333333333332,
1159
+ "choroby płuc": 37.28813559322034,
1160
+ "okulistyka": 25.423728813559322,
1161
+ "kardiochirurgia": 32.5,
1162
+ "chirurgia naczyniowa": 25.833333333333336,
1163
+ "reumatologia": 29.166666666666668,
1164
+ "chirurgia onkologiczna": 31.666666666666664,
1165
+ "transplantologia kliniczna": 27.350427350427353,
1166
+ "radioterapia onkologiczna": 25.833333333333336,
1167
+ "kardiologia": 21.367521367521366,
1168
+ "angiologia": 25.0,
1169
+ "gastroenterologia": 29.66101694915254,
1170
+ "hipertensjologia": 31.092436974789916,
1171
+ "stomatologia zachowawcza": 31.092436974789916,
1172
+ "choroby płuc dzieci": 23.333333333333332,
1173
+ "medycyna ratunkowa": 25.0,
1174
+ "nefrologia dziecięca": 36.134453781512605,
1175
+ "endokrynologia ginekologiczna i rozrodczość": 30.76923076923077,
1176
+ "anestezjologia i intensywna terapia": 29.914529914529915,
1177
+ "stomatologia dziecięca": 17.647058823529413,
1178
+ "ortopedia i traumatologia narządu ruchu": 26.08695652173913,
1179
+ "położnictwo i ginekologia": 25.862068965517242,
1180
+ "neurologia dziecięca": 36.134453781512605,
1181
+ "choroby zakaźne": 20.833333333333336,
1182
+ "gastroenterologia dziecięca": 28.333333333333332,
1183
+ "stomatologia zachowawcza z endodoncją": 26.05042016806723,
1184
+ "endokrynologia i diabetologia dziecięca": 29.66101694915254,
1185
+ "otorynolaryngologia": 29.059829059829063,
1186
+ "psychiatria dzieci i młodzieży": 39.83050847457627,
1187
+ "chirurgia ogólna": 31.666666666666664,
1188
+ "choroby wewnętrzne": 30.0,
1189
+ "diagnostyka laboratoryjna": 40.67796610169492,
1190
+ "chirurgia dziecięca": 27.966101694915253,
1191
+ "urologia dziecięca": 29.20353982300885,
1192
+ "zdrowie publiczne": 42.857142857142854,
1193
+ "genetyka kliniczna": 22.033898305084744,
1194
+ "medycyna nuklearna": 34.18803418803419,
1195
+ "kardiologia dziecięca": 24.561403508771928,
1196
+ "chirurgia plastyczna": 35.833333333333336,
1197
+ "chirurgia klatki piersiowej": 28.333333333333332,
1198
+ "audiologia i foniatria": 36.84210526315789,
1199
+ "intensywna terapia": 39.166666666666664,
1200
+ "overall_accuracy": 28.926110715134236
1201
+ },
1202
+ {
1203
+ "model_name": "model-BioMistral-BioMistral-7B",
1204
+ "neurologia": 24.369747899159663,
1205
+ "medycyna pracy": 18.64406779661017,
1206
+ "medycyna rodzinna": 22.5,
1207
+ "patomorfologia": 22.5,
1208
+ "radiologia i diagnostyka obrazowa": 23.333333333333332,
1209
+ "medycyna sportowa": 23.333333333333332,
1210
+ "neonatologia": 22.689075630252102,
1211
+ "ortopedia": 20.0,
1212
+ "medycyna paliatywna": 30.833333333333336,
1213
+ "chirurgia stomatologiczna": 19.327731092436977,
1214
+ "dermatologia i wenerologia": 25.0,
1215
+ "diabetologia": 20.0,
1216
+ "hematologia": 25.833333333333336,
1217
+ "onkologia kliniczna": 26.05042016806723,
1218
+ "protetyka stomatologiczna": 17.5,
1219
+ "neurochirurgia": 21.84873949579832,
1220
+ "alergologia": 21.666666666666668,
1221
+ "geriatria": 24.166666666666668,
1222
+ "ginekologia onkologiczna": 19.327731092436977,
1223
+ "otolaryngologia": 15.384615384615385,
1224
+ "ortodoncja": 21.1864406779661,
1225
+ "anestezjologia": 20.168067226890756,
1226
+ "endokrynologia": 17.5,
1227
+ "periodontologia": 21.84873949579832,
1228
+ "psychiatria": 22.5,
1229
+ "rehabilitacja medyczna": 20.833333333333336,
1230
+ "perinatologia": 24.166666666666668,
1231
+ "balneologia i medycyna fizykalna": 26.666666666666668,
1232
+ "pediatria": 30.252100840336134,
1233
+ "nefrologia": 19.166666666666668,
1234
+ "choroby płuc": 25.423728813559322,
1235
+ "okulistyka": 26.27118644067797,
1236
+ "kardiochirurgia": 25.833333333333336,
1237
+ "chirurgia naczyniowa": 20.0,
1238
+ "reumatologia": 24.166666666666668,
1239
+ "chirurgia onkologiczna": 30.0,
1240
+ "transplantologia kliniczna": 23.076923076923077,
1241
+ "radioterapia onkologiczna": 23.333333333333332,
1242
+ "kardiologia": 23.931623931623932,
1243
+ "angiologia": 18.333333333333332,
1244
+ "gastroenterologia": 19.491525423728813,
1245
+ "hipertensjologia": 26.05042016806723,
1246
+ "stomatologia zachowawcza": 22.689075630252102,
1247
+ "choroby płuc dzieci": 19.166666666666668,
1248
+ "medycyna ratunkowa": 24.074074074074073,
1249
+ "nefrologia dziecięca": 27.73109243697479,
1250
+ "endokrynologia ginekologiczna i rozrodczość": 26.495726495726498,
1251
+ "anestezjologia i intensywna terapia": 22.22222222222222,
1252
+ "stomatologia dziecięca": 17.647058823529413,
1253
+ "ortopedia i traumatologia narządu ruchu": 24.347826086956523,
1254
+ "położnictwo i ginekologia": 23.275862068965516,
1255
+ "neurologia dziecięca": 33.61344537815126,
1256
+ "choroby zakaźne": 20.0,
1257
+ "gastroenterologia dziecięca": 24.166666666666668,
1258
+ "stomatologia zachowawcza z endodoncją": 22.689075630252102,
1259
+ "endokrynologia i diabetologia dziecięca": 25.423728813559322,
1260
+ "otorynolaryngologia": 24.786324786324787,
1261
+ "psychiatria dzieci i młodzieży": 23.728813559322035,
1262
+ "chirurgia ogólna": 26.666666666666668,
1263
+ "choroby wewnętrzne": 20.833333333333336,
1264
+ "diagnostyka laboratoryjna": 27.966101694915253,
1265
+ "chirurgia dziecięca": 30.508474576271187,
1266
+ "urologia dziecięca": 20.353982300884958,
1267
+ "zdrowie publiczne": 26.05042016806723,
1268
+ "genetyka kliniczna": 22.88135593220339,
1269
+ "medycyna nuklearna": 29.059829059829063,
1270
+ "kardiologia dziecięca": 28.07017543859649,
1271
+ "chirurgia plastyczna": 19.166666666666668,
1272
+ "chirurgia klatki piersiowej": 22.5,
1273
+ "audiologia i foniatria": 21.929824561403507,
1274
+ "intensywna terapia": 23.333333333333332,
1275
+ "overall_accuracy": 23.319078165835116
1276
+ }
1277
+ ]
src/structures/ldek_structure.py CHANGED
@@ -52,7 +52,8 @@ def load_json_data(file_path, ORDER_LIST_LDEK):
52
  return LDEK_ACCS
53
 
54
 
55
- file_path = str(abs_path / "leaderboards/r_ldek_report_scores.json")
 
56
  with open(file_path, 'r', encoding='utf-8') as file:
57
  sample_data = pd.read_json(file_path).iloc[0].to_dict() # Load the first row as a dict
58
 
 
52
  return LDEK_ACCS
53
 
54
 
55
+ # file_path = str(abs_path / "leaderboards/r_ldek_report_scores.json")
56
+ file_path = str(abs_path / "leaderboards/r_ldek_accs.json")
57
  with open(file_path, 'r', encoding='utf-8') as file:
58
  sample_data = pd.read_json(file_path).iloc[0].to_dict() # Load the first row as a dict
59
 
src/structures/lek_structure.py CHANGED
@@ -52,7 +52,8 @@ def load_json_data(file_path, ORDER_LIST_LEK):
52
  return LEK_ACCS
53
 
54
 
55
- file_path = str(abs_path / "leaderboards/r_lek_report_scores.json")
 
56
  with open(file_path, 'r', encoding='utf-8') as file:
57
  sample_data = pd.read_json(file_path).iloc[0].to_dict() # Load the first row as a dict
58
 
 
52
  return LEK_ACCS
53
 
54
 
55
+ # file_path = str(abs_path / "leaderboards/r_lek_report_scores.json")
56
+ file_path = str(abs_path / "leaderboards/r_lek_accs.json")
57
  with open(file_path, 'r', encoding='utf-8') as file:
58
  sample_data = pd.read_json(file_path).iloc[0].to_dict() # Load the first row as a dict
59
 
src/structures/pes_structure.py CHANGED
@@ -57,8 +57,8 @@ def load_json_data(file_path, order_list):
57
  PES_ACCS = PES_ACCS.sort_values(by="Score", ascending=False)
58
 
59
  return PES_ACCS
60
- file_path = str(abs_path / "leaderboards/pes_accuracy.json")
61
-
62
  with open(file_path, 'r', encoding='utf-8') as file:
63
  sample_data = pd.read_json(file_path).iloc[0].to_dict() # Load the first row as a dict
64
 
 
57
  PES_ACCS = PES_ACCS.sort_values(by="Score", ascending=False)
58
 
59
  return PES_ACCS
60
+ # file_path = str(abs_path / "leaderboards/pes_accuracy.json")
61
+ file_path = str(abs_path / "leaderboards/pes_accs.json")
62
  with open(file_path, 'r', encoding='utf-8') as file:
63
  sample_data = pd.read_json(file_path).iloc[0].to_dict() # Load the first row as a dict
64