Upload folder using huggingface_hub

Browse files

Files changed (6) hide show

training_checkpoints/checkpoint-1125/adapter_config.json +1 -1
training_checkpoints/checkpoint-1125/adapter_model.safetensors +1 -1
training_checkpoints/checkpoint-1125/optimizer.pt +1 -1
training_checkpoints/checkpoint-1125/scheduler.pt +1 -1
training_checkpoints/checkpoint-1125/trainer_state.json +133 -133
training_checkpoints/checkpoint-1125/training_args.bin +1 -1

training_checkpoints/checkpoint-1125/adapter_config.json CHANGED Viewed

@@ -21,8 +21,8 @@
   "revision": null,
   "target_modules": [
     "key",
-    "dense",
     "value",
     "query"
   ],
   "task_type": "SEQ_CLS",

   "revision": null,
   "target_modules": [
     "key",
     "value",
+    "dense",
     "query"
   ],
   "task_type": "SEQ_CLS",

training_checkpoints/checkpoint-1125/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:751c058d328d5bced7fcc3d8c590845b12aedffec849ef6e36b8f6b80509dc4a
 size 104549068

 version https://git-lfs.github.com/spec/v1
+oid sha256:ca6b02a5f83d3d6b2bbc636ee862fc1d6896a112b391969b1379ff2a2cc6774f
 size 104549068

training_checkpoints/checkpoint-1125/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:51a34afa9448b5e619706a6ed419f14e3795ce9f674a26cbaa0a541d5dedec9c
 size 21646778

 version https://git-lfs.github.com/spec/v1
+oid sha256:a285e2020d2e294d6d26b5d7bc54971b751e4a19b4dfb1e292413766f04ab231
 size 21646778

training_checkpoints/checkpoint-1125/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:20a6fea19f4fba60504f25e5a88ef9ff2e0562d058598a10a7b8423ea5b6c595
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:40224493aacf0cd0f7038028ae3514743b7f864ad570d1dd323ebd02caa1c08b
 size 1064

training_checkpoints/checkpoint-1125/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.4555893583613109,
   "best_model_checkpoint": "legal-bert-lora/checkpoint-1125",
   "epoch": 6.998444790046657,
   "eval_steps": 500,
@@ -10,174 +10,174 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.6297443841982959,
-      "eval_f1_macro": 0.274206359888179,
-      "eval_f1_micro": 0.6297443841982959,
-      "eval_f1_weighted": 0.5693924444438366,
-      "eval_loss": 1.3252344131469727,
-      "eval_macro_fpr": 0.04170202326759921,
-      "eval_macro_sensitivity": 0.31095312319919677,
-      "eval_macro_specificity": 0.9716859606487191,
-      "eval_precision": 0.5643117258906628,
-      "eval_precision_macro": 0.2864620870649182,
-      "eval_recall": 0.6297443841982959,
-      "eval_recall_macro": 0.31095312319919677,
-      "eval_runtime": 29.2455,
-      "eval_samples_per_second": 44.143,
-      "eval_steps_per_second": 5.539,
-      "eval_weighted_fpr": 0.0403035413153457,
-      "eval_weighted_sensitivity": 0.6297443841982959,
-      "eval_weighted_specificity": 0.945545025532491,
       "step": 160
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.7312161115414407,
-      "eval_f1_macro": 0.39668888106795264,
-      "eval_f1_micro": 0.7312161115414407,
-      "eval_f1_weighted": 0.6996238601563893,
-      "eval_loss": 0.8870222568511963,
-      "eval_macro_fpr": 0.025654492164758257,
-      "eval_macro_sensitivity": 0.4525442260434048,
-      "eval_macro_specificity": 0.9800113592544849,
-      "eval_precision": 0.687310022738013,
-      "eval_precision_macro": 0.37417463878901125,
-      "eval_recall": 0.7312161115414407,
-      "eval_recall_macro": 0.4525442260434048,
-      "eval_runtime": 31.4769,
-      "eval_samples_per_second": 41.014,
-      "eval_steps_per_second": 5.147,
-      "eval_weighted_fpr": 0.025584310255843103,
-      "eval_weighted_sensitivity": 0.7312161115414407,
-      "eval_weighted_specificity": 0.9689542772758329,
       "step": 321
     },
     {
       "epoch": 3.0,
-      "eval_accuracy": 0.7482571649883811,
-      "eval_f1_macro": 0.4262450946907797,
-      "eval_f1_micro": 0.7482571649883811,
-      "eval_f1_weighted": 0.7282078768513273,
-      "eval_loss": 0.7794041037559509,
-      "eval_macro_fpr": 0.023941075707085962,
-      "eval_macro_sensitivity": 0.46803400264857875,
-      "eval_macro_specificity": 0.9812882861560729,
-      "eval_precision": 0.716881212213352,
-      "eval_precision_macro": 0.40594566191566384,
-      "eval_recall": 0.7482571649883811,
-      "eval_recall_macro": 0.46803400264857875,
-      "eval_runtime": 31.9176,
-      "eval_samples_per_second": 40.448,
-      "eval_steps_per_second": 5.076,
-      "eval_weighted_fpr": 0.02346739836811322,
-      "eval_weighted_sensitivity": 0.7482571649883811,
-      "eval_weighted_specificity": 0.9710671273527125,
       "step": 482
     },
     {
       "epoch": 3.11,
-      "learning_rate": 3.4375e-05,
-      "loss": 1.2835,
       "step": 500
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.7443841982958946,
-      "eval_f1_macro": 0.4099967964216515,
-      "eval_f1_micro": 0.7443841982958946,
-      "eval_f1_weighted": 0.7145941103131069,
-      "eval_loss": 0.7480739951133728,
-      "eval_macro_fpr": 0.024347730036769315,
-      "eval_macro_sensitivity": 0.45879715060247334,
-      "eval_macro_specificity": 0.9809610383366641,
-      "eval_precision": 0.7084810945380595,
-      "eval_precision_macro": 0.39966194371515146,
-      "eval_recall": 0.7443841982958946,
-      "eval_recall_macro": 0.45879715060247334,
-      "eval_runtime": 31.4007,
-      "eval_samples_per_second": 41.114,
-      "eval_steps_per_second": 5.159,
-      "eval_weighted_fpr": 0.023940800928612886,
-      "eval_weighted_sensitivity": 0.7443841982958946,
-      "eval_weighted_specificity": 0.9700313767540658,
       "step": 643
     },
     {
       "epoch": 5.0,
-      "eval_accuracy": 0.7629744384198296,
-      "eval_f1_macro": 0.43501781058601113,
-      "eval_f1_micro": 0.7629744384198296,
-      "eval_f1_weighted": 0.7371758021368604,
-      "eval_loss": 0.7360239624977112,
-      "eval_macro_fpr": 0.022582062196490615,
-      "eval_macro_sensitivity": 0.4763281068994499,
-      "eval_macro_specificity": 0.9822126782492226,
-      "eval_precision": 0.7245041319757508,
-      "eval_precision_macro": 0.4175606064626592,
-      "eval_recall": 0.7629744384198296,
-      "eval_recall_macro": 0.4763281068994499,
-      "eval_runtime": 31.4819,
-      "eval_samples_per_second": 41.008,
-      "eval_steps_per_second": 5.146,
-      "eval_weighted_fpr": 0.021708286038592508,
-      "eval_weighted_sensitivity": 0.7629744384198296,
-      "eval_weighted_specificity": 0.9702157353185087,
       "step": 803
     },
     {
       "epoch": 6.0,
-      "eval_accuracy": 0.7738187451587917,
-      "eval_f1_macro": 0.45136434049983454,
-      "eval_f1_micro": 0.7738187451587917,
-      "eval_f1_weighted": 0.7549277434298373,
-      "eval_loss": 0.7146413922309875,
-      "eval_macro_fpr": 0.020909390992017808,
-      "eval_macro_sensitivity": 0.49065578942391963,
-      "eval_macro_specificity": 0.9831195609570588,
-      "eval_precision": 0.7789833226684362,
-      "eval_precision_macro": 0.5020078701673053,
-      "eval_recall": 0.7738187451587917,
-      "eval_recall_macro": 0.49065578942391963,
-      "eval_runtime": 31.935,
-      "eval_samples_per_second": 40.426,
-      "eval_steps_per_second": 5.073,
-      "eval_weighted_fpr": 0.020451043563524302,
-      "eval_weighted_sensitivity": 0.7738187451587917,
-      "eval_weighted_specificity": 0.9729746691970887,
       "step": 964
     },
     {
       "epoch": 6.22,
-      "learning_rate": 1.8750000000000002e-05,
-      "loss": 0.6494,
       "step": 1000
     },
     {
       "epoch": 7.0,
-      "eval_accuracy": 0.7606506584043378,
-      "eval_f1_macro": 0.4555893583613109,
-      "eval_f1_micro": 0.7606506584043377,
-      "eval_f1_weighted": 0.739017992628783,
-      "eval_loss": 0.7362409234046936,
-      "eval_macro_fpr": 0.022493653031422953,
-      "eval_macro_sensitivity": 0.4889578896745981,
-      "eval_macro_specificity": 0.9822020479931979,
-      "eval_precision": 0.7519338544853175,
-      "eval_precision_macro": 0.5232191620367644,
-      "eval_recall": 0.7606506584043378,
-      "eval_recall_macro": 0.4889578896745981,
-      "eval_runtime": 31.5363,
-      "eval_samples_per_second": 40.937,
-      "eval_steps_per_second": 5.137,
-      "eval_weighted_fpr": 0.021981930710677954,
-      "eval_weighted_sensitivity": 0.7606506584043378,
-      "eval_weighted_specificity": 0.9723800614936304,
       "step": 1125
     }
   ],
   "logging_steps": 500,
-  "max_steps": 1600,
-  "num_train_epochs": 10,
   "save_steps": 500,
   "total_flos": 9761403521544192.0,
   "trial_name": null,

 {
+  "best_metric": 0.6191969834738721,
   "best_model_checkpoint": "legal-bert-lora/checkpoint-1125",
   "epoch": 6.998444790046657,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.6374903175832688,
+      "eval_f1_macro": 0.3394539856434376,
+      "eval_f1_micro": 0.6374903175832688,
+      "eval_f1_weighted": 0.5765523433851403,
+      "eval_loss": 1.3127473592758179,
+      "eval_macro_fpr": 0.040137717078130394,
+      "eval_macro_sensitivity": 0.4017115530536667,
+      "eval_macro_specificity": 0.9725650393599338,
+      "eval_precision": 0.5466227876047401,
+      "eval_precision_macro": 0.31141306924471374,
+      "eval_recall": 0.6374903175832688,
+      "eval_recall_macro": 0.4017115530536667,
+      "eval_runtime": 44.4128,
+      "eval_samples_per_second": 29.068,
+      "eval_steps_per_second": 3.648,
+      "eval_weighted_fpr": 0.0390325271059216,
+      "eval_weighted_sensitivity": 0.6374903175832688,
+      "eval_weighted_specificity": 0.950985272815738,
       "step": 160
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.7273431448489543,
+      "eval_f1_macro": 0.3969800602789428,
+      "eval_f1_micro": 0.7273431448489543,
+      "eval_f1_weighted": 0.6960627383550935,
+      "eval_loss": 0.8160030841827393,
+      "eval_macro_fpr": 0.026417996388603746,
+      "eval_macro_sensitivity": 0.450135625445356,
+      "eval_macro_specificity": 0.9796396430402219,
+      "eval_precision": 0.6997929823446861,
+      "eval_precision_macro": 0.39453164470926966,
+      "eval_recall": 0.7273431448489543,
+      "eval_recall_macro": 0.450135625445356,
+      "eval_runtime": 34.3148,
+      "eval_samples_per_second": 37.622,
+      "eval_steps_per_second": 4.721,
+      "eval_weighted_fpr": 0.026077937472218107,
+      "eval_weighted_sensitivity": 0.7273431448489543,
+      "eval_weighted_specificity": 0.9672515007543734,
       "step": 321
     },
     {
       "epoch": 3.0,
+      "eval_accuracy": 0.7443841982958946,
+      "eval_f1_macro": 0.4210575074216338,
+      "eval_f1_micro": 0.7443841982958946,
+      "eval_f1_weighted": 0.7223603623418946,
+      "eval_loss": 0.7322217226028442,
+      "eval_macro_fpr": 0.024451015698283406,
+      "eval_macro_sensitivity": 0.46251578703813245,
+      "eval_macro_specificity": 0.9809603839363172,
+      "eval_precision": 0.711002444877192,
+      "eval_precision_macro": 0.4030436676815596,
+      "eval_recall": 0.7443841982958946,
+      "eval_recall_macro": 0.46251578703813245,
+      "eval_runtime": 32.8708,
+      "eval_samples_per_second": 39.275,
+      "eval_steps_per_second": 4.928,
+      "eval_weighted_fpr": 0.023940800928612886,
+      "eval_weighted_sensitivity": 0.7443841982958946,
+      "eval_weighted_specificity": 0.9700215607488639,
       "step": 482
     },
     {
       "epoch": 3.11,
+      "learning_rate": 3.958333333333333e-05,
+      "loss": 1.2229,
       "step": 500
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.7536793183578622,
+      "eval_f1_macro": 0.46141164864389705,
+      "eval_f1_micro": 0.7536793183578622,
+      "eval_f1_weighted": 0.7337325056665881,
+      "eval_loss": 0.7034952640533447,
+      "eval_macro_fpr": 0.023326126599014015,
+      "eval_macro_sensitivity": 0.4865735295815666,
+      "eval_macro_specificity": 0.9815978320880049,
+      "eval_precision": 0.7340611054176746,
+      "eval_precision_macro": 0.4982390488816621,
+      "eval_recall": 0.7536793183578622,
+      "eval_recall_macro": 0.4865735295815666,
+      "eval_runtime": 33.282,
+      "eval_samples_per_second": 38.79,
+      "eval_steps_per_second": 4.868,
+      "eval_weighted_fpr": 0.022812051649928264,
+      "eval_weighted_sensitivity": 0.7536793183578622,
+      "eval_weighted_specificity": 0.9702881629622103,
       "step": 643
     },
     {
       "epoch": 5.0,
+      "eval_accuracy": 0.7652982184353214,
+      "eval_f1_macro": 0.4824234674423381,
+      "eval_f1_micro": 0.7652982184353214,
+      "eval_f1_weighted": 0.7415202198150465,
+      "eval_loss": 0.6963701844215393,
+      "eval_macro_fpr": 0.022125198961045537,
+      "eval_macro_sensitivity": 0.5099998711032655,
+      "eval_macro_specificity": 0.982427621700107,
+      "eval_precision": 0.7403884847240659,
+      "eval_precision_macro": 0.5015009503316971,
+      "eval_recall": 0.7652982184353214,
+      "eval_recall_macro": 0.5099998711032655,
+      "eval_runtime": 29.8835,
+      "eval_samples_per_second": 43.201,
+      "eval_steps_per_second": 5.421,
+      "eval_weighted_fpr": 0.02143615139724089,
+      "eval_weighted_sensitivity": 0.7652982184353214,
+      "eval_weighted_specificity": 0.9711161070662828,
       "step": 803
     },
     {
       "epoch": 6.0,
+      "eval_accuracy": 0.7807900852052673,
+      "eval_f1_macro": 0.5371165387852578,
+      "eval_f1_micro": 0.7807900852052673,
+      "eval_f1_weighted": 0.7659242764458758,
+      "eval_loss": 0.684776246547699,
+      "eval_macro_fpr": 0.020129954279912522,
+      "eval_macro_sensitivity": 0.5604626117585171,
+      "eval_macro_specificity": 0.9836211797331506,
+      "eval_precision": 0.7919069236021963,
+      "eval_precision_macro": 0.5968972302554038,
+      "eval_recall": 0.7807900852052673,
+      "eval_recall_macro": 0.5604626117585171,
+      "eval_runtime": 29.4753,
+      "eval_samples_per_second": 43.799,
+      "eval_steps_per_second": 5.496,
+      "eval_weighted_fpr": 0.019659604029176797,
+      "eval_weighted_sensitivity": 0.7807900852052673,
+      "eval_weighted_specificity": 0.9735276107919913,
       "step": 964
     },
     {
       "epoch": 6.22,
+      "learning_rate": 2.916666666666667e-05,
+      "loss": 0.5985,
       "step": 1000
     },
     {
       "epoch": 7.0,
+      "eval_accuracy": 0.7978311386522076,
+      "eval_f1_macro": 0.6191969834738721,
+      "eval_f1_micro": 0.7978311386522076,
+      "eval_f1_weighted": 0.7857784690137476,
+      "eval_loss": 0.6644509434700012,
+      "eval_macro_fpr": 0.018390423375855742,
+      "eval_macro_sensitivity": 0.6251682037032721,
+      "eval_macro_specificity": 0.9848362780039965,
+      "eval_precision": 0.7880411922037887,
+      "eval_precision_macro": 0.6671036841379524,
+      "eval_recall": 0.7978311386522076,
+      "eval_recall_macro": 0.6251682037032721,
+      "eval_runtime": 29.8127,
+      "eval_samples_per_second": 43.304,
+      "eval_steps_per_second": 5.434,
+      "eval_weighted_fpr": 0.017778080512226686,
+      "eval_weighted_sensitivity": 0.7978311386522076,
+      "eval_weighted_specificity": 0.9747130314077416,
       "step": 1125
     }
   ],
   "logging_steps": 500,
+  "max_steps": 2400,
+  "num_train_epochs": 15,
   "save_steps": 500,
   "total_flos": 9761403521544192.0,
   "trial_name": null,

training_checkpoints/checkpoint-1125/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1be05b6bb510587fe353991f6f2836b34a5909cbc5adc58389938bd163228a1f
 size 4600

 version https://git-lfs.github.com/spec/v1
+oid sha256:36a33fe5941ace0a96599f0a2229d1ce6d7002fe79c5372925862ab481915414
 size 4600