Training in progress, step 660, checkpoint

Files changed (5) hide show

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ec414aa412d347b020c52d6913febda691ffa58147d1fc4ec8933d4bbd5792cc
 size 109009752

 version https://git-lfs.github.com/spec/v1
+oid sha256:a5f4554e7aff6599904d0319a20ee86142cd7d1747a6de55c2ecc7a2ef0f88e9
 size 109009752

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:aa795f21870ee80b58f1c67c34b77a17136213e144d77fd915677c7664bb595e
 size 56088788

 version https://git-lfs.github.com/spec/v1
+oid sha256:db78a63e6ac946bde21e73e26a05c81e9c8b3b13e74e2fb7450f6da464fb0e13
 size 56088788

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:94499896249a2e4d50fadc9fedec320a01cd48879c1343ddb53ec14a6a37145a
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:1b8bd222230b9ba24daa62957d67e25eed67a1b67be6dbe8febbba1f1264beae
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a184ad96f2716246808468faf2ca914e9aaf15bc756dd5950c75321082e37ab3
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:ce585e1dbd1dc0083d726023c4787702cd6c517b31ebbe8e35d5384feabc9615
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": 2.578611599801661e-07,
   "best_model_checkpoint": "miner_id_24/checkpoint-640",
-  "epoch": 4.30976430976431,
   "eval_steps": 20,
-  "global_step": 640,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -313,6 +313,14 @@
       "eval_samples_per_second": 28.64,
       "eval_steps_per_second": 0.916,
       "step": 640
     }
   ],
   "logging_steps": 100,
@@ -327,7 +335,7 @@
         "early_stopping_threshold": 0.0
       },
       "attributes": {
-        "early_stopping_patience_counter": 0
       }
     },
     "TrainerControl": {
@@ -341,7 +349,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 2.7025377746485248e+17,
   "train_batch_size": 8,
   "trial_name": null,
   "trial_params": null

 {
   "best_metric": 2.578611599801661e-07,
   "best_model_checkpoint": "miner_id_24/checkpoint-640",
+  "epoch": 4.444444444444445,
   "eval_steps": 20,
+  "global_step": 660,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 28.64,
       "eval_steps_per_second": 0.916,
       "step": 640
+    },
+    {
+      "epoch": 4.444444444444445,
+      "eval_loss": 2.583842331205233e-07,
+      "eval_runtime": 4.3769,
+      "eval_samples_per_second": 28.559,
+      "eval_steps_per_second": 0.914,
+      "step": 660
     }
   ],
   "logging_steps": 100,
         "early_stopping_threshold": 0.0
       },
       "attributes": {
+        "early_stopping_patience_counter": 1
       }
     },
     "TrainerControl": {
       "attributes": {}
     }
   },
+  "total_flos": 2.7870250829611008e+17,
   "train_batch_size": 8,
   "trial_name": null,
   "trial_params": null