--per_device_train_batch_size 4 --learning_rate 3e-5 --num_train_epochs 2 --max_seq_length 512 --doc_stride 250 --max_answer_length 200

Files changed (1) hide show

all_results.json ADDED Viewed

+{
+    "epoch": 2.0,
+    "eval_exact_match": 37.12871287128713,
+    "eval_f1": 64.92639883412856,
+    "eval_runtime": 507.7317,
+    "eval_samples": 5582,
+    "eval_samples_per_second": 10.994,
+    "eval_steps_per_second": 1.375,
+    "total_flos": 9.312702234262733e+16,
+    "train_loss": 0.2107836102126935,
+    "train_runtime": 30875.5596,
+    "train_samples": 50138,
+    "train_samples_per_second": 3.248,
+    "train_steps_per_second": 0.812
+}