neph1
/

llama-3.1-instruct-bellman-8b-swedish

Inference Endpoints

Model card Files Files and versions Community

neph1 commited on Jul 26, 2024

Commit

b4d546c

·

verified ·

1 Parent(s): 330c49d

Update README.md

Files changed (1) hide show

README.md +19 -0

README.md CHANGED Viewed

@@ -40,6 +40,25 @@ Step 	Training Loss 	Validation Loss<br>
 275 	0.931000 	0.960848<br>
 300 	0.932000 	0.958946 <-- picked checkpoint <br>
 ### Model Description

 275 	0.931000 	0.960848<br>
 300 	0.932000 	0.958946 <-- picked checkpoint <br>
+### Training Parameters
+  per_device_train_batch_size = 4,<br>
+  gradient_accumulation_steps = 16,<br>
+  num_train_epochs=3,<br>
+  warmup_steps = 5,<br>
+  learning_rate = 3e-5,<br>
+  logging_steps = 25,<br>
+  optim = "adamw_8bit",<br>
+  weight_decay = 0.01,<br>
+  lr_scheduler_type = "linear",<br>
+  seed = 3407,<br>
+  per_device_eval_batch_size = 2,<br>
+  eval_strategy="steps",<br>
+  eval_accumulation_steps = 32,<br>
+  eval_steps = 25,<br>
+  eval_delay = 0,<br>
+  save_strategy="steps",<br>
+  save_steps=50,<br>
 ### Model Description