lole25
/

phi-2-dpo-ultrafeedback-lora

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

phi-2-dpo-ultrafeedback-lora / adapter_model.safetensors

Commit History

Model save

37f2f6b
verified

lole25 commited on Mar 4, 2024

Training in progress, step 900

74c72fc
verified

lole25 commited on Mar 4, 2024

Training in progress, step 800

39c636a
verified

lole25 commited on Mar 4, 2024

Training in progress, step 700

22f4a71
verified

lole25 commited on Mar 4, 2024

Training in progress, step 600

7ce904a
verified

lole25 commited on Mar 4, 2024

Training in progress, step 500

964e8fc
verified

lole25 commited on Mar 4, 2024

Training in progress, step 400

200217b
verified

lole25 commited on Mar 4, 2024

Training in progress, step 300

4a8e8be
verified

lole25 commited on Mar 4, 2024

Training in progress, step 200

7db3838
verified

lole25 commited on Mar 4, 2024

Training in progress, step 100

b8cb02a
verified

lole25 commited on Mar 4, 2024