mlfoundations-dev
/

dpo_from_multiple_samples_shortest_numina_aime

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

dpo_from_multiple_samples_shortest_numina_aime

Commit History

Upload configs.yaml with huggingface_hub

b597105
verified

sedrickkeh commited on 10 days ago

End of training

1c793df
verified

sedrickkeh commited on 10 days ago

Model save

860f585
verified

sedrickkeh commited on 10 days ago

Training in progress, epoch 0

863ff76
verified

sedrickkeh commited on 10 days ago

initial commit

508dd15
verified

sedrickkeh commited on 10 days ago