mlfoundations-dev
/

dpo_from_multiple_samples_shortest_numina_aime

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

dpo_from_multiple_samples_shortest_numina_aime

Commit History

Model save

860f585
verified

sedrickkeh commited on 6 days ago

Training in progress, epoch 0

863ff76
verified

sedrickkeh commited on 6 days ago

initial commit

508dd15
verified

sedrickkeh commited on 6 days ago