AmberYifan
/

Mistral-7B-v0.1-sft-hhrlhf-dpo

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Mistral-7B-v0.1-sft-hhrlhf-dpo / last-checkpoint /rng_state_2.pth

Commit History

Training in progress, epoch 3, checkpoint

1aa8e46
verified

AmberYifan commited on 20 days ago

Training in progress, epoch 2, checkpoint

7c03f54
verified

AmberYifan commited on 20 days ago

Training in progress, epoch 1, checkpoint

1fba992
verified

AmberYifan commited on 20 days ago