AmberYifan
/

Llama-2-7b-sft-hhrlhf-gen-dpo

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Llama-2-7b-sft-hhrlhf-gen-dpo / last-checkpoint /rng_state_1.pth

Commit History

Training in progress, epoch 3, checkpoint

2743353
verified

AmberYifan commited on 22 days ago

Training in progress, epoch 2, checkpoint

06b68e8
verified

AmberYifan commited on 22 days ago

Training in progress, epoch 1, checkpoint

ff6c143
verified

AmberYifan commited on 22 days ago