jyc0325
/

Llama-3.1-8B-sft-ultrachat-hhrlhf-dpo

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Llama-3.1-8B-sft-ultrachat-hhrlhf-dpo

Commit History

Model save

abd7fb2
verified

jyc0325 commited on 5 days ago

Training in progress, epoch 3, checkpoint

914eed9
verified

jyc0325 commited on 5 days ago

Training in progress, epoch 3

3ce8c12
verified

jyc0325 commited on 5 days ago

Training in progress, epoch 2, checkpoint

0650a43
verified

jyc0325 commited on 5 days ago

Training in progress, epoch 2

8335bc9
verified

jyc0325 commited on 5 days ago

Training in progress, epoch 1, checkpoint

bd8658e
verified

jyc0325 commited on 5 days ago

Training in progress, epoch 1

dcc18ba
verified

jyc0325 commited on 5 days ago

initial commit

93e76a0
verified

jyc0325 commited on 6 days ago