AlistairPullen
/

Llama-3.1-8b-Instruct-GRPO-fine-tuned-lora

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

Llama-3.1-8b-Instruct-GRPO-fine-tuned-lora

Commit History

Model save

a9a9e05
verified

AlistairPullen commited on 10 days ago

Training in progress, step 233, checkpoint

3094068
verified

AlistairPullen commited on 10 days ago

Training in progress, step 233

a21d1ce
verified

AlistairPullen commited on 10 days ago

initial commit

7a26ad0
verified

AlistairPullen commited on 10 days ago