AlistairPullen
/

Llama-3.1-8b-Instruct-GRPO-fine-tuned-lora

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

Llama-3.1-8b-Instruct-GRPO-fine-tuned-lora

Commit History

Training in progress, step 233, checkpoint

3094068
verified

AlistairPullen commited on 7 days ago

Training in progress, step 233

a21d1ce
verified

AlistairPullen commited on 7 days ago

initial commit

7a26ad0
verified

AlistairPullen commited on 8 days ago