Rauhan
/

llama-3.2-3B-GRPO-GSM325

Text Generation

reinforcement-learning

mathematical-reasoning

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

llama-3.2-3B-GRPO-GSM325 / .gitattributes

Commit History

Upload tokenizer

cd8530f
verified

Rauhan commited on 11 days ago

initial commit

8639551
verified

Rauhan commited on 11 days ago