Edit Models filters

Misc

Inference Endpoints

AutoTrain Compatible

text-generation-inference

Misc with no match

8-bit precision

4-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

6

Full-text search

Active filters: gsm8k

ucalyptus/prem-1B-grpo

Text Generation • Updated 1 day ago • 14 • 1

August4293/mistral_gsm8k_ssl_it1

Updated Jul 4, 2024

August4293/mistral_gsm8k_ssl_it2

Updated Jul 4, 2024

emre/Qwen-0.5B-GRPO

Text Generation • Updated 3 days ago • 40

mradermacher/Qwen-0.5B-GRPO-GGUF

Updated 3 days ago • 254

mradermacher/prem-1B-grpo-GGUF

Reinforcement Learning • Updated 1 day ago • 169