simplescaling
/

s1-32B

Text Generation

Model card Files Files and versions Community

Muennighoff commited on 3 days ago

Commit

cfafd1b

·

verified ·

1 Parent(s): 6c7c60b

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -11,7 +11,7 @@ datasets:
 > s1 is a reasoning model finetuned from Qwen2.5-32B-Instruct on just 1,000 examples. It matches o1-preview & exhibits test-time scaling via budget forcing.
 - **Repository:** [simplescaling/s1](https://github.com/simplescaling/s1)
-- **Paper:** TODO
 # Use

 > s1 is a reasoning model finetuned from Qwen2.5-32B-Instruct on just 1,000 examples. It matches o1-preview & exhibits test-time scaling via budget forcing.
 - **Repository:** [simplescaling/s1](https://github.com/simplescaling/s1)
+- **Paper:** https://arxiv.org/abs/2501.19393
 # Use