2 2 2

Junxiong Wang

JunxiongWang

https://www.cs.cornell.edu/~junxiong/

jxiw

AI & ML interests

Attention Free Model / Subquadratic Language Models

Recent Activity

updated a model 1 day ago

JunxiongWang/MambaInLlama3B_DPO2

published a model 1 day ago

JunxiongWang/MambaInLlama3B_DPO2

updated a model 1 day ago

JunxiongWang/MambaInLlama3B_DPO1

View all activity

Organizations

Collections 7

Papers 3

arxiv:2408.15237

arxiv:2401.13660

arxiv:2212.10544

models 42

datasets 7

JunxiongWang/test_math

Viewer • Updated 3 days ago • 89.1k • 9

JunxiongWang/FineMathV4

Viewer • Updated 8 days ago • 6.7M • 50

JunxiongWang/model_revision_max_4_closest_and_random

Viewer • Updated 29 days ago • 530k • 39

JunxiongWang/sftdatasetv3

Viewer • Updated Oct 7, 2024 • 12.4M • 714

JunxiongWang/sftdataset

Viewer • Updated Aug 28, 2024 • 11M • 132 • 2

JunxiongWang/llama3-ultrafeedback-armorm

Viewer • Updated Aug 27, 2024 • 61.8k • 104 • 1

JunxiongWang/testdataset

Viewer • Updated Jun 23, 2024 • 1M • 220

Junxiong Wang

AI & ML interests

Recent Activity

Organizations

Collections 7

JunxiongWang/Llama3.1-Mamba2-8B-dpo

JunxiongWang/Llama3.1-Mamba-8B-dpo

JunxiongWang/Llama3.2-Mamba2-3B-dpo

JunxiongWang/Llama3.2-Mamba-3B-dpo

JunxiongWang/Llama3.2-Mamba2-3B-distill

JunxiongWang/Llama3.2-Mamba-3B-distill

JunxiongWang/Llama3.1-Mamba2-8B-distill

JunxiongWang/Llama3.1-Mamba-8B-distill

Papers 3

models 42

JunxiongWang/MambaInLlama3B_DPO2

JunxiongWang/MambaInLlama3B_DPO1

JunxiongWang/MambaInLlama3B_v3.1

JunxiongWang/MambaInLlama3B_v3

JunxiongWang/MambaInLlama1B_v3

JunxiongWang/mamba_0_5_distill

JunxiongWang/Llama3.2-Mamba-3B-dpo

JunxiongWang/Llama3.2-Mamba-3B-distill

JunxiongWang/Llama3.2-Mamba2-3B-distill

JunxiongWang/Llama3.2-Mamba2-3B-dpo

datasets 7

JunxiongWang/test_math

JunxiongWang/FineMathV4

JunxiongWang/model_revision_max_4_closest_and_random

JunxiongWang/sftdatasetv3

JunxiongWang/sftdataset

JunxiongWang/llama3-ultrafeedback-armorm

JunxiongWang/testdataset

Junxiong Wang

AI & ML interests

Recent Activity

Organizations

Collections 7

Papers 3

models 42 Sort: Recently updated

datasets 7 Sort: Recently updated

models 42

datasets 7