Xi's picture

Xi

xi0v

·

AI & ML interests

Reinforcement learning, Diffusion Model Merging, LLM Merging, Model Editing and Vision/Multimodal Model Fine-tuning.

Recent Activity

liked a model about 1 hour ago

Menyu/Vpred-checkpoints5000

liked a model about 1 hour ago

tomg-group-umd/huginn-0125

liked a model about 1 hour ago

miqudev/miqu-1-70b

View all activity

Organizations

xi0v's activity

liked 5 models about 1 hour ago

Menyu/Vpred-checkpoints5000

Text-to-Image • Updated Nov 8, 2024 • 33 • 1

tomg-group-umd/huginn-0125

Text Generation • Updated 2 days ago • 5.55k • 131

miqudev/miqu-1-70b

Updated Feb 4, 2024 • 409 • 985

reach-vb/miqu-1-70b-sf

Text Generation • Updated Feb 1, 2024 • 17 • 1

gj3ka1/animaengine

Text-to-Video • Updated Jan 10 • 6

liked a model about 4 hours ago

NousResearch/DeepHermes-3-Llama-3-8B-Preview

Text Generation • Updated about 14 hours ago • 322 • 81

liked a model about 18 hours ago

John6666/cat-tower-v15vpred-cyber4itercomp-sdxl

Text-to-Image • Updated Dec 26, 2024 • 182 • 1

liked a model about 19 hours ago

nvidia/QLIP-L-14-392

Updated 4 days ago • 41 • 5

liked a model about 20 hours ago

open-r1/OpenR1-Qwen-7B

Text Generation • Updated 3 days ago • 758 • 20

liked a dataset about 20 hours ago

open-r1/OpenR1-Math-220k

Viewer • Updated 2 days ago • 450k • 2.43k • 264

upvoted a paper about 20 hours ago

Hephaestus: Improving Fundamental Agent Capabilities of Large Language Models through Continual Pre-Training

Paper • 2502.06589 • Published 4 days ago • 14

liked 2 models 1 day ago

SentientAGI/Dobby-Unhinged-Llama-3.3-70B

Text Generation • Updated 1 day ago • 156 • 14

Liberata/illustrious-xl-v1.0

Text-to-Image • Updated 2 days ago • 79

liked a model 2 days ago

SicariusSicariiStuff/Phi-lthy4

Updated 1 day ago • 84 • 24

liked a dataset 2 days ago

AngelBottomless/Figures-Plushies-Anime

Viewer • Updated Aug 15, 2024 • 238k • 31 • 2

liked a model 2 days ago

John6666/mymix-g-jem-xlbd1-sdxl

Text-to-Image • Updated 2 days ago • 23 • 1

liked a Space 2 days ago

Zonos

Generate audio from text with customizable emotions and settings

liked a dataset 2 days ago

jan-hq/Maze-Reasoning

Viewer • Updated 8 days ago • 100k • 78 • 8

upvoted a paper 2 days ago

Training Language Models for Social Deduction with Multi-Agent Reinforcement Learning

Paper • 2502.06060 • Published 5 days ago • 29

upvoted a paper 3 days ago

Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling

Paper • 2502.06703 • Published 4 days ago • 114