Models
Datasets
Spaces
Posts
Docs
Enterprise
Pricing
Log In
Sign Up

Darya Poludova's picture

Darya Poludova

dapoli

AI & ML interests

None yet

Organizations

None yet

Collections 1

Training Language Models to Self-Correct via Reinforcement Learning

Paper • 2409.12917 • Published Sep 19, 2024 • 136
Language Models Learn to Mislead Humans via RLHF

Paper • 2409.12822 • Published Sep 19, 2024 • 10

models 1

dapoli/ppo-LunarLander-v2

Reinforcement Learning • Updated Jun 3, 2024

datasets

None public yet

Company

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs