JiJiaming's picture

2 1 3

JiJiaming

jijiaming

·

zmsn-2077

AI & ML interests

Interested in Coding & Reinforcement Learning & Safe Reinforcement Learning.

Recent Activity

liked a dataset 2 days ago

PKU-Alignment/align-anything

liked a dataset 4 months ago

PKU-Alignment/PKU-SafeRLHF

updated a dataset 4 months ago

PKU-Alignment/PKU-SafeRLHF

View all activity

Organizations

jijiaming's activity

liked a dataset 2 days ago

PKU-Alignment/align-anything

Viewer • Updated Dec 23, 2024 • 85.6k • 6.77k • 25

liked a dataset 4 months ago

PKU-Alignment/PKU-SafeRLHF

Viewer • Updated Oct 18, 2024 • 164k • 3.03k • 124

updated a dataset 4 months ago

PKU-Alignment/PKU-SafeRLHF

Viewer • Updated Oct 18, 2024 • 164k • 3.03k • 124

updated a collection 7 months ago

PKU-SafeRLHF

A safety alignment preference dataset for llama family models • 4 items • Updated Jul 16, 2024 • 1

authored a paper 7 months ago

ProgressGym: Alignment with a Millennium of Moral Progress

Paper • 2406.20087 • Published Jun 28, 2024 • 3

upvoted a paper over 1 year ago

Safe RLHF: Safe Reinforcement Learning from Human Feedback

Paper • 2310.12773 • Published Oct 19, 2023 • 28

authored 2 papers over 1 year ago

Safe RLHF: Safe Reinforcement Learning from Human Feedback

Paper • 2310.12773 • Published Oct 19, 2023 • 28

Baichuan 2: Open Large-scale Language Models

Paper • 2309.10305 • Published Sep 19, 2023 • 19

liked a dataset over 1 year ago

PKU-Alignment/PKU-SafeRLHF-10K

Viewer • Updated Jul 20, 2023 • 10k • 185 • 63