Jaehyun Jun's picture

Jaehyun Jun

btjhjeon

·

https://btjhjeon.github.io/

btjhjeon

AI & ML interests

Multimodal

Recent Activity

upvoted a paper about 21 hours ago

SARChat-Bench-2M: A Multi-Task Vision-Language Benchmark for SAR Image Interpretation

updated a collection about 21 hours ago

Multimodal Benchmarks

updated a collection about 21 hours ago

Multimodal Dataset

View all activity

Organizations

btjhjeon's activity

upvoted a paper about 21 hours ago

SARChat-Bench-2M: A Multi-Task Vision-Language Benchmark for SAR Image Interpretation

Paper • 2502.08168 • Published 2 days ago • 10

updated 2 collections about 21 hours ago

Multimodal Benchmarks

64 items • Updated about 21 hours ago • 8

Multimodal Dataset

28 items • Updated about 21 hours ago • 2

upvoted 3 papers 2 days ago

Scaling Pre-training to One Hundred Billion Data for Vision Language Models

Paper • 2502.07617 • Published 3 days ago • 22

Competitive Programming with Large Reasoning Models

Paper • 2502.06807 • Published 11 days ago • 53

Éclair -- Extracting Content and Layout with Integrated Reading Order for Documents

Paper • 2502.04223 • Published 8 days ago • 9

updated a collection 2 days ago

Multimodal LLM

163 items • Updated 2 days ago • 11

updated a collection 3 days ago

Multimodal LLM

163 items • Updated 2 days ago • 11

upvoted a paper 3 days ago

EVEv2: Improved Baselines for Encoder-Free Vision-Language Models

Paper • 2502.06788 • Published 4 days ago • 11

updated a collection 3 days ago

Multimodal Alignment

12 items • Updated 3 days ago • 1

upvoted a paper 3 days ago

The Hidden Life of Tokens: Reducing Hallucination of Large Vision-Language Models via Visual Information Steering

Paper • 2502.03628 • Published 9 days ago • 11

updated a collection 3 days ago

Multimodal LLM

163 items • Updated 2 days ago • 11

upvoted a paper 3 days ago

Show-o Turbo: Towards Accelerated Unified Multimodal Understanding and Generation

Paper • 2502.05415 • Published 6 days ago • 16

updated a collection 4 days ago

Multimodal LLM

163 items • Updated 2 days ago • 11

upvoted a paper 4 days ago

VideoRoPE: What Makes for Good Video Rotary Position Embedding?

Paper • 2502.05173 • Published 7 days ago • 60

updated a collection 7 days ago

Multimodal LLM

163 items • Updated 2 days ago • 11

upvoted a paper 7 days ago

Ola: Pushing the Frontiers of Omni-Modal Language Model with Progressive Modality Alignment

Paper • 2502.04328 • Published 8 days ago • 21

updated a collection 8 days ago

Multimodal Alignment

12 items • Updated 3 days ago • 1

upvoted a paper 8 days ago

Boosting Multimodal Reasoning with MCTS-Automated Structured Thinking

Paper • 2502.02339 • Published 10 days ago • 19

updated a collection 8 days ago

Multimodal LLM

163 items • Updated 2 days ago • 11