Image-Text Alignment - a oguzhanercan Collection

oguzhanercan 's Collections

Training Theory

Image-Text Alignment

Control Based Video Generation Models

Video Generation Backbone Models

Video Generation Style Models

Image-Video General Tasks

Generation Quality Enhancement

Diffusion/Flow Model Optimization

Voice

Mobile Generative Models

Video Generation Control-Style Transfer

Diffusion-Score-Flow Guidance

Image Restoration (SR , Inpainting etc.)

Image-Video MultiModal Understanding

Face Generation-Swap-Contol-Edit

Architectural Proposals

Generative Modeling Approachs

Video Generation

Diffusion Model Control

Image Generation

Image-Text Alignment

updated 7 days ago

QLIP: Text-Aligned Visual Tokenization Unifies Auto-Regressive Multimodal Understanding and Generation

Paper • 2502.05178 • Published 12 days ago • 10