Video understanding - a Salwa-Zeitoun Collection

Salwa-Zeitoun 's Collections

Autonomous vehicles (AV)

Video understanding

AI Music Models

Reasoning Capabilities

Multimodal Models

Diffusion models

Video understanding

updated Jan 8

ByteDance/Sa2VA-1B

Image-Text-to-Text • Updated 25 days ago • 1.45k • 16