Kling-Omni:一种基于多模态输入的电影级视频生成AI框架

Research#Computer Vision🔬 Research|分析: 2026年1月26日 11:41
发布: 2025年12月18日 17:08
1分で読める
ArXiv

分析

Kling-Omni 技术报告介绍了一种新颖的通用生成框架,该框架旨在直接从多模态视觉语言输入生成高保真视频。这个端到端系统将各种视频生成、编辑和推理任务集成到一个统一的模型中,提供了超越传统流水线方法的重大进步。
引用 / 来源
查看原文
"We present Kling-Omni, a generalist generative framework designed to synthesize high-fidelity videos directly from multimodal visual language inputs."
A
ArXiv2025年12月18日 17:08
* 根据版权法第32条进行合法引用。