OneThinker：图像与视频的一体化推理模型

Research #Multimodal AI 🔬 Research|分析: 2026年1月10日 13:25•

发布: 2025年12月2日 18:59

•

1分で読める

分析

OneThinker，一个用于图像和视频的一体化推理模型的发布，标志着多模态人工智能的进步。需要进一步评估其性能和实际应用，才能与现有模型进行比较。

引用 / 来源

"OneThinker is a reasoning model for image and video."

ArXiv2025年12月2日 18:59

* 根据版权法第32条进行合法引用。

Video2Act: Novel Robotic Action Generation via Video Diffusion

Continuous Ethical Evaluation for Large Language Models