SenseNova-MARS：基于强化学习的工具使用Agent推理

Research Paper #Vision-Language Models, Agentic Reasoning, Reinforcement Learning 🔬 Research|分析: 2026年1月3日 15:38•

发布: 2025年12月30日 16:31

•

1分で読める

分析

本文介绍了SenseNova-MARS，一个新颖的框架，通过agent推理和工具使用能力增强了视觉语言模型（VLMs），特别侧重于整合搜索和图像处理工具。使用强化学习（RL）和引入HR-MMSearch基准是关键贡献。论文声称在某些基准测试中达到了最先进的性能，甚至超越了专有模型，这非常重要。代码、模型和数据集的发布进一步促进了该领域的可重复性和研究。

要点

引用 / 来源

查看原文

"SenseNova-MARS achieves state-of-the-art performance on open-source search and fine-grained image understanding benchmarks. Specifically, on search-oriented benchmarks, SenseNova-MARS-8B scores 67.84 on MMSearch and 41.64 on HR-MMSearch, surpassing proprietary models such as Gemini-3-Flash and GPT-5."

ArXiv2025年12月30日 16:31

* 根据版权法第32条进行合法引用。

较旧

Introducing OpenAI Dublin

较新

Cool Machine Learning Books

SenseNova-MARS：基于强化学习的工具使用Agent推理

分析

要点

相关分析

SpaceTimePilot：时空控制的生成视频渲染

量子混沌哈密顿量演化下的随机性生成

GaMO：几何感知扩散用于稀疏视角3D重建

📬 获取AI新闻

按类别浏览

热门话题

📬 获取AI新闻

按类别浏览

热门话题