SenseNova-MARS:基于强化学习的工具使用Agent推理

Research Paper#Vision-Language Models, Agentic Reasoning, Reinforcement Learning🔬 Research|分析: 2026年1月3日 15:38
发布: 2025年12月30日 16:31
1分で読める
ArXiv

分析

本文介绍了SenseNova-MARS,一个新颖的框架,通过agent推理和工具使用能力增强了视觉语言模型(VLMs),特别侧重于整合搜索和图像处理工具。使用强化学习(RL)和引入HR-MMSearch基准是关键贡献。论文声称在某些基准测试中达到了最先进的性能,甚至超越了专有模型,这非常重要。代码、模型和数据集的发布进一步促进了该领域的可重复性和研究。
引用 / 来源
查看原文
"SenseNova-MARS achieves state-of-the-art performance on open-source search and fine-grained image understanding benchmarks. Specifically, on search-oriented benchmarks, SenseNova-MARS-8B scores 67.84 on MMSearch and 41.64 on HR-MMSearch, surpassing proprietary models such as Gemini-3-Flash and GPT-5."
A
ArXiv2025年12月30日 16:31
* 根据版权法第32条进行合法引用。