谷歌Gemini 3 Flash推出突破性智能体视觉功能

product #agent 📝 Blog|分析: 2026年2月12日 02:30•

发布: 2026年2月12日 10:17

•

1分で読める

分析

谷歌的Gemini 3 Flash引入了智能体视觉功能，将视觉推理与代码执行相结合，从而实现高度准确的、基于证据的回答。这种创新方法允许模型执行视觉调查，从而提高准确性，并为新的AI驱动行为打开了大门。这是使AI更直观、更有能力理解周围世界的重要一步。

引用 / 来源

"Gemini 3 Flash不仅仅是一次性分析图像，而是以类似于智能体的方式进行视觉调查：规划步骤、操作图像，并在回答问题之前通过代码验证细节。"

InfoQ中国2026年2月12日 10:17

* 根据版权法第32条进行合法引用。

China's GLM-5 AI: A New Contender in the Generative AI Race!

Anthropic Pledges to Shield Consumers from AI's Energy Costs