谷歌Gemini 3 Flash推出突破性智能体视觉功能product#agent📝 Blog|分析: 2026年2月12日 02:30•发布: 2026年2月12日 10:17•1分で読める•InfoQ中国分析谷歌的Gemini 3 Flash引入了智能体视觉功能,将视觉推理与代码执行相结合,从而实现高度准确的、基于证据的回答。这种创新方法允许模型执行视觉调查,从而提高准确性,并为新的AI驱动行为打开了大门。这是使AI更直观、更有能力理解周围世界的重要一步。要点•智能体视觉使Gemini 3 Flash能够通过规划、操作和通过代码执行验证图像细节来执行视觉调查。•这种方法通过允许对图像进行细粒度检查并利用Python处理复杂任务来提高准确性,从而减少“幻觉”的发生。•谷歌计划将智能体视觉功能扩展到其他Gemini模型,并集成自动缩放和网络搜索等功能。引用 / 来源查看原文"Gemini 3 Flash不仅仅是一次性分析图像,而是以类似于智能体的方式进行视觉调查:规划步骤、操作图像,并在回答问题之前通过代码验证细节。"IInfoQ中国2026年2月12日 10:17* 根据版权法第32条进行合法引用。较旧China's GLM-5 AI: A New Contender in the Generative AI Race!较新Anthropic Pledges to Shield Consumers from AI's Energy Costs相关分析product微软推出三款创新多模态生成式人工智能模型2026年4月2日 18:00product谷歌Gemma 4:在手机上释放强大的本地AI!2026年4月2日 18:00productMeta 的 AI 眼镜终于服务于处方佩戴者!2026年4月2日 07:49来源: InfoQ中国