iSHIFT:具有自适应感知的轻量级GUI代理
Research Paper#GUI Agents, MLLMs, AI🔬 Research|分析: 2026年1月3日 20:17•
发布: 2025年12月26日 12:09
•1分で読める
•ArXiv分析
本文介绍了 iSHIFT,一种新型轻量级 GUI 代理,旨在与图形用户界面进行高效且精确的交互。其核心贡献在于其慢-快混合推理方法,允许代理在用于精确性的详细视觉定位和用于效率的全局提示之间切换。使用感知令牌来引导注意力以及代理适应推理深度的能力也很重要。该论文声称使用紧凑的 2.5B 模型实现了最先进的性能,这一点尤其值得关注,这表明了资源高效的 GUI 代理的潜力。