iSHIFT: 軽量GUIエージェントと適応型知覚
Research Paper#GUI Agents, MLLMs, AI🔬 Research|分析: 2026年1月3日 20:17•
公開: 2025年12月26日 12:09
•1分で読める
•ArXiv分析
この論文は、グラフィカルユーザーインターフェース(GUI)との効率的かつ正確なインタラクションのために設計された、新しい軽量GUIエージェントであるiSHIFTを紹介しています。主な貢献は、正確性のための詳細な視覚的グラウンディングと効率性のためのグローバルキューを切り替えることができる、そのスローファストハイブリッド推論アプローチにあります。注意を誘導するための知覚トークンの使用と、エージェントが推論の深さを適応させる能力も重要です。コンパクトな2.5Bモデルで最先端のパフォーマンスを達成するという論文の主張は特に注目に値し、リソース効率の高いGUIエージェントの可能性を示唆しています。