iSHIFT: 軽量GUIエージェントと適応型知覚

Research Paper#GUI Agents, MLLMs, AI🔬 Research|分析: 2026年1月3日 20:17
公開: 2025年12月26日 12:09
1分で読める
ArXiv

分析

この論文は、グラフィカルユーザーインターフェース(GUI)との効率的かつ正確なインタラクションのために設計された、新しい軽量GUIエージェントであるiSHIFTを紹介しています。主な貢献は、正確性のための詳細な視覚的グラウンディングと効率性のためのグローバルキューを切り替えることができる、そのスローファストハイブリッド推論アプローチにあります。注意を誘導するための知覚トークンの使用と、エージェントが推論の深さを適応させる能力も重要です。コンパクトな2.5Bモデルで最先端のパフォーマンスを達成するという論文の主張は特に注目に値し、リソース効率の高いGUIエージェントの可能性を示唆しています。
引用・出典
原文を見る
"iSHIFT matches state-of-the-art performance on multiple benchmark datasets."
A
ArXiv2025年12月26日 12:09
* 著作権法第32条に基づく適法な引用です。