ShowUI-$π$: 基于流的生成模型,用于GUI灵巧操作
Research Paper#GUI Agents, Flow-based Generative Models, Dexterous Manipulation🔬 Research|分析: 2026年1月3日 06:18•
发布: 2025年12月31日 16:51
•1分で読める
•ArXiv分析
本文介绍了ShowUI-$π$,一种使用基于流的生成模型进行GUI代理控制的新方法。它解决了现有代理依赖离散点击预测的局限性,从而实现了连续的、闭环的轨迹,例如拖动。这项工作的意义在于其创新的架构、新基准(ScreenDrag)的创建,以及与现有专有代理相比表现出色的性能,突出了在数字环境中实现更类似人类交互的潜力。