ShowUI-$π$: 基于流的生成模型,用于GUI灵巧操作

Research Paper#GUI Agents, Flow-based Generative Models, Dexterous Manipulation🔬 Research|分析: 2026年1月3日 06:18
发布: 2025年12月31日 16:51
1分で読める
ArXiv

分析

本文介绍了ShowUI-$π$,一种使用基于流的生成模型进行GUI代理控制的新方法。它解决了现有代理依赖离散点击预测的局限性,从而实现了连续的、闭环的轨迹,例如拖动。这项工作的意义在于其创新的架构、新基准(ScreenDrag)的创建,以及与现有专有代理相比表现出色的性能,突出了在数字环境中实现更类似人类交互的潜力。
引用 / 来源
查看原文
"ShowUI-$π$ achieves 26.98 with only 450M parameters, underscoring both the difficulty of the task and the effectiveness of our approach."
A
ArXiv2025年12月31日 16:51
* 根据版权法第32条进行合法引用。