用于文本到动作生成的潜在动作推理

发布:2025年12月30日 09:17
1分で読める
ArXiv

分析

本文解决了文本到动作 (T2M) 生成中的语义-运动学阻抗失配问题。它提出了一种两阶段方法,即潜在动作推理 (LMR),灵感来自分层运动控制,以提高语义对齐和物理合理性。核心思想是使用双粒度分词器将动作规划(推理)与动作执行(行动)分开。

引用

论文认为,动作规划的最佳基础不是自然语言,而是一个学习到的、与动作对齐的概念空间。