基于流式扩散模型的实时交互式人类化身

发布:2025年12月26日 15:41
1分で読める
ArXiv

分析

本文解决了创建实时交互式人类化身的挑战,这是数字人类研究中的一个关键领域。它解决了现有基于扩散的方法的局限性,这些方法计算成本高昂且不适合流式传输,以及当前交互式方法的范围受限的问题。所提出的两阶段框架,结合了自回归适应和加速,以及诸如 Reference Sink 和 Consistency-Aware Discriminator 等新组件,旨在实时生成具有自然手势和行为的高保真度化身。本文的重要性在于它有可能实现更具吸引力和更逼真的数字人类交互。

引用

本文提出了一个两阶段的自回归适应和加速框架,以使高保真度的人类视频扩散模型适应实时交互式流式传输。