STARCaster: 基于时空自回归视频扩散的身份和视角感知型说话头像生成

发布: 2025年12月15日 11:59

•

1分で読める

分析

STARCaster 论文侧重于用于说话头像生成的视频扩散，代表了创建逼真且可控的虚拟化身的重要一步。时空自回归建模的使用表明这是一种捕捉身份和视角感知能力的复杂方法。

引用 / 来源

"The research is sourced from ArXiv."

ArXiv2025年12月15日 11:59

* 根据版权法第32条进行合法引用。

Advancing Ambulatory Vision: Active View Selection with Visual Grounding

RPO: Improving AI Alignment with Hint-Guided Reflection