STARCaster: 基于时空自回归视频扩散的身份和视角感知型说话头像生成
发布:2025年12月15日 11:59
•1分で読める
•ArXiv
分析
STARCaster 论文侧重于用于说话头像生成的视频扩散,代表了创建逼真且可控的虚拟化身的重要一步。时空自回归建模的使用表明这是一种捕捉身份和视角感知能力的复杂方法。
引用
“该研究来自ArXiv。”
关于video diffusion的新闻、研究和更新。由AI引擎自动整理。
“该研究来自ArXiv。”
“该研究来源于ArXiv。”
“利用视频扩散生成感知环境的机器人数据合成”
“该论文利用双系统视频扩散策略来实现机器人动作。”