スタイル分離とモダリティアライメントによるパーソナライズされた3Dトーキングヘッドアニメーション

Paper#Computer Vision, Speech Synthesis, 3D Animation🔬 Research|分析: 2026年1月3日 19:52
公開: 2025年12月27日 14:14
1分で読める
ArXiv

分析

この論文は、既存の音声駆動3Dトーキングヘッド生成方法の限界に対処し、パーソナライゼーションとリアリズムに焦点を当てています。PTalkerという新しいフレームワークを導入し、音声と顔の動きから話し方を分離し、リップシンクロナイゼーションの精度を向上させます。重要な貢献は、現実的で、個々のアイデンティティに特化した話し方を生成できることであり、これはこの分野における大きな進歩です。
引用・出典
原文を見る
"PTalker effectively generates realistic, stylized 3D talking heads that accurately match identity-specific speaking styles, outperforming state-of-the-art methods."
A
ArXiv2025年12月27日 14:14
* 著作権法第32条に基づく適法な引用です。