音声トランスクリプトの段落分割
Paper#speech processing, text segmentation, natural language processing🔬 Research|分析: 2026年1月3日 09:23•
公開: 2025年12月30日 23:29
•1分で読める
•ArXiv分析
この論文は、読みやすさと再利用性を向上させるために、段落分割を導入することにより、構造化されていない音声トランスクリプトの問題に対処しています。 音声に特化した新しいベンチマーク(TEDParaとYTSegPara)を確立し、大規模言語モデル向けの制約付きデコーディング方法を提案し、最先端の結果を達成するコンパクトモデル(MiniSeg)を紹介しています。 この研究は、音声処理とテキストセグメンテーションのギャップを埋め、音声データを構造化するための実用的なソリューションとリソースを提供します。