音声トランスクリプトの段落分割

Paper#speech processing, text segmentation, natural language processing🔬 Research|分析: 2026年1月3日 09:23
公開: 2025年12月30日 23:29
1分で読める
ArXiv

分析

この論文は、読みやすさと再利用性を向上させるために、段落分割を導入することにより、構造化されていない音声トランスクリプトの問題に対処しています。 音声に特化した新しいベンチマーク(TEDParaとYTSegPara)を確立し、大規模言語モデル向けの制約付きデコーディング方法を提案し、最先端の結果を達成するコンパクトモデル(MiniSeg)を紹介しています。 この研究は、音声処理とテキストセグメンテーションのギャップを埋め、音声データを構造化するための実用的なソリューションとリソースを提供します。
引用・出典
原文を見る
"The paper establishes TEDPara and YTSegPara as the first benchmarks for the paragraph segmentation task in the speech domain."
A
ArXiv2025年12月30日 23:29
* 著作権法第32条に基づく適法な引用です。