BeDiscovER: 推論型言語モデルにおける談話理解の評価

Research #LLMs 🔬 Research|分析: 2026年1月10日 14:42•

公開: 2025年11月17日 07:50

•

1分で読める

分析

この記事では、推論型言語モデルにおける談話理解を評価するためのベンチマーク、BeDiscovERを紹介しています。これは、談話理解という複雑なタスクに対する具体的な評価フレームワークを提供するため、価値のある貢献です。

引用・出典

"BeDiscovER is a benchmark for discourse understanding."

ArXiv2025年11月17日 07:50

* 著作権法第32条に基づく適法な引用です。

Assessing LLMs for CONSORT Guideline Adherence in Clinical Trials

Evaluating BLI as an Alignment Metric in Word Embeddings