BeDiscovER：推理型语言模型中话语理解的基准测试

Research #LLMs 🔬 Research|分析: 2026年1月10日 14:42•

发布: 2025年11月17日 07:50

•

1分で読める

分析

本文介绍了BeDiscovER，这是一个用于评估推理语言模型中话语理解的基准。由于它为理解话语这一复杂任务提供了具体的评估框架，因此是一项有价值的贡献。

引用 / 来源

"BeDiscovER is a benchmark for discourse understanding."

ArXiv2025年11月17日 07:50

* 根据版权法第32条进行合法引用。

Assessing LLMs for CONSORT Guideline Adherence in Clinical Trials

Evaluating BLI as an Alignment Metric in Word Embeddings