马丁格尔分数：用于评估LLM推理中贝叶斯理性的无监督指标

Research #LLM 🔬 Research|分析: 2026年1月10日 13:26•

发布: 2025年12月2日 16:34

•

1分で読める

分析

这篇 ArXiv 论文介绍了马丁格尔分数，这是一种无监督指标，旨在评估大型语言模型 (LLM) 推理中的贝叶斯理性。该研究为不断发展的 LLM 评估领域做出了贡献，为改进模型理解和改进提供了潜在的工具。

引用 / 来源

"The paper likely presents a novel metric for evaluating the Bayesian rationality of LLMs."

ArXiv2025年12月2日 16:34

* 根据版权法第32条进行合法引用。

Unveiling Internal Conflicts: Psychometric Jailbreaks Expose Frontier Models' Vulnerabilities

Information-Theoretic Constraints on Quantum Optimization: A Deep Dive