推理模型在控制其“思维链”方面展现潜力

research#llm🔬 Research|分析: 2026年3月9日 04:02
发布: 2026年3月9日 04:00
1分で読める
ArXiv AI

分析

这项研究探索了我们如何理解和控制大型语言模型 (LLM) 行为的一个引人入胜的新维度。 CoT-Control 评估套件的开发是向前迈出的重要一步,使我们能够测试和改进推理模型的可靠性。
引用 / 来源
查看原文
"我们表明,推理模型的CoT可控性明显低于输出可控性;例如,Claude Sonnet 4.5 只能在 2.7% 的时间内控制其 CoT,但在控制其最终输出时为 61.9%。"
A
ArXiv AI2026年3月9日 04:00
* 根据版权法第32条进行合法引用。