W2S-AlignTree:通过蒙特卡洛树搜索在推理时增强大型语言模型对齐

Research#LLM Alignment🔬 Research|分析: 2026年1月10日 14:47
发布: 2025年11月14日 17:42
1分で読める
ArXiv

分析

这项研究介绍了 W2S-AlignTree,这是一种在推理过程中改进大型语言模型 (LLM) 对齐的新方法。这种方法利用蒙特卡洛树搜索来指导对齐过程,可能导致更可靠和可控的 LLM 输出。
引用 / 来源
查看原文
"W2S-AlignTree uses Monte Carlo Tree Search for inference-time alignment."
A
ArXiv2025年11月14日 17:42
* 根据版权法第32条进行合法引用。