Research#LLM Alignment🔬 Research分析: 2026年1月10日 14:47

W2S-AlignTree:通过蒙特卡洛树搜索在推理时增强大型语言模型对齐

发布:2025年11月14日 17:42
1分で読める
ArXiv

分析

这项研究介绍了 W2S-AlignTree,这是一种在推理过程中改进大型语言模型 (LLM) 对齐的新方法。这种方法利用蒙特卡洛树搜索来指导对齐过程,可能导致更可靠和可控的 LLM 输出。

引用

W2S-AlignTree 在推理时使用蒙特卡洛树搜索进行对齐。