Research#llm🔬 Research分析: 2025年12月25日 00:49

推論時探索のための熱力学的焦点合わせ:ターゲット条件付きサンプリングのための新しいアルゴリズム

公開:2025年12月24日 05:00
1分で読める
ArXiv ML

分析

この論文では、言語生成、計画、強化学習において特に重要な、大規模な候補空間でまれではあるが有用な解を見つけるという課題に対処するための新しいアプローチである、反転因果焦点合わせアルゴリズム(ICFA)を紹介しています。ICFAは、ターゲット条件付きの重み付けを利用し、既存のサンプラーと類似性関数を再利用して、焦点の合ったサンプリング分布を作成します。この論文では、実装のための実用的なレシピ、安定性診断、およびその有効性の理論的根拠を提供します。制約付き言語生成とスパース報酬ナビゲーションにおける再現可能な実験の包含は、主張を強化します。プロンプトによる推論との関連性も興味深く、アルゴリズムベースの検索戦略と言語ベースの検索戦略の間の潜在的な橋渡しを示唆しています。焦点合わせ強度の適応制御は、縮退を回避するための重要な貢献です。

参照

我々は、探索をターゲット条件付きの重み付けプロセスとして扱う実用的なフレームワークである\emph{反転因果焦点合わせアルゴリズム}(ICFA)を提示します。