Paper#llm🔬 Research分析: 2026年1月3日 17:03

自己批評によるLLMの計画能力向上

公開:2025年12月30日 09:23
1分で読める
ArXiv

分析

本論文は、大規模言語モデル(LLM)の計画タスクを改善するための新しいアプローチを示しています。外部の検証者を使用せずに、LLMが自身の回答を自己批評する、内在的な自己批評に焦点を当てています。Blocksworld、Logistics、Mini-gridなどの計画ベンチマークで、強力なベースラインを上回る顕著なパフォーマンス向上が示されています。内在的な自己改善に焦点を当てたこの方法は、さまざまなLLMバージョンに適用可能であり、より複雑な検索技術やより高性能なモデルを用いたさらなる進歩につながる可能性があります。

参照

本論文は、検証者などの外部ソースを使用せずに、内在的な自己批評を通じて、Blocksworldドメインの計画データセットで顕著なパフォーマンス向上を示しています。