因果政策フォレストによるエンドツーエンドのポリシー学習

公開:2025年12月28日 09:03
1分で読める
ArXiv

分析

本論文は、因果推論におけるポリシー学習のための新しいアルゴリズム、因果政策フォレストを提案しています。ポリシー価値の最大化とCATE推定の関連性を利用し、実用的で効率的なエンドツーエンドのアプローチを提供します。アルゴリズムの簡潔さ、エンドツーエンドのトレーニング、および計算効率は重要な利点であり、CATE推定とポリシー学習のギャップを埋める可能性があります。

参照

アルゴリズムは、よりエンドツーエンドな方法でポリシーをトレーニングします。