基于信念空间的离散观测最优控制

发布:2025年12月31日 15:20
1分で読める
ArXiv

分析

本文研究了随机最优控制中的一个具有挑战性的问题:当您只有间歇性的、有噪声的测量时,如何控制一个系统。作者巧妙地在“信念空间”(给定观测值的可能状态空间)上重新表述了这个问题,从而能够应用庞特里亚金最大值原理。关键贡献是针对这种混合设置量身定制的新的最大值原理,将其与动态规划和滤波方程联系起来。这提供了理论基础,并导致了一种实用的、基于粒子的数值方案,用于寻找近乎最优的控制。特别令人感兴趣的是对主动控制观测过程的关注。

引用

本文在信念空间上推导了庞特里亚金最大值原理,为这种混合设置中的最优性提供了必要条件。