关于持续学习的计算嵌入视角

发布:2025年12月29日 12:31
1分で読める
ArXiv

分析

本文通过将智能体构建为通用计算机内的计算嵌入式自动机,引入了关于持续学习的新视角。这种方法为理解和解决持续学习的挑战提供了一种新方法,特别是在“大世界假设”的背景下。本文的优势在于其理论基础,建立了嵌入式智能体与部分可观测马尔可夫决策过程之间的联系。提出的“交互性”目标和基于模型的强化学习算法为评估和改进持续学习能力提供了具体的框架。深度线性网络和非线性网络的比较为模型容量对持续交互性的影响提供了宝贵的见解。

引用

本文引入了一种计算嵌入式视角,将嵌入式智能体表示为在通用(形式)计算机内模拟的自动机。