JEPA世界模型通过价值引导的行动规划得到增强
发布:2026年1月6日 05:00
•1分で読める
•ArXiv ML
分析
本文通过将价值函数纳入表示空间,解决了JEPA模型在行动规划中的一个关键限制。所提出的使用距离度量来近似负目标条件价值函数来塑造表示空间的方法是一种新颖的方法。在训练过程中强制执行此约束的实用方法以及所展示的性能改进是重要的贡献。
引用
“我们提出了一种通过塑造JEPA世界模型的表示空间来增强规划的方法,使得给定环境中到达成本的负目标条件价值函数由状态嵌入之间的距离(或准距离)近似。”