半重叠多臂老虎机用于支持网络学习

发布:2025年12月31日 16:42
1分で読める
ArXiv

分析

本文介绍了一种新的框架,顺序支持网络学习(SSNL),以解决在评估共享且计算密集型、复杂的AI/ML场景中识别最佳候选者的问题。它提出了一个新的纯探索模型,半重叠多臂老虎机(SOMMAB),并开发了一种具有改进误差界限的广义GapE算法。这项工作的意义在于为适用于多任务学习和联邦学习等各种学习问题的顺序学习工具提供了理论基础和性能保证。

引用

本文介绍了半重叠多臂老虎机(SOMMAB),其中由于其臂之间的结构重叠,单个评估为多个老虎机提供了不同的反馈。