Avoiding the Price of Adaptivity: Inference in Linear Contextual Bandits via Stability

Research#llm🔬 Research|分析: 2025年12月25日 04:31
发布: 2025年12月24日 05:00
1分で読める
ArXiv Stats ML

分析

This ArXiv paper addresses a critical challenge in contextual bandit algorithms: the \

要点

    引用 / 来源
    查看原文
    "When stability holds, the ordinary least-squares estimator satisfies a central limit theorem, and classical Wald-type confidence intervals -- designed for i.i.d. data -- become asymptotically valid even under adaptation, \emph{without} incurring the $\\sqrt{d \\log T}$ price of adaptivity."
    A
    ArXiv Stats ML2025年12月24日 05:00
    * 根据版权法第32条进行合法引用。