避免适应性的代价：通过稳定性在线性上下文老虎机中的推理

Research #llm 🔬 Research|分析: 2026年1月4日 07:32•

发布: 2025年12月23日 13:53

•

1分で読める

分析

这篇文章来自ArXiv，很可能是一篇研究论文。标题表明重点是提高线性上下文老虎机框架内的推理效率。“适应性的代价”这句话暗示了一种权衡，可能是在探索和利用之间，或者计算成本和性能之间。“稳定性”的使用表明了一种解决这种权衡的新方法，可能通过提高推理过程的鲁棒性或收敛性。

引用 / 来源

"Avoiding the Price of Adaptivity: Inference in Linear Contextual Bandits via Stability"

ArXiv2025年12月23日 13:53

* 根据版权法第32条进行合法引用。

Ask HN: In which areas have you compared 3+ tools and formed strong preferences?

How to Run Llama 3 405B on Home Devices? Build AI Cluster