MSched: 通过主动内存调度的GPU多任务处理

发布:2025年12月31日 05:18
1分で読める
ArXiv

分析

本文解决了现代GPU中关键的内存瓶颈问题,尤其是在LLM等大规模任务的需求不断增长的情况下。它提出了MSched,一个OS级别的调度器,通过预测和准备工作集来主动管理GPU内存。这种方法旨在减轻由需求分页引起的性能下降,需求分页是一种扩展GPU内存的常用技术,但由于局部性差而导致显着的减速。核心创新在于利用GPU内存访问模式的可预测性来优化页面放置并减少页面错误开销。结果表明,MSched在性能上优于需求分页,这使得MSched对GPU资源管理做出了重大贡献。

引用

MSched在科学和深度学习工作负载上比需求分页提高了高达11.05倍,在内存超额订阅下,LLM提高了57.88倍。