KernelEvolve:异构AI加速器的自动内核优化

Paper#AI Hardware Optimization🔬 Research|分析: 2026年1月3日 16:10
发布: 2025年12月29日 06:31
1分で読める
ArXiv

分析

本文解决了为不同硬件架构优化深度学习推荐模型(DLRM)的关键挑战。 KernelEvolve 提供了一个代理内核编码框架,该框架可自动进行内核生成和优化,从而显着减少了开发时间,并提高了各种 GPU 和定制 AI 加速器的性能。 专注于异构硬件和自动化优化对于扩展 AI 工作负载至关重要。
引用 / 来源
查看原文
"KernelEvolve reduces development time from weeks to hours and achieves substantial performance improvements over PyTorch baselines."
A
ArXiv2025年12月29日 06:31
* 根据版权法第32条进行合法引用。