KernelEvolve：异构AI加速器的自动内核优化

发布: 2025年12月29日 06:31

•

1分で読める

分析

本文解决了为不同硬件架构优化深度学习推荐模型（DLRM）的关键挑战。 KernelEvolve 提供了一个代理内核编码框架，该框架可自动进行内核生成和优化，从而显着减少了开发时间，并提高了各种 GPU 和定制 AI 加速器的性能。专注于异构硬件和自动化优化对于扩展 AI 工作负载至关重要。

引用 / 来源

"KernelEvolve reduces development time from weeks to hours and achieves substantial performance improvements over PyTorch baselines."

ArXiv2025年12月29日 06:31

* 根据版权法第32条进行合法引用。

OpenAI Technical Goals

OpenAI has upped its lobbying efforts nearly sevenfold