KernelEvolve:异构AI加速器的自动内核优化Paper#AI Hardware Optimization🔬 Research|分析: 2026年1月3日 16:10•发布: 2025年12月29日 06:31•1分で読める•ArXiv分析本文解决了为不同硬件架构优化深度学习推荐模型(DLRM)的关键挑战。 KernelEvolve 提供了一个代理内核编码框架,该框架可自动进行内核生成和优化,从而显着减少了开发时间,并提高了各种 GPU 和定制 AI 加速器的性能。 专注于异构硬件和自动化优化对于扩展 AI 工作负载至关重要。要点•KernelEvolve 自动化了跨异构硬件的 DLRM 内核生成和优化。•该框架使用基于图的搜索,并带有选择策略和适应度函数进行优化。•它实现了显着的性能提升并缩短了开发时间。•KernelEvolve 支持各种 GPU(NVIDIA、AMD)和 Meta 的 AI 加速器。引用 / 来源查看原文"KernelEvolve reduces development time from weeks to hours and achieves substantial performance improvements over PyTorch baselines."AArXiv2025年12月29日 06:31* 根据版权法第32条进行合法引用。较旧OpenAI Technical Goals较新OpenAI has upped its lobbying efforts nearly sevenfold相关分析Paper基于选择策略的协调人形机器人操作2026年1月3日 06:10Paper从未对齐图像即时进行3D场景编辑2026年1月3日 06:10Paper用于未来预测的LLM预测2026年1月3日 06:10来源: ArXiv