分析
本文讨论了在 gpt-oss-20b 模型的推理中,CPU 性能优于 GPU 的基准测试。它重点介绍了 OrangePi 6 中 CIX CD8160 ARM CPU 相对于 Immortalis G720 MC10 GPU 的性能。文章可能会深入探讨这一意外结果背后的原因,可能探讨诸如优化软件 (llama.cpp)、CPU 架构在特定工作负载中的优势以及内存带宽考虑因素等因素。对于 ARM CPU 普遍存在的边缘 AI 和嵌入式系统来说,这是一个潜在的重要发现。
要点
引用
“在 CPU 上推理 gpt-oss-20b 比 GPU 快得多。”