分析
这对使用本地LLM的任何人来说都是令人兴奋的消息! 一位用户发现,由于其较小的尺寸而经常被忽视的 MXFP4 量化,实际上在困惑度方面比 Q4_K_M 和 Q4_K_XL 表现更好。 这一发现可能会彻底改变我们优化 LLM 速度和效率的方式。
要点
* 根据版权法第32条进行合法引用。
这对使用本地LLM的任何人来说都是令人兴奋的消息! 一位用户发现,由于其较小的尺寸而经常被忽视的 MXFP4 量化,实际上在困惑度方面比 Q4_K_M 和 Q4_K_XL 表现更好。 这一发现可能会彻底改变我们优化 LLM 速度和效率的方式。