MiniMax-M2.1 GGUF模型发布

Research#llm📝 Blog|分析: 2025年12月26日 16:14
发布: 2025年12月26日 15:33
1分で読める
r/LocalLLaMA

分析

这篇Reddit帖子宣布了MiniMax-M2.1 GGUF模型在Hugging Face上的发布。作者分享了使用NVIDIA A100 GPU进行测试的性能指标,包括提示处理和生成的每秒token数。他们还列出了测试期间使用的模型参数,例如上下文大小、温度和top_p。该帖子作为一个简短的公告和性能展示,作者正在积极寻找AI/LLM工程领域的工作机会。对于那些对本地LLM实现和性能基准感兴趣的人来说,这篇文章很有用。
引用 / 来源
查看原文
"[ Prompt: 28.0 t/s | Generation: 25.4 t/s ]"
R
r/LocalLLaMA2025年12月26日 15:33
* 根据版权法第32条进行合法引用。