MiniMax科技发布全球首个开源大型推理模型M1，创新技术显著提升性能与性价比

时间：2025-06-18 01:55

小编：星品数码网

6月17日，MiniMax稀宇科技正式宣布推出全球首个开源的大规模推理模型MiniMax-M1，标志着技术创新在人工智能领域的新一步。此次发布是MiniMax连续五天重大更新中的第一波，充分展示了该公司的技术实力和市场前瞻性。

MiniMax-M1的推出不仅是技术进步的象征，更是开放源代码理念的进一步实施。根据官方介绍，MiniMax-M1采用混合架构的设计，专为复杂的生产力场景优化，具有超越国内传统闭源模型的能力，并与国外领先模型相媲美。同时，MiniMax致力于提供行业内最高的性价比，使得AI应用不再是资源密集型企业的专属。

创新技术背后的效率

MiniMax-M1具备两大技术创新，使整个模型的训练过程异常高效。该模型的强化学习训练阶段只用了3周时间，搭载512块H800 GPU，最终算力租赁成本仅为53.47万美元（约合384.1万人民币）。这一数据远低于早期的预期，显示出MiniMax在成本控制与资源利用上的显著优势。

在输入数据处理能力上，MiniMax-M1的上下文支持高达100万，堪比业界顶尖的闭源模型Google Gemini 2.5 Pro，并在长达8万Token的推理输出中展现了强大的算力效率。通过独创的闪电注意力机制，MiniMax-M1在处理复杂的上下文信息及深层推理时表现出色，所需的算力仅为DeepSeek R1的30%，实现了极大的算力节省。

强化学习算法的新突破

MiniMax还开发了一种新型的强化学习算法CISPO，该算法通过裁剪重要性采样权重，代替传统的token更新方式，显著加快了训练的收敛速度。在AIME的实验中，CISPO算法的表现优于市场上目前许多主流的强化学习算法，如字节最近推出的DAPO等。这样的进步让MiniMax-M1在强化学习阶段展现了前所未有的效率，实际的训练时间与成本大幅低于初始预期。

在多项基准测试中的优秀表现

MiniMax-M1在众多评测集上表现出色，其中在软件工程领域的SWE-bench验证基准上，MiniMax-M1-40k和MiniMax-M1-80k分别获得了55.6%和56.0%的高分。虽然这一成绩略低于DeepSeek-R1-0528的57.6%，但依旧远超其他开源权重模型，显示出MiniMax-M1在行业中的强势地位。

在长上下文理解任务中，MiniMax-M1系列通过百万级上下文窗口展现了极佳的绩效，超越了所有开源权重模型，并在全球范围内达到第二名的水平，紧随Gemini 2.5 Pro之后。在代理工具使用场景（TAU-bench）测试中，MiniMax-M1-40k也成功战胜了Gemini-2.5 Pro，巩固了其市场领导地位。

灵活的使用与推广策略

为进一步促进MiniMax-M1的应用，MiniMax科技提供了灵活且经济的使用计划。在输入长度0-32k的情况下，每百万Token的输入仅需0.8元，输出则为8元；而在32k-128k的输入长度时，费用分别为1.2元和16元；对于最长输入长度的128k-1M，输入费用为2.4元，输出为24元。这些价格不仅相对DeepSeek-R1具有更高的性价比，甚至在某些输入长度模式下DeepSeek模型无法提供对应的支持。

MiniMax还与vLLM和Transformer两个开源项目合作，提供推理部署的支持，开发出具备高效推理性能的产品。为了用户使用的便利性，MiniMax在其App和Web上提供不限量的免费使用，确保用户能够充分体验到MiniMax-M1带来的全新AI体验。

展望未来

MiniMax-M1的发布不仅仅是技术上的一次突破，更是开源生态的构建。未来几天，MiniMax将陆续推出其他一系列的更新与功能，进一步扩展其在AI领域的影响力。通过不断的创新和开放，MiniMax科技不仅在推动自身的发展，更为全球AI行业的发展作出了积极贡献。

随着开源大型推理模型MiniMax-M1的发布，MiniMax稀宇科技在技术进步与市场竞争中赢得了更大的话语权，这一切都彰显了其在全球人工智能领域的重要地位与影响力。

MiniMax科技发布全球首个开源大型推理模型M1，创新技术显著提升性能与性价比

精品推荐

相关文章