免费安卓手游下载、分享游戏下载、电脑硬件、数码科技最前沿咨询
当前位置: 首页 > 硬件资讯 > MiniMax科技发布全球首个开源大型推理模型M1,创新技术显著提升性能与性价比

MiniMax科技发布全球首个开源大型推理模型M1,创新技术显著提升性能与性价比

时间:2025-06-18 01:55

小编:星品数码网

6月17日,MiniMax稀宇科技正式宣布推出全球首个开源的大规模推理模型MiniMax-M1,标志着技术创新在人工智能领域的新一步。此次发布是MiniMax连续五天重大更新中的第一波,充分展示了该公司的技术实力和市场前瞻性。

MiniMax-M1的推出不仅是技术进步的象征,更是开放源代码理念的进一步实施。根据官方介绍,MiniMax-M1采用混合架构的设计,专为复杂的生产力场景优化,具有超越国内传统闭源模型的能力,并与国外领先模型相媲美。同时,MiniMax致力于提供行业内最高的性价比,使得AI应用不再是资源密集型企业的专属。

创新技术背后的效率

MiniMax-M1具备两大技术创新,使整个模型的训练过程异常高效。该模型的强化学习训练阶段只用了3周时间,搭载512块H800 GPU,最终算力租赁成本仅为53.47万美元(约合384.1万人民币)。这一数据远低于早期的预期,显示出MiniMax在成本控制与资源利用上的显著优势。

在输入数据处理能力上,MiniMax-M1的上下文支持高达100万,堪比业界顶尖的闭源模型Google Gemini 2.5 Pro,并在长达8万Token的推理输出中展现了强大的算力效率。通过独创的闪电注意力机制,MiniMax-M1在处理复杂的上下文信息及深层推理时表现出色,所需的算力仅为DeepSeek R1的30%,实现了极大的算力节省。

强化学习算法的新突破

MiniMax还开发了一种新型的强化学习算法CISPO,该算法通过裁剪重要性采样权重,代替传统的token更新方式,显著加快了训练的收敛速度。在AIME的实验中,CISPO算法的表现优于市场上目前许多主流的强化学习算法,如字节最近推出的DAPO等。这样的进步让MiniMax-M1在强化学习阶段展现了前所未有的效率,实际的训练时间与成本大幅低于初始预期。

在多项基准测试中的优秀表现

MiniMax-M1在众多评测集上表现出色,其中在软件工程领域的SWE-bench验证基准上,MiniMax-M1-40k和MiniMax-M1-80k分别获得了55.6%和56.0%的高分。虽然这一成绩略低于DeepSeek-R1-0528的57.6%,但依旧远超其他开源权重模型,显示出MiniMax-M1在行业中的强势地位。

在长上下文理解任务中,MiniMax-M1系列通过百万级上下文窗口展现了极佳的绩效,超越了所有开源权重模型,并在全球范围内达到第二名的水平,紧随Gemini 2.5 Pro之后。在代理工具使用场景(TAU-bench)测试中,MiniMax-M1-40k也成功战胜了Gemini-2.5 Pro,巩固了其市场领导地位。

灵活的使用与推广策略

为进一步促进MiniMax-M1的应用,MiniMax科技提供了灵活且经济的使用计划。在输入长度0-32k的情况下,每百万Token的输入仅需0.8元,输出则为8元;而在32k-128k的输入长度时,费用分别为1.2元和16元;对于最长输入长度的128k-1M,输入费用为2.4元,输出为24元。这些价格不仅相对DeepSeek-R1具有更高的性价比,甚至在某些输入长度模式下DeepSeek模型无法提供对应的支持。

MiniMax还与vLLM和Transformer两个开源项目合作,提供推理部署的支持,开发出具备高效推理性能的产品。为了用户使用的便利性,MiniMax在其App和Web上提供不限量的免费使用,确保用户能够充分体验到MiniMax-M1带来的全新AI体验。

展望未来

MiniMax-M1的发布不仅仅是技术上的一次突破,更是开源生态的构建。未来几天,MiniMax将陆续推出其他一系列的更新与功能,进一步扩展其在AI领域的影响力。通过不断的创新和开放,MiniMax科技不仅在推动自身的发展,更为全球AI行业的发展作出了积极贡献。

随着开源大型推理模型MiniMax-M1的发布,MiniMax稀宇科技在技术进步与市场竞争中赢得了更大的话语权,这一切都彰显了其在全球人工智能领域的重要地位与影响力。

精品推荐

相关文章

猜你喜欢

更多

热门文章

更多