DeepSeek低调发布新开源大模型，全球开发者惊艳：性能逼近顶级商业产品

时间：2025-06-02 13:35

小编：星品数码网

在全球人工智能研发的浪潮中，大多数企业通过盛大的发布会和一系列的营销活动来吸引眼球。中国的DeepSeek却以其独特的“低调”风格，再次引发了全球开发者的关注。没有华丽的发布会，没有详细的新闻稿，甚至连基本的更新说明都未发布。就在晚上两点钟，DeepSeek团队悄然将新版本的大模型——DeepSeek-R1-0528上传至HuggingFace，令开发者们在短时间内目睹了这一技术进步。

与像OpenAI和Anthropic这类公司进行华丽宣传的方式截然不同，DeepSeek显得更为务实和注重技术本身。早在今年3月更新V3模型时，同样是“默默上新”，直到开发者们通过自行测试才洞悉到其非凡的性能。这种低调的发布风格几乎成为DeepSeek的标志，它将更多的精力集中在模型的性能提升和技术突破上，而非市场营销的噱头。

业内人士普遍认为，DeepSeek的这一做法可能源于其对技术实质的专注与从容。一位专家指出，DeepSeek更倾向于“版本号只为营销需求”，如果模型的架构没有发生实质性变化，就不算大版本升级。这种思维方式展示了中国开发团队在技术更新方面的独特态度。

尽管没有官方的性能数据，开发者社区在24小时内对新模型进行了自发的评测，结果震惊了众人。在一项权威编程测评上，DeepSeek-R1-0528的得分甚至紧随OpenAI的o4-Mini（Medium）之后，排名第四。需要注意的是，这些高性能模型几乎都是以商业出售为主，而DeepSeek-R1-0528的开源和免费特性，赋予了它更大的吸引力。

我们尝试让DeepSeek-R1-0528编写一个简单的俄罗斯方块网页游戏，它不仅迅速生成了代码，还具备直接在网页上运行的能力。经过短短两分钟的游玩，游戏体验非常流畅，界面设计同样出色，令人感觉它的编程能力让人惊喜。

在代码生成能力以外，DeepSeek-R1-0528在其它维度的表现同样突飞猛进。早期版本中用户所诟病的“量子力学式表达”，即术语过度使用的现象显著改善，输出更加自然和流畅。在面临复杂问题时，R1展现了更清晰的思维链条，逻辑推进也变得更加严谨，某些开发者甚至将它比作谷歌的模型，认为其具备了更高的深度推理能力。

值得一提的是，新模型在长文本处理方面的能力显著提升，它能够在32K上下文长度中实现更高的文本召回准确率。虽然在超过60K的情况下性能略有下降，但这种情况也为今后的模型升级提供了方向。最引人注意的是，新的R1在单任务处理上的时间延长可达30-60分钟，部分用户甚至测试到模型的“深度思考”时间达到212秒，这显示出它在逻辑推理和思维深度上的全新突破。

随着对DeepSeek-R1-0528进行评测的开发者不断增多，社交媒体上对其后续版本R2的关注逐渐升温。传闻中的R2似乎极具潜力，其技术架构大幅改进，推理成本有望大幅降低，性价比也令人期待。更引人瞩目的是，DeepSeek在与清华大学合作发布的《自我原则点评调优》（SPCT）论文中，提出了全新的元奖励模型技术，似乎为R2的进一步升级打下了基础。

DeepSeek的“小版本大升级”策略突显了其独特的开发理念。在商业公司热衷于制造市场噱头之际，DeepSeek则将资源集中在性能突破上。比年3月的V3模型更新，就运用了R1的强化学习技术进行推理能力的提升，却依然被定义为小版本升级。这份务实精神不仅令其模型具备超高性价比，甚至在输入成本方面要远低于当今市场上其他大模型。

“当顶级AI能力不再被封闭在商业公司的黑箱中，而是通过开源社区自由流通时，整个行业的创新速度将显著提升。”开发者们对DeepSeek的评价恰如其分。全球的开发者们都在共同期待R2的发布，而DeepSeek用实践告诉大家：“最好的预告片，永远是今天的代码。”

DeepSeek低调发布新开源大模型，全球开发者惊艳：性能逼近顶级商业产品

精品推荐

相关文章