免费安卓手游下载、分享游戏攻略、电脑硬件资讯、数码科技最新资讯
当前位置: 首页 > 硬件资讯 > DeepSeek低调发布新开源大模型,全球开发者惊艳:性能逼近顶级商业产品

DeepSeek低调发布新开源大模型,全球开发者惊艳:性能逼近顶级商业产品

时间:2025-06-02 13:35

小编:小世评选

在全球人工智能研发的浪潮中,大多数企业通过盛大的发布会和一系列的营销活动来吸引眼球。中国的DeepSeek却以其独特的“低调”风格,再次引发了全球开发者的关注。没有华丽的发布会,没有详细的新闻稿,甚至连基本的更新说明都未发布。就在晚上两点钟,DeepSeek团队悄然将新版本的大模型——DeepSeek-R1-0528上传至HuggingFace,令开发者们在短时间内目睹了这一技术进步。

与像OpenAI和Anthropic这类公司进行华丽宣传的方式截然不同,DeepSeek显得更为务实和注重技术本身。早在今年3月更新V3模型时,同样是“默默上新”,直到开发者们通过自行测试才洞悉到其非凡的性能。这种低调的发布风格几乎成为DeepSeek的标志,它将更多的精力集中在模型的性能提升和技术突破上,而非市场营销的噱头。

业内人士普遍认为,DeepSeek的这一做法可能源于其对技术实质的专注与从容。一位专家指出,DeepSeek更倾向于“版本号只为营销需求”,如果模型的架构没有发生实质性变化,就不算大版本升级。这种思维方式展示了中国开发团队在技术更新方面的独特态度。

尽管没有官方的性能数据,开发者社区在24小时内对新模型进行了自发的评测,结果震惊了众人。在一项权威编程测评上,DeepSeek-R1-0528的得分甚至紧随OpenAI的o4-Mini(Medium)之后,排名第四。需要注意的是,这些高性能模型几乎都是以商业出售为主,而DeepSeek-R1-0528的开源和免费特性,赋予了它更大的吸引力。

我们尝试让DeepSeek-R1-0528编写一个简单的俄罗斯方块网页游戏,它不仅迅速生成了代码,还具备直接在网页上运行的能力。经过短短两分钟的游玩,游戏体验非常流畅,界面设计同样出色,令人感觉它的编程能力让人惊喜。

在代码生成能力以外,DeepSeek-R1-0528在其它维度的表现同样突飞猛进。早期版本中用户所诟病的“量子力学式表达”,即术语过度使用的现象显著改善,输出更加自然和流畅。在面临复杂问题时,R1展现了更清晰的思维链条,逻辑推进也变得更加严谨,某些开发者甚至将它比作谷歌的模型,认为其具备了更高的深度推理能力。

值得一提的是,新模型在长文本处理方面的能力显著提升,它能够在32K上下文长度中实现更高的文本召回准确率。虽然在超过60K的情况下性能略有下降,但这种情况也为今后的模型升级提供了方向。最引人注意的是,新的R1在单任务处理上的时间延长可达30-60分钟,部分用户甚至测试到模型的“深度思考”时间达到212秒,这显示出它在逻辑推理和思维深度上的全新突破。

随着对DeepSeek-R1-0528进行评测的开发者不断增多,社交媒体上对其后续版本R2的关注逐渐升温。传闻中的R2似乎极具潜力,其技术架构大幅改进,推理成本有望大幅降低,性价比也令人期待。更引人瞩目的是,DeepSeek在与清华大学合作发布的《自我原则点评调优》(SPCT)论文中,提出了全新的元奖励模型技术,似乎为R2的进一步升级打下了基础。

DeepSeek的“小版本大升级”策略突显了其独特的开发理念。在商业公司热衷于制造市场噱头之际,DeepSeek则将资源集中在性能突破上。比年3月的V3模型更新,就运用了R1的强化学习技术进行推理能力的提升,却依然被定义为小版本升级。这份务实精神不仅令其模型具备超高性价比,甚至在输入成本方面要远低于当今市场上其他大模型。

“当顶级AI能力不再被封闭在商业公司的黑箱中,而是通过开源社区自由流通时,整个行业的创新速度将显著提升。”开发者们对DeepSeek的评价恰如其分。全球的开发者们都在共同期待R2的发布,而DeepSeek用实践告诉大家:“最好的预告片,永远是今天的代码。”

精品推荐

相关文章

猜你喜欢

更多

热门文章

更多