DeepSeek-R1全新版本开源，编程能力超越同行

时间：2025-05-31 19:05

小编：星品数码网

在端午假期即将来临之际，AI领域的新星DeepSeek引发了广泛关注。就在今天凌晨，DeepSeek-R1的最新版本正式开源，带来了许多令人振奋的更新与改进。这一全新版本的模型权重已经上传至HuggingFace，尽管模型卡尚未更新，但开发者和研究人员们对于DeepSeek-R1的“超进化”充满期待。

此次DeepSeek-R1-0528的更新是其四个月以来的首次大规模改版，尤其在编码和逻辑推理能力上实现了显著的飞跃。新版本依托于之前的DeepSeek-V3-0324版本进行训练，模型参数竟达到了660B，成为业界关注的焦点。经过测试，新版DeepSeek-R1在经典的物理模拟问题中表现杰出，LiveCodeBench基准测试中，其性能已与成熟的o3-mini和o4-mini相当，并在多个方面超过了Gemini 2.5 Flash。

在AI圈内，许多用户对于DeepSeek-R1给予了高度评价，认为这是一款能够深度纠正思维链条、并具备出色创造性世界构建能力的模型。这使得DeepSeek-R1积累了大量的粉丝，大家纷纷表示这是开源模型的一次重要胜利。

新版亮点

新版DeepSeek-R1的核心亮点可为以下几点：

1. 深度推理能力：R1能进行更深入的逻辑推理，能力接近Google的顶级模型。

2. 文本生成优化：生成的文本更加自然，格式更为优美。

3. 推理风格独特：推理速度和缜密度都得到了显著的提升。

4. 长时思考支持：实现了单任务处理时长达30-60分钟，甚至有用户实测表明其思考时间超过25分钟。

这一长时间的思考能力，是DeepSeek-R1与其他模型相比最引人注目的特性之一。用户发现，该模型在计算简单问题如“9.9 9.11”的时候，能够持续输出正确答案，展现了其显著的计算能力。

编程能力超群

用户对新版本DeepSeek-R1在编程方面的表现尤为印象深刻。经过与Claude 4 Sonnet的对比测试，多位用户发现DeepSeek-R1的表现几乎无可匹敌。不论是复杂的光线模拟，还是简单的编码任务，DeepSeek-R1的能力让人赞叹。用户Haider的测试表明，DeepSeek-R1在构建单词评分系统时，能够迅速生成两份高质量的文件，且无需进行后续修改，表现令人叹为观止。

与Gemini 2.5 Pro的对比中，新版DeepSeek-R1同样有着不俗的表现。测试显示，两款模型在复杂问题上的回答都颇具深度，尤其是在需要引用学术研究的任务中，Gemini虽然响应更快，但在结构和内容的准确性上，DeepSeek-R1的表现也不遑多让。

不过，在一些特定的任务设计方面，DeepSeek-R1尚显不足。例如，在智能体规划时，DeepSeek-R1的表现略逊于Gemini，后者在风格化的信息图塑造方面更胜一筹。

更高的效率

新版DeepSeek-R1的版本虽然是小更新，但带来了“史诗级”的性能提升。在简单任务的处理上，其思考时间显著缩短，最高可在短短10秒内完成设定。用户在进行一些如“宇宙中字体旋转的3D动画”或设计“新智元官方网站”等任务时，深切感受到DeepSeek-R1的高效与稳定。

在更具挑战的任务中，DeepSeek-R1则展示了其“完美”的思考过程。例如，在模拟太阳系运转的任务中，DeepSeek-R1不仅考虑了比例的精准，还展现出独创的参数调控面板和运动方向的设定，整个代码过程流畅，展示出其强大的编程能力。

深度思考的秘密武器

更加令人震惊的是，DeepSeek-R1在面对复杂的逻辑推理问题时，展现出了出众的能力。例如，处理“农夫如何安全过河的问题”时，DeepSeek-R1不仅给出了完整有效的方案，还能够清晰分析推理步骤，显示出其在逻辑思维上的严谨与缜密。

DeepSeek-R1-0528的发布是在开放源代码的AI社区中一项引人瞩目的事件。此版本不仅在多方面显示了编程能力的超越，还在逻辑思考上取得了显著的提升。随着这一版本的推广，我们可以预见DeepSeek-R1将在未来的AI应用场景中扮演更加重要的角色，令我们拭目以待。

DeepSeek-R1全新版本开源，编程能力超越同行

精品推荐

相关文章