免费安卓手游下载、分享游戏攻略、电脑硬件资讯、数码科技最新资讯
当前位置: 首页 > 硬件资讯 > DeepSeek R1 模型升级至 R1-0528,推理能力显著提升

DeepSeek R1 模型升级至 R1-0528,推理能力显著提升

时间:2025-06-05 09:45

小编:小世评选

近日,DeepSeek团队宣布其流行的R1模型完成了小版本升级,当前最新版本为DeepSeek-R1-0528。这一升级不仅体现在整体性能的提升上,也为用户带来了更加优质的体验。用户可以通过官方网站、APP或小程序进入对话界面,开启“深度思考”功能,体验升级带来的种种好处。同时,API也进行了更新,但调用方式保持不变,确保开发者的使用体验顺畅。

深度思考能力的强化

DeepSeek-R1-0528依然采用2024年12月发布的DeepSeek V3 Base模型作为基础。在后训练阶段,团队投入了额外的算力,目的是显著增强模型的思维深度与推理能力。经过系统性的优化,更新后的R1模型在数学、编程和通用逻辑等领域的基准测评中取得了当前国内所有模型中表现最优秀的成果,甚至在整体表现上接近一些国际顶尖模型,如o3模型和Gemini-2.5-Pro。

具体在复杂推理任务中的表现尤为引人注目。例如,在AIME 2025测试中,DeepSeek-R1-0528的准确率上升至87.5%,相比于旧版R1的70%提升幅度显著。解析其原因,可以发现新版模型在解题过程中所使用的tokens数量从旧版的12K增加到23K,这一变化清晰地反映了模型在处理问题时所进行的更深入和详尽的思考过程。

思维链的蒸馏与小模型的发展

值得一提的是,DeepSeek团队还在新版模型的基础上进行了一项创新尝试,通过蒸馏技术推出了DeepSeek-R1-0528-Qwen3-8B。这一8B模型在数学测试AIME 2024中表现出色,仅次于DeepSeek-R1-0528,显示出超越Qwen3-8B的能力,甚至与Qwen3-235B持平。这一成果不仅为学术界在推理模型的研究提供了新的思路,同时对工业界在小模型的开发方面也将具有重要影响。

幻觉现象的优化

在此次升级中,DeepSeek团队特别注意到了“幻觉”现象,即模型在生成内容时产生与事实不符的情况。新版DeepSeek-R1通过优化算法,大幅降低了这一现象的发生率。在改写、摘要和阅读理解等实际应用场景中,幻觉产生率降低了45%至50%。这一改进将使得模型能够为用户提供更为准确和可靠的结果,增强用户的信任度。

创意写作的增强

不仅仅是在逻辑推理方面,DeepSeek-R1-0528在创意写作领域的表现也得到了显著提升。相较于旧版,新的模型在撰写议论文、小说和散文等文体时,能够输出篇幅更长且结构更为完整的长篇作品。同时,新的写作风格更贴近人类的表达方式,这在创意写作中极为重要。无论是文学创作还是商业文案的撰写,R1-0528都能够为用户提供更为丰富和符合预期的内容。

工具调用能力的增强

DeepSeek-R1-0528在工具调用方面也引入了新的功能,但需注意的是,该功能不支持在“思考模式”(thinking)中调用。目前,模型在Tau-Bench的测评成绩为airline 53.5%和retail 63.9%,显示出其与OpenAI o1-high相当的推理能力。不过,与o3-High及Claude 4 Sonnet这样的模型相比仍存在一定差距,这也为未来的改进方向提供了指引。

开源的优势

如同旧版DeepSeek-R1一样,此次升级的DeepSeek-R1-0528也以MIT许可证的形式开源,允许用户利用模型输出、进行模型蒸馏等方式进行二次开发。这一开源政策不仅有助于模型的普及与发展,也为社区用户提供了多种便利,能够加速技术的应用与创新。

DeepSeek-R1-0528的升级不仅显著提升了模型的推理能力,扩大了其应用场景,也通过一系列优化措施解决了诸如幻觉等现实问题。对于研究人员、开发者以及各类用户这都是一个值得期待的进步,未来在智能对话、创意写作等领域都可能迎来更多的惊喜与挑战。

精品推荐

相关文章

猜你喜欢

更多

热门文章

更多