免费安卓手游下载、分享游戏攻略、电脑硬件资讯、数码科技最新资讯
当前位置: 首页 > 硬件资讯 > DeepSeek发布升级公告:新款DeepSeek-R1-0528显著提升推理能力与准确率

DeepSeek发布升级公告:新款DeepSeek-R1-0528显著提升推理能力与准确率

时间:2025-06-03 17:05

小编:小世评选

国产人工智能模型公司深度求索(DeepSeek)于近日正式发布了其最新款DeepSeek-R1模型的升级公告,宣布新版本DeepSeek-R1-0528已全面上线。此项升级致力于提升模型的推理能力及准确率,为用户提供更加高效、可靠的智能助手体验。

根据DeepSeek的官方公告,用户可通过其官方网站、移动应用程序(APP)或小程序进入对话界面,并开启“深度思考”功能来体验更新后的DeepSeek-R1-0528。API接口也进行了同步更新,保持了不变的调用方式,确保开发者和用户能顺利过渡到新版本。

升级背景与改进

此次DeepSeek-R1-0528基于2024年12月发布的DeepSeek V3 Base模型,经过了后期的训练与优化。特别是,DeepSeek在后训练过程中追加了更多的算力投入,旨在显著增强模型的思维深度与推理能力。这一系列改进使得新版本在多个基准测评中表现优异,数学、编程、通用逻辑等领域的评测结果均显示其在国内同类模型中占据领先地位。同时,DeepSeek-R1-0528的整体表现也与国际顶尖模型如OpenAI的o3和Gemini-2.5-Pro相持平,体现出国产大模型日益增强的竞争力。

显著的推理提升

在具体性能方面,新版DeepSeek-R1在应对复杂推理任务时的表现显著优于旧版。例如,在AIME2025测试中,新版本的准确率从旧版的70%提升到了87.5%。这一过程中,模型的思维深度得到了前所未有的增强:在同一测试集中,旧版模型每个问题的解答平均使用12K tokens,而新版模型在解答时约使用了23K tokens,展示出更为详细和深入的推理过程。

深度求索针对用户反馈,对模型的“幻觉”现象进行了专门优化。新版DeepSeek-R1在改写、、等场景中,幻觉率下降了45%到50%,有效提高了结果的准确性与可靠性。

创作能力的提升

新版模型对于输出长篇作品的能力也有了显著提升。DeepSeek-R1-0528在议论文、小说和散文等文体上的创作水平更为突出,能够生成篇幅较长、结构更为完整的文章。同时,模型的写作风格更加贴近人类的表达偏好,增强了作品的阅读体验。

虽然DeepSeek-R1-0528的测评成绩已与OpenAI的o1-high相当,但目前仍与o3-High和Claude4 Sonnet存在一定差距。深度求索表示,此次更新是一个重要的里程碑,未来将继续投入资源进行模型的优化与提升,力争做到国际领先。

模型的开放性与兼容性

与旧版本相同,更新后的DeepSeek-R1模型支持64K的上下文长度,开发者和用户依然可以在此基础上进行更多的开发工作。如果用户对更长的上下文长度需求迫切,DeepSeek提供了可通过第三方访问的开源版本R1-0528,该版本支持128K的上下文长度,展现出更为灵活的应用前景。此次升级继续保持开源模式,允许用户利用模型输出,通过模型蒸馏等方式进行后续的模型训练,这样的做法有助于形成一个更加健康的机器学习生态系统。

用户反馈与市场反响

在推出新模型后的初步反馈中,用户们对DeepSeek-R1-0528的表现表示惊艳,尤其是模型在单任务处理的时间延长,测试显示深度求索的新模型在完成某些任务时处理时间可达到30到60分钟不等,反映出模型在推理和生成过程中的强大能力。

DeepSeek-R1-0528的发布标志着国内大模型技术的又一次飞跃,深度求索通过此轮升级进一步巩固了其在中国AI领域的领导地位,展现出其在全球AI竞争中不可小觑的实力。随着技术的不断进步,用户对AI助手的期望也在不断提高,深度求索未来将如何回应这一挑战,值得我们持续关注。

精品推荐

相关文章

猜你喜欢

更多

热门文章

更多