免费安卓手游下载、分享游戏攻略、电脑硬件资讯、数码科技最新资讯
当前位置: 首页 > 数码科技 > DeepSeek R1模型完成小版本升级,深度思考能力大幅提升

DeepSeek R1模型完成小版本升级,深度思考能力大幅提升

时间:2025-06-19 20:40

小编:小世评选

在信息技术迅猛发展的今天,人工智能的应用场景不断扩展,各类智能模型也在持续进步。近日,DeepSeek公司宣布其R1模型完成了一次重要的小版本升级,具体版本号为DeepSeek-R1-0528。这一升级在深度思考能力方面取得了显著提高,为用户带来了更为强大的功能和优质的体验。

据了解,DeepSeek R1模型自发布以来,一直以来使用的是2024年12月发布的DeepSeek V3 Base模型作为基础。在这次小版本升级中,开发团队加大了后训练过程中的算力投入,以进一步提升模型的思维深度与推理能力。这一全新的R1模型在多个基准测试中表现出色,尤其在数学、编程以及通用逻辑等领域,均取得了业界领先的成绩。根据官方公告,新版模型在整体表现上则已经接近于国际顶尖模型,如o3和Gemini-2.5-Pro等。

以具体测试成绩为例,在AIME 2025的测试中,DeepSeek-R1-0528模型的准确率达到了87.5%,相比于旧版的70%有了明显的提升。这一转变不仅反映了模型在题目解答过程中的思维深度增加,且从统计数据来看,旧版模型平均每道题目使用了12K个tokens,而新版则达到了23K个tokens,意味着模型在解析题目时进行了更为详尽的推理和思考。

开发团队还针对用户需求进行了更深层次的优化,推出了名为DeepSeek-R1-0528-Qwen3-8B的衍生模型。这一8B模型在AIME 2024测试中的表现仅次于DeepSeek-R1-0528,超越了Qwen3-8B,表现相当于Qwen3-235B。这一成果被广泛认为对学术界和工业界中小模型的研究与开发都有着积极的推动作用。

除了深度思考能力的提升外,DeepSeek R1新版本还专门针对“幻觉”问题进行优化,更新后的模型在文本生成、归纳和阅读理解等场景中的幻觉频率降低了45%-50%左右,为用户提供了更为准确且可靠的结果。新版模型在创作长篇作品方面也表现得更加出色,能够编写更为完整且结构化的议论文、小说与散文,同时尽力展现出更接近人类的写作风格。

在工具调用方面,DeepSeek-R1-0528也有了显著进步。尽管当前不支持在“思考”模式中进行工具调用,但新版模型的Tau-Bench评分已经达到了airline 53.5%和retail 63.9%,显示出与OpenAI的o1-high相当的水平。用户通过LobeChat可以使用新模型的工具调用能力,例如生成网页文章的或者开发基于HTML/CSS/JavaScript的现代简约风格单词卡片应用。

API的更新同样值得一提。DeepSeek-R1-0528的API接口保持不变,同时引入了一些新的参数定义,使得开发者在使用过程中更加便捷。对于使用max_tokens参数的用户需要注意这一参数现在代表的是模型一次性输出的总长度,包括思考过程,默认为32K,最大支持64K的输出。因此,用户在使用API时需及时调整,以防输出被截断。同时,DeepSeek官方更新了相关的API文档,方便开发者们随时查阅。

,DeepSeek R1模型的开源策略也引起了广泛关注,新的DeepSeek-R1-0528模型与之前版本采用同样的基础模型基础,用户只需在私有化部署时更新相应的checkpoint和tokenizer_config.json文件即可。模型的参数为685B,其中包含14B的MTP层,开源版本支持上下文长度为128K。

DeepSeek R1模型的小版本升级不仅在深度思考能力上取得了显著进展,同时在解决幻觉问题、文本创作与工具调用等多方面均有所优化。如需了解更多详情,用户可前往DeepSeek的官方网站、App或小程序进行体验。通过此次升级,DeepSeek R1模型在人工智能领域的应用潜力进一步释放,必将为用户带来更加高效、智能的服务体验。

精品推荐

相关文章

猜你喜欢

更多

热门文章

更多