DeepSeek与Kimi再度争锋 大模型赛道竞争加剧
时间:2025-05-07 15:25
小编:小世评选
记者闫俊文 编辑张晓迪
在科技发展的浪潮中,人工智能的进步令人瞩目,尤其是在大模型的研发领域。继2月份两家公司在论文上“碰撞”之后,DeepSeek与Kimi的竞争又在新的模型赛道上展开。这场来自两大初创公司的较量,不仅是技术的比拼,更是市场战略与发展方向的碰撞。
4月30日,DeepSeek正式推出其新模型DeepSeek-Prover-V2,这是一款专为数学定理证明而设计的模型,首次将强化学习的理念引入数学推理,使其在测试集上的表现更为出色。据悉,DeepSeek-Prover-V2在miniF2F测试中的通过率高达88.9%,并成功解答了PutnamBench测试中的49道题目。这一成果重新定义了数学推理的效率与准确性。
Kimi团队也在全力以赴,推出与Numina共同研发的模型。其开源的1.5B和7B参数的模型蒸馏版本在miniF2F测试中的通过率为80.7%,尽管在与DeepSeek的对比中稍显逊色,但其团队的持续创新能力不可小觑。Kimi的最新模型命名为“Kimina-Prover Preview”,同样采用了强化学习技术。而在市场反馈上,Kimi团队正通过内测社区功能来不断增强用户粘性,力求不断吸引新的用户群体。
对于DeepSeek创始人梁文锋推出DeepSeek-Prover-V2的时机尤其重要。他指出,自R1模型发布以来,外界对DeepSeek“魔法”的关注度开始下降,而阿里巴巴当前的开源模型已迅速逼近、并在一些领域超过DeepSeek。因此,外界对于下一个版本R2或V4的发布充满期待,期望能够进一步巩固其在市场上的领先地位。
在竞争加剧的背景下,Kimi也面临严峻挑战。从字节跳动的豆包到腾讯的元宝,行业巨头们正在不断蚕食Kimi的市场份额。根据QuestMobile的数据,AI原生APP的月活跃用户规模已发生变化,DeepSeek目前在数据上有所领先,而Kimi则开始显得力不从心。
展望未来,梁文锋在接受《暗涌》采访时提出,DeepSeek将致力于实现AGI的目标,并将其关注焦点放在数学和代码、多模态学习及自然语言处理三个方向上。他认为,数学和代码的推理过程如同围棋,构成了一套封闭且可验证的系统,具有极高的学习潜力。而多模态学习则是让模型在更复杂的人类环境中进行不断的探索和学习。
DeepSeek的Prover系列模型将会定期更新以保持技术的领先。深度学习领域的竞争是一个快速迭代的过程,失败与成功也许只在一念之间。
在市场竞争的夹缝中,越来越多的企业逐渐参与到大模型的研发与开源中来。阿里巴巴和百度等企业的加入,使得这一赛道越发热闹。阿里巴巴近期发布的Qwen3模型被誉为“混合推理模型”,其参数量仅为DeepSeek-R1的1/3,却在性能上全面超越同类产品。同时,百度的文心4.5 Turbo也以更低的成本、更强的性能成为市场的一匹黑马。李彦宏在发布会上多次提到DeepSeek,指出其在多媒体理解上的局限性和高幻觉率,进一步推动了对DeepSeek的反思和改进。
在这个竞争愈加激烈的市场中,AI大模型的开源竞争将成为众多科技公司奋发向上的一大动力。只有那些技术最为先进、理念最为前沿的企业,才能够在这场争夺中定义新的行业标准。
DeepSeek和Kimi的竞争不仅是产品技术的较量,更是理念、愿景和创新的碰撞。随着市场竞争的加剧,企业不得不加紧步伐,寻求技术上的突破与商业上的成功,唯有如此才能在未来的赛道中立于不败之地。