国产大模型展现实力，字节“豆包”高考数学测试夺魁，腾讯“元宝”面临瓶颈

时间：2025-06-21 04:05

小编：小世评选

每年的六月中高考季，总是引发众多瞩目，而今年除了各大考生和家长对于语文作文题目的热议外，另一大话题则是大模型测试高考数学题。最近，多家媒体针对市面上的大模型进行了一系列高考数学卷的测试。根据鳌头财经整理的测试结果显示，国产大模型在各个维度上展现出强大的实力，尤其是在高考数学卷的表现中，字节旗下的“豆包”屡次获得“状元”称号，充分证明了其技术的卓越。

根据测试数据，字节的豆包、阿里巴巴的通义、百度的文心和腾讯的元宝在客观题的表现上不相上下。在主观题的解答中，结果却明显分出高下，最终豆包以145分的优异成绩位列第一，而经过多次迭代的腾讯元宝却仅以137分的成绩排在第五位。这一结果不仅在高考中的表现反映了各大模型的实力差异，更在App Store的排行榜上体现出明显的用户接受度。截至6月16日，豆包在免费榜中稳居第一，而腾讯的元宝则仅排在第34位，显示出两者之间的显著差距。

自今年年初下半年以来，随着DeepSeek大模型的崛起，腾讯积极尝试通过提升元宝的模型能力和增加流量入口来增强竞争力。从目前的产品表现来看，元宝似乎进入了瓶颈期。与其他大厂相比，腾讯投入自研大模型的时间相对较晚，大模型App的发布也相对滞后。去年9月，腾讯才推出了自研大模型“混元”，而基于此模型开发的元宝则要等到今年年5月方才问世，百度的文心、字节的豆包和阿里巴巴的通义均已相继推出。

随着DeepSeek的盛行，腾讯为元宝的市场加速布局采取了快速迭代的策略。从2月13日起，元宝接入DeepSeek-R1满血版，的时间内进行了频繁更新，仅在35天中进行了30次版本迭代。在基础能力的增强上，元宝相继上线了多项新功能，如图片分享、对话导出长图及“快思考”大模型Turbo S等，极大地提升了产品用户体验。

在推动应用市场的策略上，腾讯通过巨额的买量营销为元宝创造了更大的曝光机会。数据显示，在2月18日至23日的短短几天里，元宝的广告投放量环比增长了345.1%，单日素材投放量甚至超越了豆包。根据统计，腾讯在二月份的买量支出超过了2.81亿元，最终效果显著，元宝一度在App Store中超越豆包，登顶免费榜首。随着买量策略的逐渐放缓，元宝的排名也开始直线下滑，显示出其市场竞争力的脆弱。

外界分析认为，腾讯之所以在加大推广力度，源于对在大模型进入C端市场争夺中落后的警惕。尽管凭借资金和生态优势，腾讯是否能够迅速改变元宝的发展情况仍值得关注。一些用户反映，元宝在内容生成和用户体验方面与DeepSeek等表现相比，存在一定的差距，甚至有人质疑其内容的全面性和准确性。这些负面的反馈可能会影响到用户的留存率，尤其是面对竞争对手相似的用户群体。

进一步来看，腾讯内部结构的调整也给元宝的未来发展带来了不确定性。今年初，元宝从技术工程事业群转至腾讯云与产业事业群，外界普遍认为这一转变意味着对元宝业务的重视程度增加。腾讯更倾向于将资源放在能够快速带来经济收益的项目上，这使得元宝在发展规划中的优先级始终处于摇摆状态。

在AI能力迅猛发展的时代背景下，腾讯将自身的AI战略结合其已有的核心业务进行优化，致力于通过AI提升用户价值。而元宝若难以在可预期的时间内提升用户规模，其未来的市场前景便会愈发严峻。

国产大模型的竞逐已开始显露出悬殊的实力差距。字节的“豆包”凭借出色的表现和良好的市场运作，牢牢掌控了C端入口，腾讯的“元宝”虽然在努力追赶，但仍面临诸多挑战。随着市场竞争的加剧，如何提高产品的用户体验与留存率，将是腾讯元宝迫切需要解决的问题。

国产大模型展现实力，字节“豆包”高考数学测试夺魁，腾讯“元宝”面临瓶颈

精品推荐

相关文章