国内大模型厂商迅速开源，阿里发布全球最强开源模型Qwen3

时间：2025-05-07 16:15

小编：星品数码网

随着人工智能技术的飞速发展，国内大模型厂商纷纷展现出开源的决心和实力。在即将到来的五一假期前夕，阿里巴巴于4月29日凌晨正式开源了备受瞩目的新一代通义千问模型Qwen3，成为全球最强的开源模型之一。这一模型不仅在参数规模上相比DeepSeek-R1大幅减小，更是在性能上全面超越了多项国际领先的封闭模型，迅速赢得了行业的高度认可。

Qwen3的模型参数具备令人惊叹的多样性，包括两款30B、235B的MoE模型，以及多款从0.6B到32B不等的密集模型。其中，30B参数的MoE模型在性能上实现超过10倍的提升，仅需激活3B的计算能力，便可达到此前Qwen2.5-32B模型的能力。一系列密集模型的开源，不仅为研究者提供了强大的工具，也使得企业在实际应用中能够灵活选择。

Qwen3的最大亮点在于它是首个“混合推理模型”，结合了“快思考”和“慢思考”两种推理模式。对于简单问题，模型能够即刻返回答案，而面对复杂问题时则能进行多步骤的深度推理。这种设计大大节省了计算资源，使得模型能够在多种场景中高效应用。同时，阿里云已与NVIDIA、高通、联发科、AMD等多个芯片厂商进行适配，助力模型在各类应用中迅速落地。

紧随其后，小米于4月30日开源了其首个专为推理而生的大模型Xiaomi MiMo，规模参数仅为7B，便在数学推理和代码竞赛等领域超越了OpenAI的闭源模型o1-mini。这一举动标志着小米在大模型领域的首次开源尝试，显示出其在AI技术领域的不断突破和创新。

DeepSeek也在4月30日晚间发布了DeepSeek-Prover-V2，进一步扩展了开源生态。该模型专注于数学定理的证明工作，支持最长32K的上下文输入，显著提升了推理性能，并刷新了多项高难基准测试。这一系列产品的发布，表明国内大模型厂商在技术创新与开源合作上持续发力，积极拓展市场。

在数字经济的背景下，阿里云持续的开源策略不仅为自身塑造了良好的品牌形象，也为整个云服务生态带来了显著的促进作用。知名的数字经济学者盘和林指出，阿里云的开源逻辑在于通过提供免费的模型，来驱动硬件和软件服务的收费，以实现商业模式的成功转型。

从更宏观的角度看，随着Qwen3与其他国内开源模型的相继推出，许多国际巨头无不对中国的开源模型产生了新的警觉。零一万物的CEO李开复表示，当前开源模型已经展现出强大的竞争力，与闭源模型的差距正在缩小。他认为，国内的开源模型不仅在性能上不断提升，也通过节省算力和资源消耗，展示了新一代AI训练的创新路径。

李开复进一步指出，虽然OpenAI和Anthropic等美国公司在性能上暂时占优，但随着中国企业特别是阿里、字节跳动和DeepSeek等在大模型领域的深耕，未来的竞争格局将会发生重大变化。他预测，未来市场可能会收敛到这几家公司的手中，形成新的寡头格局。

在这种竞争局势下，各大厂商也在积极寻找适合自身发展的道路。阿里巴巴通过云计算和开源模型相结合，不仅构建了稳固的技术基础，也为后续商业化奠定了坚实的基础。而字节跳动则凭借庞大的用户资源，积极推进人工智能与内容创作的融合，力求在用户需求上进行突破。腾讯则围绕用户需求设计相应的AI产品，以确保在市场上的竞争力不断增强。

由此中国的AI产业正在迅速进入一个崭新的阶段。随着一批优秀的开源模型的发布，国内厂商不仅提升了自己的技术发展水平，同时也在全球范围内展现了中国AI的力量。这为实现AI公平与普惠提供了新的机会，让更多的国家和地区能够借助自主创新的技术走上AI的发展之路。谁能在这场激烈的竞争中把握机会，成为未来的赢家，值得我们更加关注。

国内大模型厂商迅速开源，阿里发布全球最强开源模型Qwen3

精品推荐

相关文章