阿里巴巴发布开源编程模型Qwen3-Coder，性能超越多款封闭模型

时间：2025-07-24 03:55

小编：星品数码网

2023年7月23日，阿里巴巴Qwen团队正式发布了其最新一代开源编程模型——Qwen3-Coder。此次发布标志着该团队在编程人工智能领域迈出了重要的一步，Qwen3-Coder被认为是迄今为止最强大的开源智能体编程模型之一，拥有4800亿参数，激活参数为350亿，并原生支持256K的上下文，这一性能指标让它在多项编程和智能体任务上表现优异。

在基准测试中，Qwen3-Coder在Agentic Coding（智能体编程）、Agentic Browser-Use（智能体浏览器使用）和Agentic Tool-Use（智能体工具调用）等任务上展现出令人满意的性能，超越了不少现有的闭源模型，包括GPT-4等。Qwen团队在此次发布中表示，Qwen3-Coder的多种尺寸选择，让开发者能够根据实际需求进行选择，最强大的版本参数量更是超过了阿里的Qwen3旗舰模型的2350亿参数，尽管仍然小于Kimi K2的万亿级模型。

模型性能及应用案例

通过Qwen3-Coder，初入编程行业的开发者日常任务的完成效率被大幅提升，声称可在一天之内完成一位资深程序员一周的工作量。除了强大的模型本身，Qwen团队还发布了一款基于Gemini Code的智能体编程命令行工具。这一工具经过定制化，支持函数调用接口，使得Qwen3-Coder在处理智能体编程任务时更为高效和便利。

该模型已经在阿里云的百炼上线，输入和输出的价格分Tier进行了设定，256K到百万tokens的输入消费价格仅为6美元，而输出价格为每百万tokens 60美元。比起其他开放模型，如Claude Sonnet 4的价格，有着相当的竞争力。Qwen3-Coder已在Qwen Chat网页版上线，并提供用户免费体验的机会，真切让广大开发者能感受到这一新兴技术的魅力。

在模型发布前，Qwen3-Coder已经悄然上线，海外开发者敏捷反应，提交了多项实测案例。例如，一名用户利用Qwen3-Coder制作了一个Wordle单词游戏，成功创建了交付的游戏页面及源代码。该模型在执行过程中，通过自身资料库自行枚举所有5个字母的单词，展现了其强大的生成能力。

技术细节与优化

Qwen3-Coder的训练过程受到团队的重视，模型的预训练阶段将编程技能与通用知识进行结合，借此保持其在数学运算和逻辑推理上的能力。同时，该模型优化了仓库规模和动态数据，以适应智能体编程的实际需求。在与上一代模型Qwen2.5相比，团队通过清洗和重写噪声数据显著提升了数据质量。

强化学习是Qwen3-Coder后训练阶段的核心部分。团队认为，强化学习不仅适用于竞赛级代码生成，还应针对更广泛的现实编程任务进行优化。通过自动扩展多样化编程任务的测试用例，团队创造了高质量的训练实例，不仅提升了代码执行的成功率，同时对其他任务也产生了积极的推动效应。

智能体强化学习的引入也在Qwen3-Coder的开发中占有一席之地。通过长视距强化学习的实施，模型得以从与环境的多轮交互中强调其任务完成的可操作性。这一方法使得Qwen3-Coder在SWE-Bench Verified中实现了开源模型中的最佳性能，展现了其在真实世界问题解决上的潜力。

社区反响与未来展望

Qwen团队在技术博客中分享了Qwen3-Coder的一些具体用例，用户可以利用这一模型进行物理模拟、互动游戏开发等多种创意项目。并且，Qwen3-Coder的多样化功能包括图像生成、视频生成等应用，支持多种内容的上传，让开发者在创意实现的过程中，尽情释放灵感与创造力。

目前，阿里巴巴Qwen团队仍在积极探讨未来发展方向，包括提升Coding Agent的性能，希望它能够承担更多复杂和繁琐的任务，从而解放人力资源，提升生产力。同时，团队也在考虑推出更多不同尺寸的模型，以在性能和成本之间找到最佳的平衡点。

而言，Qwen3-Coder的发布为国内开发者提供了一种全新的编程助手，以及开源领域中一个强劲的替代选项。随着技术的不断迭代和进步，未来的编程世界将因这一创新而发生深刻的变化。开发者们将能够以更高的效率和更大的创造力来应对各类编程挑战，Qwen3-Coder将成为这个过程中不可或缺的助力。

阿里巴巴发布开源编程模型Qwen3-Coder，性能超越多款封闭模型

精品推荐

相关文章