阿里巴巴发布开源编程模型Qwen3-Coder,性能超越多款封闭模型
时间:2025-07-24 03:55
小编:星品数码网
2023年7月23日,阿里巴巴Qwen团队正式发布了其最新一代开源编程模型——Qwen3-Coder。此次发布标志着该团队在编程人工智能领域迈出了重要的一步,Qwen3-Coder被认为是迄今为止最强大的开源智能体编程模型之一,拥有4800亿参数,激活参数为350亿,并原生支持256K的上下文,这一性能指标让它在多项编程和智能体任务上表现优异。

在基准测试中,Qwen3-Coder在Agentic Coding(智能体编程)、Agentic Browser-Use(智能体浏览器使用)和Agentic Tool-Use(智能体工具调用)等任务上展现出令人满意的性能,超越了不少现有的闭源模型,包括GPT-4等。Qwen团队在此次发布中表示,Qwen3-Coder的多种尺寸选择,让开发者能够根据实际需求进行选择,最强大的版本参数量更是超过了阿里的Qwen3旗舰模型的2350亿参数,尽管仍然小于Kimi K2的万亿级模型。
模型性能及应用案例
通过Qwen3-Coder,初入编程行业的开发者日常任务的完成效率被大幅提升,声称可在一天之内完成一位资深程序员一周的工作量。除了强大的模型本身,Qwen团队还发布了一款基于Gemini Code的智能体编程命令行工具。这一工具经过定制化,支持函数调用接口,使得Qwen3-Coder在处理智能体编程任务时更为高效和便利。
该模型已经在阿里云的百炼上线,输入和输出的价格分Tier进行了设定,256K到百万tokens的输入消费价格仅为6美元,而输出价格为每百万tokens 60美元。比起其他开放模型,如Claude Sonnet 4的价格,有着相当的竞争力。Qwen3-Coder已在Qwen Chat网页版上线,并提供用户免费体验的机会,真切让广大开发者能感受到这一新兴技术的魅力。
在模型发布前,Qwen3-Coder已经悄然上线,海外开发者敏捷反应,提交了多项实测案例。例如,一名用户利用Qwen3-Coder制作了一个Wordle单词游戏,成功创建了交付的游戏页面及源代码。该模型在执行过程中,通过自身资料库自行枚举所有5个字母的单词,展现了其强大的生成能力。
技术细节与优化
Qwen3-Coder的训练过程受到团队的重视,模型的预训练阶段将编程技能与通用知识进行结合,借此保持其在数学运算和逻辑推理上的能力。同时,该模型优化了仓库规模和动态数据,以适应智能体编程的实际需求。在与上一代模型Qwen2.5相比,团队通过清洗和重写噪声数据显著提升了数据质量。
强化学习是Qwen3-Coder后训练阶段的核心部分。团队认为,强化学习不仅适用于竞赛级代码生成,还应针对更广泛的现实编程任务进行优化。通过自动扩展多样化编程任务的测试用例,团队创造了高质量的训练实例,不仅提升了代码执行的成功率,同时对其他任务也产生了积极的推动效应。
智能体强化学习的引入也在Qwen3-Coder的开发中占有一席之地。通过长视距强化学习的实施,模型得以从与环境的多轮交互中强调其任务完成的可操作性。这一方法使得Qwen3-Coder在SWE-Bench Verified中实现了开源模型中的最佳性能,展现了其在真实世界问题解决上的潜力。
社区反响与未来展望
Qwen团队在技术博客中分享了Qwen3-Coder的一些具体用例,用户可以利用这一模型进行物理模拟、互动游戏开发等多种创意项目。并且,Qwen3-Coder的多样化功能包括图像生成、视频生成等应用,支持多种内容的上传,让开发者在创意实现的过程中,尽情释放灵感与创造力。
目前,阿里巴巴Qwen团队仍在积极探讨未来发展方向,包括提升Coding Agent的性能,希望它能够承担更多复杂和繁琐的任务,从而解放人力资源,提升生产力。同时,团队也在考虑推出更多不同尺寸的模型,以在性能和成本之间找到最佳的平衡点。
而言,Qwen3-Coder的发布为国内开发者提供了一种全新的编程助手,以及开源领域中一个强劲的替代选项。随着技术的不断迭代和进步,未来的编程世界将因这一创新而发生深刻的变化。开发者们将能够以更高的效率和更大的创造力来应对各类编程挑战,Qwen3-Coder将成为这个过程中不可或缺的助力。

