阿里发布Qwen3-Coder,强化编程AI助手能力,助力开发者提高生产力
时间:2025-07-23 11:15
小编:小世评选
今日,阿里巴巴宣布正式推出其最新创新,Qwen3-Coder,这是迄今为止阿里在编程领域最为强大的AI助手,其发布标志着阿里在推进人工智能编程助手能力方面迈出了重要的一步。
Qwen3-Coder拥有多个不同尺寸,其中最为强大的版本为Qwen3-Coder-480B-A35B-Instruct。这一版本是一个采用480亿参数的混合专家模型(MoE),其中35亿参数被激活,原生支持256K token的上下文,并通过YaRN技术能够扩展至1M token。这使得Qwen3-Coder在处理复杂编程任务和Agent功能时表现出色,为开发者提供了一种前所未有的工具。
在开启编程AI助手新纪元的同时,Qwen3-Coder在Agentic Coding、Agentic Browser-Use和Agentic Tool-Use等领域已取得开源模型的最新最好效果(SOTA)。这意味着开发者可以在更为复杂和多样的任务中依靠该模型的强大能力,提高生产效率。
Qwen Code是基于Gemini Code进行的二次开发,阿里在此基础上进行了优化,包括适配prompt和工具调用协议,以便能够最大化发掘Qwen3-Coder在Agentic Coding任务中的潜能。Qwen3-Coder还具备与Claude Code、Cline等社区优质编程工具的出色兼容性。通过阿里云推出的百炼,开发者能够快速申请API钥匙,按照简单的步骤接入这款强大工具。
值得注意的是,Qwen3-Coder的API采用阶梯计费模式,能够根据输入token量灵活调整价格。例如,在256K到1M token的范围内,输入费用为每百万token 6美元,输出费用则为每百万token 60美元。这一价格策略与Claude Sonnet 4的收费标准相当,为开发者提供了更为经济的选择。
阿里在强化学习方面也采取了多种措施,以增强Qwen3-Coder的代码能力。此次改进涉及到7.5T数据的使用,其中代码占比高达70%,确保模型在通用和数学能力的同时,具备卓越的编程能力。Qwen3-Coder支持256K的上下文原生能力,通过YaRN可以扩展至1M,专门针对仓库级和动态数据(如Pull Request)进行了优化,使其更加贴合实际开发需求。
在数据的有效利用上,阿里还采取了创新的合成方法,借助Qwen2.5-Coder对低质量数据进行清洗和重写,提升整个数据集的质量。与当前业界竞争以竞赛类代码生成为主的趋势相比,阿里认为,将大规模强化学习应用于更丰富的真实代码任务将带来更好的效果。因此,他们在此基础上进行了扩展训练,通过自动生成测试样例,构造大量高质量训练实例,极大释放了强化学习的潜力,不仅让代码执行成功率显著提升,还对其他任务也产生了积极的影响。
在Qwen3-Coder的后训练阶段,阿里还实施了Agent RL,通过多轮交互鼓励模型利用工具来解决问题。为确保这一过程的可行性,阿里在环境扩展方面也进行了创新,借助阿里云的基础设施,成功实现了同时运行20,000个独立环境,大幅提升了强化学习的反馈和评估能力。
Qwen3-Coder还推出了多元化的使用方案,极大降低了开发者接入门槛。自研的Qwen Code工具基于Gemini Code进行改进,并针对Qwen3-Coder系列模型提供了更好的解析器和工具支持。阿里为开发者提供了完整的示例代码和配置指南,保证了快速的部署和测试能力。
Qwen3-Coder也与Claude Code无缝集成,支持使用者获得更加丰富的编码体验。通过几个简单步骤,将Anthropic的base url替换成dashscope提供的endpoint后,开发者即可直接输入Claude开始使用Qwen3-Coder与Claude Code联动的强大功能。
随着全球范围内企业对自动化编程需求的激增,Qwen3-Coder的问世是一个契机,在激烈的市场竞争中,它的开源策略和多工具兼容性能够带来显著的竞争优势。阿里云还透露,将继续提升Qwen3-Coder,提高其在更复杂软件工程任务中的应用能力,释放开发者的生产力。他们更计划推出更多模型尺寸版本,以便在保证效果的前提下降低部署成本。
Qwen3-Coder的发布不仅加强了阿里在编程AI助手市场的地位,也为广大开发者带来了全新的工具选择,助力其提升工作效率,适应快速变化的技术环境。随着技术的不断迭代与进步,Qwen3-Coder未来将成为开发领域一颗耀眼的新星。