阿里开源Qwen3-Coder,编程能力超越GPT-4.1,助力程序员工作效率翻倍
时间:2025-07-23 22:45
小编:小世评选
2023年7月23日,阿里巴巴正式宣布开源其最新研发的通义千问AI编程大模型——Qwen3-Coder。这一模型以其强大的编程能力,迅速引起了业界的广泛关注,阿里方面表示,Qwen3-Coder的编程能力已经超越了诸如GPT-4.1等闭源模型,甚至与全球领先的编程模型Claude4不相上下。
Qwen3-Coder作为千问系列模型的创新成果,采用了先进的混合专家(MoE)架构,配备了高达480B的参数,每次激活达到35B的参数,原生支持256K token的上下文,甚至能够扩展至1M的长度。这意味着它在进行编程相关任务时,可以处理大量的信息,以便为用户提供更高效的服务。
在预训练阶段,Qwen3-Coder使用了7.5T的数据,其中70%的数据与编程相关,这使得模型在代码生成和相关任务上的效果显著提升。通过后续的强化学习阶段,Qwen3-Coder在编程和智能体任务的表现得到了进一步优化。在最新的评测中,它在WebArena和BFCL等Agent能力的评测中刷新了开源模型的纪录,显示出其在技术创新上的重大突破。
据悉,借助Qwen3-Coder,初入编程领域的开发者能够在一天内完成以往资深程序员一周才能完成的工作量。比如,创建一个品牌官网的时间缩短至仅需5分钟,这将提高程序员的工作效率,使他们能将更多时间投入到创造和创新当中,而非重复性的基础编程任务。
Qwen3-Coder出色的Agent能力让其在处理多步骤长任务方面表现尤为突出。模型能够概括全局,自主安排工作内容,并支持多种工具的调用来深入研究解决方案。这种能力使得它在面对复杂的编程任务时,能够先进行信息的采集,再制定出详细的实施计划,最终高效完成目标。
行业专家指出,Qwen3-Coder不仅适合专业开发者,也极大降低了普通人学习编程的门槛。其“AI氛围编程”(Vibe Coding)理念让人们只需通过简单的自然语言即可生成复杂的代码。比如,只需一句话,就可以创建出精妙的3D物理模拟效果,这为许多非程序员提供了进入编程世界的机会,实现了技术的民主化。
近年来,开源编程模型的崛起为全球开发者带来了新的机遇。Qwen3-Coder已在魔搭社区、HuggingFace等多个开放上开源,全球开发者可以免费下载并灵活使用它。同时,Qwen3-Coder将逐步接入阿里的AI编程产品“通义灵码”,并已经上线了阿里云“百炼”的API,以便开发者更流畅地进行应用开发。
为了更好地服务开发者,阿里团队还开源了一款名为“Qwen Code”的命令行工具,旨在充分发挥Qwen3-Coder在代理式编程上的潜力。该工具允许开发者以更高效的方式构建和运行代码,让编码过程更加人性化,符合现代开发的需求。
值得关注的是,Qwen3-Coder的API也能够与Claude Code、Cline等其他编程工具协同使用,进一步提升编程工作的灵活性和高效性,这对整个开发生态来说都是一个积极的信号。
阿里开源的Qwen3-Coder的发布,不仅标志着人工智能在程序开发领域的新突破,也预示着编程的未来将迎来一场深刻的变革。随着更智能便捷的工具逐渐被引入到工作流中,开发者的工作方式将发生根本性的变化,他们将能够更专注于创造和实现更有价值的项目,而非耗费精力在繁杂的技术细节中。阿里这一举措,也在进一步推动着AI技术的开放与普及,助力全球开发者共享这一创新成果,从而推动科技的进步与发展。