阿里巴巴重磅开源Qwen3-Coder:480B参数编程AI模型引领开源技术新纪元
新闻摘要
阿里巴巴通义千问团队于2025年7月22日正式开源其最新编程AI模型Qwen3-Coder-480B-A35B-Instruct,这是一个拥有480亿总参数、35亿激活参数的混合专家(MoE)架构模型,在代码生成、智能体编程等任务上达到开源模型领先水平,性能可与Anthropic的Claude Sonnet 4媲美。
技术突破引领行业
Qwen3-Coder采用混合专家(MoE)架构,总参数量高达480B,激活参数为35B,原生支持256K token上下文,并可通过YaRN技术扩展至1M token长度。这一技术突破使其能够处理大型代码库和复杂的编程任务,为开发者提供了前所未有的代码理解和生成能力。
该模型在代码占比70%的7.5T数据上进行预训练,支持包括Python、JavaScript、Java、C++等在内的92种编程语言。通过大规模预训练和强化学习,Qwen3-Coder在代码生成、代码修复、代码补全等核心功能上表现卓越。
性能基准创新高
在多项权威评测中,Qwen3-Coder展现出令人瞩目的性能表现。在SWE-Bench Verified测试中,该模型超越了包括Kim K2和GPT-4.1在内的多个竞争对手,在代码和问题解决任务上展现出卓越能力。
在智能体编程(Agentic Coding)、智能体浏览器使用(Agentic Browser-Use)和智能体工具使用(Agentic Tool-Use)等任务上,Qwen3-Coder达到了开源模型的最先进水平,性能可与Claude Sonnet 4相媲美。
开发生态全面布局
为提升开发者体验,阿里巴巴同步开源了配套的命令行工具Qwen Code。该工具基于Gemini Code项目修改而成,专门针对Qwen3-Coder系列模型增强了解析器和工具支持,能够充分发挥模型在智能体编程方面的潜力。
Qwen3-Coder的API还可与Claude Code、Cline等主流开发工具协同使用,目前已在魔搭社区、HuggingFace等平台开源,后续将接入阿里的AI编程产品通义灵码。
全球影响与市场前景
业界专家认为,Qwen3-Coder的发布将对全球AI编程领域产生深远影响。Omdia首席分析师Lian Jye Su表示:"西方科技领导者可能会发现像Qwen3-Coder这样的开源编程模型因其在各项基准测试中的表现而具有吸引力。"
Everest Group实践总监Abhishek Sengupta指出:"中国的AI技术栈,包括基础模型和GPU硬件的进步,可能导致整体AI成本的降低。随着美国对AI生态系统共享采取更加限制性的方法,这可能为中国替代方案打开全球市场。"
开源策略引领未来
Qwen3-Coder采用Apache 2.0开源许可证,确保全球开发者和研究者能够自由使用和改进这些模型。这一开放策略体现了阿里巴巴对推动全球AI技术发展的承诺,也为开源AI社区注入了新的活力。
随着AI编程工具的不断演进,Qwen3-Coder的发布标志着开源大模型在代码生成和智能体编程领域达到了新的里程碑。这不仅为全球开发者提供了强大的编程助手,也为AI技术的民主化和普及化开辟了新的道路。