阿里巴巴发布万亿参数旗舰模型Qwen3-Max-Preview 开启中国AI技术新纪元

2025-09-09
Alibaba
5 min

新闻摘要

阿里巴巴于2025年9月5日发布首个万亿参数大语言模型Qwen3-Max-Preview,这是Qwen系列中参数规模最大的旗舰级模型,标志着中国AI技术在超大规模模型领域实现重大突破。该模型采用非推理架构,在多项基准测试中表现优异,支持超过100种语言,可通过Qwen Chat网页端免费体验或通过阿里云百炼平台API调用。

技术规格与创新突破

Qwen3-Max-Preview作为Qwen3系列的旗舰级预览版本,参数规模超过1万亿,成为已知开放API模型中最大的之一。该模型采用混合专家模型(MoE)架构,通过动态激活专家模块的方式,在保持强大性能的同时显著降低推理成本。

值得注意的是,Qwen3-Max-Preview采用非推理模型架构,但通过优化设计在推理能力上仍实现了显著提升。模型支持超过256K tokens的上下文处理能力,可以处理长文档、复杂对话和大规模代码文件等场景。

性能表现全面领先

根据官方公布的基准测试结果,Qwen3-Max-Preview在多个权威评测中表现出色:

  • 数学推理(AIME25):得分80.6%,作为非推理模型表现突出
  • 编程能力(LiveCodeBench v6):得分57.6%,编程辅助能力显著增强
  • 通用知识(SuperGPQA):在通用知识问答中展现强大理解能力
  • 人类偏好对齐(Arena-Hard v2):在复杂指令遵循方面表现优异

测试结果显示,Qwen3-Max-Preview在多项指标上超越了Claude Opus 4(非思考模式)、Kimi K2、DeepSeek-V3.1等国内外主流模型,证明了规模化扩展的有效性。

核心能力全面升级

相较于前代Qwen2.5系列,Qwen3-Max-Preview在以下几个维度实现了大幅提升:

语言理解与生成:支持超过100种语言,中英文理解能力出色,多语言翻译质量显著提升。

推理与指令执行:复杂逻辑推理准确性大幅提升,对复杂指令的理解和执行能力增强,显著减少模型幻觉现象。

工具调用优化:针对检索增强生成(RAG)和工具调用进行特别优化,为构建强大的AI Agent应用奠定基础。

长尾知识覆盖:专业领域知识覆盖更全面,知识广度与稳健性同步提升。

应用场景与商业价值

Qwen3-Max-Preview的发布为多个行业带来了新的应用可能:

企业级文档处理:超长上下文能力使其能够处理大型企业文档、合同分析等复杂任务。

智能编程助手:强大的代码理解和生成能力,可为开发者提供高质量的编程辅助。

多语言客服:支持100多种语言,为跨国企业提供统一的多语言客户服务解决方案。

内容创作与策略规划:在创意写作、广告文案、战略分析等领域展现出强大潜力。

商业策略与市场定位

与此前开源策略不同,阿里巴巴选择将Qwen3-Max-Preview作为闭源商业模型发布。该模型采用与Claude、GPT-4相近的定价策略,但具有一定的成本优势,体现了阿里巴巴对模型性能的信心。

用户可通过两种方式体验该模型:一是通过Qwen Chat(chat.qwen.ai)网页端进行免费体验,二是通过阿里云百炼平台的API接口进行商业调用。平台还为新用户提供每模型100万免费Token的体验额度。

技术意义与行业影响

Qwen3-Max-Preview的发布具有重要的技术意义和行业价值:

技术突破:万亿参数规模展示了中国AI企业在超大规模模型研发方面的技术实力,标志着中国在AI基础模型领域取得重要突破。

产业推动:为国内AI应用开发者提供了世界级的基础模型支撑,有助于推动中国AI产业的整体发展。

竞争格局:在全球AI模型竞争中,中国企业正在缩小与国际领先企业的差距,甚至在某些指标上实现领先。

未来展望

作为预览版本,Qwen3-Max-Preview的能力仍在持续打磨中。阿里巴巴表示,正式版将带来更多惊喜,"Scaling works"的理念将继续指导模型的发展方向。

该模型的发布恰逢国际AI环境变化的关键时期,展现了中国AI技术自主创新的决心与实力。随着更多用户的实际体验和反馈,Qwen3-Max-Preview有望在企业级应用中发挥更大价值,为中国AI产业的发展注入新的动力。

目前,该模型已在阿里云百炼平台开放API接入服务,开发者可通过标准OpenAI API格式快速集成,预计将在智能客服、内容创作、编程辅助等多个领域得到广泛应用。