阿里巴巴發布萬億參數旗艦模型Qwen3-Max-Preview 開啟中國AI技術新紀元

September 09, 2025

Alibaba

5 min

新聞摘要

阿里巴巴於2025年9月5日發布首個萬億參數大語言模型Qwen3-Max-Preview，這是Qwen系列中參數規模最大的旗艦級模型，標誌著中國AI技術在超大規模模型領域實現重大突破。該模型採用非推理架構，在多項基準測試中表現優異，支援超過100種語言，可透過Qwen Chat網頁端免費體驗或透過阿里云百煉平台API調用。

技術規格與創新突破

Qwen3-Max-Preview作為Qwen3系列的旗艦級預覽版本，參數規模超過1萬億，成為已知開放API模型中最大之一。該模型採用混合專家模型（MoE）架構，透過動態激活專家模組的方式，在保持強大性能的同時顯著降低推理成本。

值得注意的是，Qwen3-Max-Preview採用非推理模型架構，但透過優化設計在推理能力上仍實現了顯著提升。模型支援超過256K tokens的上下文處理能力，可以處理長文件、複雜對話和大規模程式碼文件等場景。

性能表現全面領先

根據官方公布的基準測試結果，Qwen3-Max-Preview在多個權威評測中表現出色：

數學推理（AIME25）：得分80.6%，作為非推理模型表現突出
程式設計能力（LiveCodeBench v6）：得分57.6%，程式設計輔助能力顯著增強
通用知識（SuperGPQA）：在通用知識問答中展現強大理解能力
人類偏好對齊（Arena-Hard v2）：在複雜指令遵循方面表現優異

測試結果顯示，Qwen3-Max-Preview在多項指標上超越了Claude Opus 4（非思考模式）、Kimi K2、DeepSeek-V3.1等國內外主流模型，證明了規模化擴展的有效性。

核心能力全面升級

相較於前代Qwen2.5系列，Qwen3-Max-Preview在以下幾個維度實現了大幅提升：

語言理解與生成：支援超過100種語言，中英文理解能力出色，多語言翻譯品質顯著提升。

推理與指令執行：複雜邏輯推理準確性大幅提升，對複雜指令的理解和執行能力增強，顯著減少模型幻覺現象。

工具調用優化：針對檢索增強生成（RAG）和工具調用進行特別優化，為建構強大的AI Agent應用奠定基礎。

長尾知識覆蓋：專業領域知識覆蓋更全面，知識廣度與穩健性同步提升。

應用場景與商業價值

Qwen3-Max-Preview的發布為多個行業帶來了新的應用可能：

企業級文件處理：超長上下文能力使其能夠處理大型企業文件、合約分析等複雜任務。

智能程式設計助手：強大的程式碼理解和生成能力，可為開發者提供高品質的程式設計輔助。

多語言客服：支援100多種語言，為跨國企業提供統一的多語言客戶服務解決方案。

內容創作與策略規劃：在創意寫作、廣告文案、戰略分析等領域展現出強大潛力。

商業策略與市場定位

與此前開源策略不同，阿里巴巴選擇將Qwen3-Max-Preview作為閉源商業模型發布。該模型採用與Claude、GPT-4相近的定價策略，但具有一定的成本優勢，體現了阿里巴巴對模型性能的信心。

用戶可透過兩種方式體驗該模型：一是透過Qwen Chat（chat.qwen.ai）網頁端進行免費體驗，二是透過阿里云百煉平台的API接口進行商業調用。平台還為新用戶提供每模型100萬免費Token的體驗額度。

技術意義與行業影響

Qwen3-Max-Preview的發布具有重要的技術意義和行業價值：

技術突破：萬億參數規模展示了中國AI企業在超大規模模型研發方面的技術實力，標誌著中國在AI基礎模型領域取得重要突破。

產業推動：為國內AI應用開發者提供了世界級的基礎模型支撐，有助於推動中國AI產業的整體發展。

競爭格局：在全球AI模型競爭中，中國企業正在縮小與國際領先企業的差距，甚至在某些指標上實現領先。

未來展望

作為預覽版本，Qwen3-Max-Preview的能力仍在持續打磨中。阿里巴巴表示，正式版將帶來更多驚喜，"Scaling works"的理念將繼續指導模型的發展方向。

該模型的發布恰逢國際AI環境變化的關鍵時期，展現了中國AI技術自主創新的決心與實力。隨著更多用戶的實際體驗和反饋，Qwen3-Max-Preview有望在企業級應用中發揮更大價值，為中國AI產業的發展注入新的動力。

目前，該模型已在阿里云百煉平台開放API接入服務，開發者可透過標準OpenAI API格式快速整合，預計將在智能客服、內容創作、程式設計輔助等多個領域得到廣泛應用。