阿里巴巴發布萬億參數旗艦模型Qwen3-Max-Preview 開啟中國AI技術新紀元
新聞摘要
阿里巴巴於2025年9月5日發布首個萬億參數大語言模型Qwen3-Max-Preview,這是Qwen系列中參數規模最大的旗艦級模型,標誌著中國AI技術在超大規模模型領域實現重大突破。該模型採用非推理架構,在多項基準測試中表現優異,支援超過100種語言,可透過Qwen Chat網頁端免費體驗或透過阿里云百煉平台API調用。
技術規格與創新突破
Qwen3-Max-Preview作為Qwen3系列的旗艦級預覽版本,參數規模超過1萬億,成為已知開放API模型中最大之一。該模型採用混合專家模型(MoE)架構,透過動態激活專家模組的方式,在保持強大性能的同時顯著降低推理成本。
值得注意的是,Qwen3-Max-Preview採用非推理模型架構,但透過優化設計在推理能力上仍實現了顯著提升。模型支援超過256K tokens的上下文處理能力,可以處理長文件、複雜對話和大規模程式碼文件等場景。
性能表現全面領先
根據官方公布的基準測試結果,Qwen3-Max-Preview在多個權威評測中表現出色:
- 數學推理(AIME25):得分80.6%,作為非推理模型表現突出
- 程式設計能力(LiveCodeBench v6):得分57.6%,程式設計輔助能力顯著增強
- 通用知識(SuperGPQA):在通用知識問答中展現強大理解能力
- 人類偏好對齊(Arena-Hard v2):在複雜指令遵循方面表現優異
測試結果顯示,Qwen3-Max-Preview在多項指標上超越了Claude Opus 4(非思考模式)、Kimi K2、DeepSeek-V3.1等國內外主流模型,證明了規模化擴展的有效性。
核心能力全面升級
相較於前代Qwen2.5系列,Qwen3-Max-Preview在以下幾個維度實現了大幅提升:
語言理解與生成:支援超過100種語言,中英文理解能力出色,多語言翻譯品質顯著提升。
推理與指令執行:複雜邏輯推理準確性大幅提升,對複雜指令的理解和執行能力增強,顯著減少模型幻覺現象。
工具調用優化:針對檢索增強生成(RAG)和工具調用進行特別優化,為建構強大的AI Agent應用奠定基礎。
長尾知識覆蓋:專業領域知識覆蓋更全面,知識廣度與穩健性同步提升。
應用場景與商業價值
Qwen3-Max-Preview的發布為多個行業帶來了新的應用可能:
企業級文件處理:超長上下文能力使其能夠處理大型企業文件、合約分析等複雜任務。
智能程式設計助手:強大的程式碼理解和生成能力,可為開發者提供高品質的程式設計輔助。
多語言客服:支援100多種語言,為跨國企業提供統一的多語言客戶服務解決方案。
內容創作與策略規劃:在創意寫作、廣告文案、戰略分析等領域展現出強大潛力。
商業策略與市場定位
與此前開源策略不同,阿里巴巴選擇將Qwen3-Max-Preview作為閉源商業模型發布。該模型採用與Claude、GPT-4相近的定價策略,但具有一定的成本優勢,體現了阿里巴巴對模型性能的信心。
用戶可透過兩種方式體驗該模型:一是透過Qwen Chat(chat.qwen.ai)網頁端進行免費體驗,二是透過阿里云百煉平台的API接口進行商業調用。平台還為新用戶提供每模型100萬免費Token的體驗額度。
技術意義與行業影響
Qwen3-Max-Preview的發布具有重要的技術意義和行業價值:
技術突破:萬億參數規模展示了中國AI企業在超大規模模型研發方面的技術實力,標誌著中國在AI基礎模型領域取得重要突破。
產業推動:為國內AI應用開發者提供了世界級的基礎模型支撐,有助於推動中國AI產業的整體發展。
競爭格局:在全球AI模型競爭中,中國企業正在縮小與國際領先企業的差距,甚至在某些指標上實現領先。
未來展望
作為預覽版本,Qwen3-Max-Preview的能力仍在持續打磨中。阿里巴巴表示,正式版將帶來更多驚喜,"Scaling works"的理念將繼續指導模型的發展方向。
該模型的發布恰逢國際AI環境變化的關鍵時期,展現了中國AI技術自主創新的決心與實力。隨著更多用戶的實際體驗和反饋,Qwen3-Max-Preview有望在企業級應用中發揮更大價值,為中國AI產業的發展注入新的動力。
目前,該模型已在阿里云百煉平台開放API接入服務,開發者可透過標準OpenAI API格式快速整合,預計將在智能客服、內容創作、程式設計輔助等多個領域得到廣泛應用。