Alibaba lance le modèle phare Qwen3-Max-Preview avec des billions de paramètres, inaugurant une nouvelle ère pour la technologie d'IA en Chine

September 09, 2025

Alibaba

5 min

Résumé de l'actualité

Alibaba a lancé le 5 septembre 2025 son premier grand modèle linguistique (LLM) à un billion de paramètres, Qwen3-Max-Preview. Il s'agit du modèle phare de la série Qwen, doté de la plus grande échelle de paramètres, marquant une avancée majeure pour la technologie d'IA chinoise dans le domaine des modèles à très grande échelle. Ce modèle adopte une architecture non inférentielle, excelle dans plusieurs tests de référence, prend en charge plus de 100 langues et peut être expérimenté gratuitement via l'interface web Qwen Chat ou appelé via l'API de la plateforme Alibaba Cloud Bailian.

Spécifications techniques et innovations majeures

Qwen3-Max-Preview, en tant que version préliminaire phare de la série Qwen3, dépasse le billion de paramètres, ce qui en fait l'un des plus grands modèles API ouverts connus. Le modèle utilise une architecture de type "Mixture of Experts" (MoE), qui, en activant dynamiquement des modules experts, maintient des performances puissantes tout en réduisant considérablement les coûts d'inférence.

Il est à noter que Qwen3-Max-Preview adopte une architecture de modèle non inférentielle, mais grâce à une conception optimisée, il a tout de même réalisé une amélioration significative de ses capacités d'inférence. Le modèle prend en charge une capacité de traitement de contexte de plus de 256K tokens, ce qui lui permet de gérer des documents longs, des conversations complexes et des fichiers de code à grande échelle.

Performances globalement supérieures

Selon les résultats des tests de référence officiellement publiés, Qwen3-Max-Preview a obtenu d'excellents résultats dans plusieurs évaluations faisant autorité :

Raisonnement mathématique (AIME25) : Score de 80,6 %, une performance remarquable pour un modèle non inférentiel.
Capacité de programmation (LiveCodeBench v6) : Score de 57,6 %, avec une assistance à la programmation considérablement améliorée.
Connaissances générales (SuperGPQA) : Démontre une forte capacité de compréhension dans les questions-réponses de connaissances générales.
Alignement des préférences humaines (Arena-Hard v2) : Excellente performance dans le suivi d'instructions complexes.

Les résultats des tests montrent que Qwen3-Max-Preview surpasse des modèles grand public nationaux et internationaux tels que Claude Opus 4 (mode non-réflexion), Kimi K2 et DeepSeek-V3.1 sur plusieurs indicateurs, prouvant l'efficacité de la mise à l'échelle.

Amélioration complète des capacités fondamentales

Par rapport à la série précédente Qwen2.5, Qwen3-Max-Preview a réalisé des améliorations significatives dans les dimensions suivantes :

Compréhension et génération de langage : Prend en charge plus de 100 langues, avec une excellente compréhension du chinois et de l'anglais, et une qualité de traduction multilingue considérablement améliorée.

Raisonnement et exécution d'instructions : La précision du raisonnement logique complexe est considérablement améliorée, la capacité à comprendre et à exécuter des instructions complexes est renforcée, et le phénomène d'hallucination du modèle est significativement réduit.

Optimisation de l'appel d'outils : Spécialement optimisé pour la génération augmentée par récupération (RAG) et l'appel d'outils, jetant les bases de la construction d'applications d'agents IA puissantes.

Couverture des connaissances à longue traîne : La couverture des connaissances dans les domaines professionnels est plus complète, et l'étendue et la robustesse des connaissances sont simultanément améliorées.

Scénarios d'application et valeur commerciale

Le lancement de Qwen3-Max-Preview ouvre de nouvelles possibilités d'application pour plusieurs industries :

Traitement de documents d'entreprise : Sa capacité de contexte ultra-long lui permet de gérer des tâches complexes telles que l'analyse de grands documents d'entreprise et de contrats.

Assistant de programmation intelligent : Ses puissantes capacités de compréhension et de génération de code peuvent fournir une assistance de programmation de haute qualité aux développeurs.

Service client multilingue : Prend en charge plus de 100 langues, offrant une solution de service client multilingue unifiée pour les entreprises internationales.

Création de contenu et planification stratégique : Démontre un potentiel considérable dans des domaines tels que l'écriture créative, la rédaction publicitaire et l'analyse stratégique.

Stratégie commerciale et positionnement sur le marché

Contrairement à sa stratégie open source précédente, Alibaba a choisi de publier Qwen3-Max-Preview en tant que modèle commercial à code source fermé. Ce modèle adopte une stratégie de prix similaire à celle de Claude et GPT-4, mais avec un certain avantage en termes de coûts, ce qui témoigne de la confiance d'Alibaba dans les performances du modèle.

Les utilisateurs peuvent expérimenter le modèle de deux manières : soit gratuitement via l'interface web Qwen Chat (chat.qwen.ai), soit via l'API de la plateforme Alibaba Cloud Bailian pour un usage commercial. La plateforme offre également aux nouveaux utilisateurs un quota d'expérience de 1 million de tokens gratuits par modèle.

Signification technologique et impact sur l'industrie

Le lancement de Qwen3-Max-Preview revêt une signification technologique et une valeur industrielle importantes :

Avancée technologique : L'échelle d d'un billion de paramètres démontre la force technique des entreprises d'IA chinoises dans le développement de modèles à très grande échelle, marquant une avancée majeure pour la Chine dans le domaine des modèles fondamentaux d'IA.

Impulsion industrielle : Fournit un support de modèle fondamental de classe mondiale aux développeurs d'applications d'IA nationaux, contribuant à promouvoir le développement global de l'industrie de l'IA en Chine.

Paysage concurrentiel : Dans la compétition mondiale des modèles d'IA, les entreprises chinoises réduisent l'écart avec les leaders internationaux, et prennent même la tête sur certains indicateurs.

Perspectives d'avenir

En tant que version préliminaire, les capacités de Qwen3-Max-Preview sont encore en cours de perfectionnement. Alibaba a déclaré que la version officielle apportera davantage de surprises, et que le concept "Scaling works" continuera de guider l'orientation du développement du modèle.

Le lancement de ce modèle intervient à un moment clé des changements dans l'environnement international de l'IA, démontrant la détermination et la force de la Chine en matière d'innovation autonome en IA. Avec l'expérience et les retours des utilisateurs, Qwen3-Max-Preview devrait jouer un rôle plus important dans les applications d'entreprise, insufflant un nouvel élan au développement de l'industrie de l'IA en Chine.

Actuellement, le modèle est disponible via l'API sur la plateforme Alibaba Cloud Bailian, permettant aux développeurs de l'intégrer rapidement via le format API standard d'OpenAI. Il devrait être largement appliqué dans divers domaines tels que le service client intelligent, la création de contenu et l'assistance à la programmation.