Le premier modèle d'IA de génération d'images développé en interne par Microsoft, MAI-Image-1, est lancé et se classe dans le top 10 de LMArena, accélérant le processus d'autonomisation de l'IA
Résumé
Microsoft a annoncé le 13 octobre 2025 (heure de l'Est des États-Unis) le lancement de MAI-Image-1, son premier modèle d'IA de génération d'images à partir de texte entièrement développé en interne. Dès sa publication, ce modèle s'est classé parmi les dix premiers du classement LMArena, marquant une étape importante pour le géant technologique dans la réduction de sa dépendance vis-à-vis d'OpenAI et le développement de ses propres capacités d'IA.
Le département IA de Microsoft a officiellement lancé MAI-Image-1 ce lundi, le premier modèle de génération d'images entièrement conçu et développé par les équipes internes de l'entreprise. Dès le jour de son lancement, ce nouvel outil a atteint la 9ème position du classement LMArena de texte à image, avec un score initial de 1 096 points.
Selon le blog officiel de Microsoft, le développement de MAI-Image-1 a mis un accent particulier sur les besoins créatifs du monde réel. L'équipe de développement a collaboré étroitement avec des professionnels de l'industrie créative pour recueillir des retours, l'objectif étant d'éviter les problèmes courants de "sorties répétitives ou de style uniforme" souvent rencontrés avec les générateurs d'images IA.
En termes de performances techniques, MAI-Image-1 excelle dans la génération d'images photoréalistes, se distinguant particulièrement dans le traitement des effets d'éclairage complexes. Le modèle est capable de rendre avec précision des détails tels que la lumière réfléchie, les effets de réflexion et les paysages naturels. Microsoft souligne que, comparé à de nombreux modèles plus volumineux et plus lents, MAI-Image-1 est plus rapide pour traiter les prompts et générer des images. Cette combinaison de vitesse et de qualité permet aux créateurs de visualiser rapidement leurs idées et d'itérer rapidement.
Actuellement, MAI-Image-1 est en phase de test public sur la plateforme LMArena, et Microsoft a déclaré qu'il intégrerait "bientôt" le modèle à Copilot et au créateur d'images Bing. Cette stratégie vise à recueillir les retours et les insights des utilisateurs avant un déploiement officiel à grande échelle.
Le lancement de ce nouveau modèle s'inscrit dans la stratégie plus large de Microsoft en matière d'IA développée en interne. En août dernier, Microsoft avait déjà lancé deux modèles propriétaires : MAI-Voice-1, un modèle de génération de voix naturelle, et MAI-1-preview, un modèle de texte fondamental. Mustafa Suleyman, PDG de Microsoft AI, avait précédemment révélé dans une interview que l'entreprise disposait d'une "vaste feuille de route sur cinq ans, dans laquelle nous investissons chaque trimestre".
Il est à noter que, bien que Microsoft reste un investisseur et partenaire majeur d'OpenAI, le lancement de MAI-Image-1 démontre que Microsoft s'emploie activement à développer ses propres capacités de modèles d'IA. Récemment, Microsoft a également ajouté des modèles d'IA tiers, tels que ceux de Mistral, Anthropic et xAI, à sa plateforme cloud Azure, diversifiant ainsi davantage ses sources de technologie IA.
Selon des rapports, Satya Nadella, PDG de Microsoft, a déclaré lors d'une réunion interne le mois dernier qu'il "attend avec impatience que nous développions nos capacités de modèles afin de pouvoir créer des produits axés sur le modèle". Cette déclaration confirme davantage la détermination de Microsoft à se développer de manière autonome dans le domaine de l'IA.
Dans le classement LMArena, MAI-Image-1 occupe actuellement la 9ème place, tandis que Gemini 2.5 Flash de Google (nom de code "Nano Banana") est classé 2ème (1 154 points) et le modèle d'OpenAI est 7ème (1 123 points). Ce classement est basé sur les votes comparatifs des utilisateurs concernant les images générées par différents systèmes d'IA.
Microsoft s'engage à garantir la sécurité et l'utilisation responsable de MAI-Image-1. Grâce à la phase de test initiale sur LMArena, l'entreprise espère comprendre pleinement les performances du modèle et recueillir des suggestions d'amélioration avant un déploiement à grande échelle.
Le lancement de MAI-Image-1 apporte une nouvelle force concurrentielle au domaine de la génération d'images par IA et démontre l'ambition de Microsoft en matière de recherche et développement autonome dans les technologies d'intelligence artificielle. Alors que le modèle sera bientôt intégré aux produits Copilot et Bing, utilisés par des milliards d'utilisateurs, ses performances réelles seront soumises à l'épreuve du marché.