Anthropic dévoile Claude Opus 4.6 : des équipes d'agents révolutionnaires et un contexte d'un million de tokens transforment le paysage de l'IA d'entreprise

February 06, 2026
Anthropic, Claude
8 min

Résumé des actualités

Anthropic a dévoilé Claude Opus 4.6 le jeudi 5 février 2026 (heure du Pacifique), marquant une avancée significative dans les capacités d'IA d'entreprise. Le nouveau modèle phare présente une fenêtre contextuelle révolutionnaire de 1 million de jetons, une fonctionnalité révolutionnaire d'"équipes d'agents" et des performances de pointe sur les benchmarks de codage, d'analyse financière et de travail de connaissance, le positionnant comme un concurrent direct de GPT-5.2 d'OpenAI.

Anthropic lance Claude Opus 4.6 : l'IA d'entreprise fait un bond quantique avec les équipes d'agents et un contexte d'un million de jetons

San Francisco, 5 février 2026 — Anthropic a publié Claude Opus 4.6 jeudi matin (heure du Pacifique), introduisant ce que l'entreprise décrit comme un changement de paradigme dans l'intelligence artificielle d'entreprise. La dernière itération de son modèle phare offre des capacités sans précédent en matière d'exécution autonome de tâches, de raisonnement étendu et de flux de travail collaboratifs d'IA.

La fenêtre contextuelle révolutionnaire élargit les capacités de l'IA

Claude Opus 4.6 devient le premier modèle de la famille Opus d'Anthropic à prendre en charge une fenêtre contextuelle de 1 million de jetons, le plaçant aux côtés des modèles Gemini de Google dans la catégorie des contextes ultra-longs. Cette expansion massive permet au modèle de traiter environ 1 500 pages de texte, 30 000 lignes de code ou plus d'une heure de contenu vidéo en une seule invite.

Le modèle a démontré des performances exceptionnelles sur le benchmark MRCR v2, atteignant 76 % de précision dans les tâches de récupération d'informations "aiguille dans une botte de foin", contre seulement 18,5 % pour son prédécesseur, Claude Sonnet 4.5. Selon Anthropic, cela représente un changement qualitatif dans l'élimination de la "dégradation du contexte" — la dégradation des performances du modèle sur des conversations prolongées.

Équipes d'agents : traitement parallèle pour des flux de travail complexes

L'introduction des "équipes d'agents" marque un changement architectural fondamental dans la manière dont Claude aborde les tâches complexes. Au lieu d'une exécution séquentielle des tâches par un seul agent, Opus 4.6 peut désormais déployer plusieurs agents spécialisés travaillant en parallèle, chacun gérant des composants distincts tout en se coordonnant directement les uns avec les autres.

Scott White, responsable des produits d'entreprise chez Anthropic, a comparé cette fonctionnalité à la gestion d'une équipe humaine talentueuse. "Vous pouvez répartir le travail entre plusieurs agents — chacun possédant sa partie et se coordonnant directement avec les autres", a expliqué White dans une interview à TechCrunch. Cette capacité est actuellement disponible en avant-première de recherche pour les utilisateurs de l'API et les clients abonnés.

Domination des benchmarks dans les domaines professionnels

Claude Opus 4.6 a établi de nouveaux records de performance dans plusieurs évaluations standard de l'industrie :

Excellence en codage : Le modèle a obtenu un score de 65,4 % sur Terminal-Bench 2.0, le score le plus élevé jamais enregistré sur cette évaluation de codage agentique. Il devance également ses concurrents sur le benchmark d'utilisation informatique agentique OSWorld, avec un score de 72,7 % contre 66,3 % pour Opus 4.5.

Analyse financière et juridique : Sur GDPval-AA, qui mesure les performances sur le travail de connaissance économiquement précieux, Opus 4.6 a atteint 1 606 points Elo — surpassant GPT-5.2 d'OpenAI d'environ 144 points Elo et son prédécesseur de 190 points. Le modèle a également atteint 90,2 % sur BigLaw Bench, le score le plus élevé de tous les modèles Claude sur les tâches de raisonnement juridique.

Résolution de problèmes novateurs : Peut-être le plus remarquable, Opus 4.6 a obtenu 68,8 % sur le benchmark ARC AGI 2, qui teste des problèmes faciles pour les humains mais notoirement difficiles pour les systèmes d'IA. Cela représente une amélioration de 83 % par rapport au score de 37,6 % d'Opus 4.5.

Récupération d'informations : Le modèle a atteint le score le plus élevé de l'industrie sur BrowseComp, démontrant une capacité supérieure à localiser des informations difficiles à trouver sur le Web.

Intégration approfondie de Microsoft Office

Anthropic a annoncé des améliorations substantielles de ses intégrations avec la suite Office. Claude dans Excel peut désormais gérer des tâches plus longues et plus complexes et appliquer des transformations en plusieurs étapes en une seule opération sans nécessiter d'explications structurelles explicites.

La société a également dévoilé Claude dans PowerPoint en avant-première de recherche, permettant à l'IA de lire les mises en page, les polices et les modèles d'entreprise existants, puis de générer ou de modifier des présentations qui maintiennent la cohérence de la marque. Cette intégration est disponible en version bêta pour les clients des plans Max, Team et Enterprise.

Contrôles d'API avancés pour la flexibilité des développeurs

Opus 4.6 introduit plusieurs fonctionnalités sophistiquées pour les développeurs d'API :

Pensée adaptative : Le modèle peut déterminer de manière autonome quand employer un raisonnement plus approfondi par rapport à des réponses rapides, en utilisant des indices contextuels pour équilibrer la qualité par rapport à la latence et au coût.

Niveaux d'effort : Les développeurs obtiennent un contrôle explicite grâce à quatre paramètres d'effort (faible, moyen, élevé et maximum), permettant des compromis précis entre intelligence, vitesse et coût de calcul.

Compactage du contexte : Une fonctionnalité bêta qui résume automatiquement les anciens segments de conversation lorsque les limites de contexte sont atteintes, permettant des interactions extrêmement longues sans dégradation des performances.

Impact sur le marché et adoption par les entreprises

La publication a déclenché une réaction significative du marché. Les actions technologiques ont connu une volatilité substantielle plus tôt cette semaine suite à l'annonce par Anthropic de plugins spécifiques à l'industrie pour son outil Cowork. Thomson Reuters a chuté de 15,83 % mardi, tandis que LegalZoom a baissé de près de 20 %, les investisseurs pesant le potentiel de l'IA à déplacer les logiciels spécialisés de recherche et d'analyse financière.

Malgré ces préoccupations du marché, l'adoption par les entreprises continue de s'accélérer. Selon une récente enquête d'Andreessen Horowitz, 44 % des entreprises utilisent désormais Anthropic dans des environnements de production — la plus forte augmentation de part de tous les laboratoires d'IA de pointe depuis mai 2025.

Les déploiements réels sont prometteurs

Les partenaires ayant bénéficié d'un accès anticipé ont signalé des gains de productivité substantiels. Rakuten a déployé Opus 4.6 pour gérer de manière autonome une organisation de 50 personnes, résolvant avec succès 13 problèmes en une seule journée. Sarah Sachs, responsable de l'IA chez Notion, a décrit le modèle comme évoluant au-delà d'un outil pour devenir "un collaborateur véritablement capable".

Michael Truell, cofondateur de la plateforme de codage IA Cursor, a noté la persistance du modèle sur des problèmes difficiles : "Claude Opus 4.6 excelle sur les problèmes les plus difficiles. Il fait preuve d'une plus grande persistance, d'une revue de code plus solide et de la capacité à rester sur de longues tâches où d'autres modèles ont tendance à abandonner."

Prix et disponibilité

Anthropic a maintenu sa structure de prix compétitive à 5 $ par million de jetons d'entrée et 25 $ par million de jetons de sortie. Le modèle est immédiatement disponible via claude.ai, l'API Claude (ID du modèle : claude-opus-4-6) et toutes les principales plateformes cloud, y compris Amazon Web Services, Google Cloud et Microsoft Azure.

Le modèle est également intégré à GitHub Copilot et est progressivement déployé auprès des utilisateurs de Copilot Pro, Pro+, Business et Enterprise.

Engagements en matière de sécurité et d'alignement

Selon la carte système complète d'Anthropic, Opus 4.6 maintient un profil de sécurité global égal ou supérieur à celui de tout autre modèle de pointe, avec de faibles taux de comportement non aligné lors des évaluations de sécurité. L'entreprise souligne que la sécurité n'a pas été sacrifiée au profit des gains de performance.

Contexte industriel et concurrence

Le lancement intervient 72 heures seulement après la sortie de Codex par OpenAI, soulignant le rythme accéléré de la concurrence dans les outils de développement d'IA. White a déclaré aux médias qu'Anthropic avait fait passer Claude de "un modèle avec lequel on peut un peu parler pour accomplir une très petite tâche" à "quelque chose à quoi l'on peut réellement confier un travail important".

Cette sortie positionne Anthropic pour ce que White a appelé l'ère du "vibe working", où les travailleurs du savoir délèguent de plus en plus des tâches professionnelles substantielles à des systèmes d'IA capables d'exécution autonome avec une supervision minimale.

Claude Opus 4.6 représente l'offre d'IA d'entreprise la plus ambitieuse d'Anthropic à ce jour, combinant des avancées techniques dans le traitement du contexte, la coordination d'agents parallèles et l'expertise spécifique à un domaine pour contester les hypothèses prédominantes sur le rôle de l'IA dans les flux de travail professionnels.