AnthropicがClaude Opus 4.6を発表:革新的なエージェントチームと100万トークンのコンテキストがエンタープライズAIの状況を一変させる

February 06, 2026
Anthropic, Claude
4 min

ニュースサマリー

Anthropicは2月5日(太平洋標準時)木曜日にClaude Opus 4.6を発表し、エンタープライズAIの能力において重要な進歩を遂げました。新しいフラッグシップモデルは、画期的な100万トークンのコンテキストウィンドウ、革新的な「エージェントチーム」機能、コーディング、財務分析、ナレッジワークのベンチマークにおける最先端のパフォーマンスを特徴とし、OpenAIのGPT-5.2の直接的な競合として位置づけられています。

Anthropic、Claude Opus 4.6を発表:エージェントチームと100万トークンコンテキストでエンタープライズAIが飛躍

サンフランシスコ、2026年2月5日 — Anthropicは木曜日の午前(太平洋標準時)、Claude Opus 4.6をリリースし、同社がエンタープライズ人工知能におけるパラダイムシフトと呼ぶものを導入しました。そのフラッグシップモデルの最新版は、自律的なタスク実行、拡張された推論、および協調的なAIワークフローにおいて前例のない能力を提供します。

革新的なコンテキストウィンドウがAIの能力を拡張

Claude Opus 4.6は、AnthropicのOpusファミリーで初めて100万トークンのコンテキストウィンドウをサポートするモデルとなり、超長文コンテキストのカテゴリでGoogleのGeminiモデルと肩を並べます。この大幅な拡張により、モデルは単一のプロンプトで約1,500ページに及ぶテキスト、30,000行のコード、または1時間以上のビデオコンテンツを処理できます。

このモデルはMRCR v2ベンチマークで卓越したパフォーマンスを示し、ニードルインアヘイスタック情報検索タスクで76%の精度を達成しました。これは、前身であるClaude Sonnet 4.5の18.5%と比較して大幅な向上です。Anthropicによると、これは「コンテキストの劣化」—長時間の会話におけるモデルパフォーマンスの低下—を排除する上での質的な変化を表しています。

エージェントチーム:複雑なワークフローのための並列処理

「エージェントチーム」の導入は、Claudeが複雑なタスクに取り組む方法における根本的なアーキテクチャの変更を意味します。単一のエージェントによる逐次的なタスク実行ではなく、Opus 4.6は現在、複数の専門エージェントを並列で展開でき、それぞれが個別のコンポーネントを処理しながら互いに直接連携します。

Anthropicのエンタープライズ製品責任者であるスコット・ホワイト氏は、この機能を優秀な人間のチームを管理することに例えました。「複数のエージェントに作業を分割できます。それぞれが自分の担当部分を所有し、他のエージェントと直接連携します」とホワイト氏はTechCrunchとのインタビューで説明しました。この機能は現在、APIユーザーおよびサブスクリプション顧客向けにリサーチプレビューで利用可能です。

プロフェッショナル分野全体でのベンチマーク支配

Claude Opus 4.6は、複数の業界標準評価で新たなパフォーマンス記録を樹立しました。

コーディングの卓越性: このモデルはTerminal-Bench 2.0で65.4%を獲得し、このエージェンティックコーディング評価で史上最高スコアを記録しました。また、OSWorldエージェンティックコンピューター使用ベンチマークでも競合他社をリードし、Opus 4.5の66.3%と比較して72.7%を獲得しました。

財務および法的分析: 経済的に価値のあるナレッジワークのパフォーマンスを測定するGDPval-AAでは、Opus 4.6は1,606 Eloポイントを達成し、OpenAIのGPT-5.2を約144 Eloポイント、前身を190ポイント上回りました。このモデルは、BigLaw Benchでも90.2%に達し、法的推論タスクにおけるClaudeモデルとして最高スコアを記録しました。

新規問題解決: おそらく最も注目すべきは、Opus 4.6がARC AGI 2ベンチマークで68.8%を獲得したことです。これは、人間には容易だがAIシステムには非常に難しい問題のテストです。これはOpus 4.5の37.6%のスコアから83%の改善を表します。

情報検索: このモデルはBrowseCompで業界最高スコアを達成し、ウェブ上で見つけにくい情報を検索する優れた能力を示しました。

Microsoft Office統合の深化

Anthropicは、Officeスイート統合の大幅なアップグレードを発表しました。ExcelのClaudeは、より長く複雑なタスクを処理できるようになり、明示的な構造の説明を必要とせずに、単一の操作で複数ステップの変換を適用できるようになりました。

同社はまた、PowerPointのClaudeをリサーチプレビューとして発表し、AIが既存のスライドレイアウト、フォント、企業テンプレートを読み取り、ブランドの一貫性を維持しながらプレゼンテーションを生成または編集できるようにしました。この統合は、Max、Team、Enterpriseプランの顧客向けにベータ版で利用可能です。

開発者の柔軟性を高める高度なAPIコントロール

Opus 4.6は、API開発者向けにいくつかの高度な機能を提供します。

適応的思考: モデルは、コンテキストの手がかりを使用して品質とレイテンシおよびコストのバランスを取りながら、より深い推論を採用するか迅速な応答を行うかを自律的に決定できます。

努力レベル: 開発者は、4つの努力設定(低、中、高、最大)を通じて明示的な制御を得ることができ、インテリジェンス、速度、計算コストの間で正確なトレードオフを可能にします。

コンテキスト圧縮: コンテキスト制限が近づいたときに古い会話セグメントを自動的に要約するベータ機能で、パフォーマンスの低下なしに非常に長い対話を可能にします。

市場への影響とエンタープライズ導入

このリリースは、市場に大きな反響を引き起こしました。AnthropicがCoworkツールの業界別プラグインを発表した後、ソフトウェア株は今週初めに大幅な変動を経験しました。投資家がAIによる専門的なリサーチおよび財務分析ソフトウェアの代替の可能性を検討したため、Thomson Reutersは火曜日に15.83%下落し、LegalZoomはほぼ20%下落しました。

これらの市場の懸念にもかかわらず、エンタープライズ導入は加速し続けています。最近のAndreessen Horowitzの調査によると、エンタープライズの44%が現在、本番環境でAnthropicを使用しており、2025年5月以降で最もシェアを伸ばしたフロンティアAIラボとなっています。

実際の展開が有望視される

早期アクセスパートナーは、大幅な生産性向上を報告しました。楽天はOpus 4.6を導入し、50人の組織を自律的に管理し、1日で13件の課題を正常に解決しました。NotionのAI責任者であるサラ・サックス氏は、このモデルがツールを超えて「真に有能な協力者」へと進化していると説明しました。

AIコーディングプラットフォームCursorの共同創設者であるマイケル・トゥレル氏は、困難な問題に対するモデルの粘り強さに言及しました。「Claude Opus 4.6は最も困難な問題に優れています。他のモデルが諦めがちな長いタスクにおいて、より大きな粘り強さ、強力なコードレビュー、そして継続する能力を示しています。」

価格と利用可能性

Anthropicは、入力トークン100万あたり5ドル、出力トークン100万あたり25ドルという競争力のある価格設定を維持しました。このモデルは、claude.ai、Claude API(モデルID:claude-opus-4-6)、およびAmazon Web Services、Google Cloud、Microsoft Azureを含むすべての主要クラウドプラットフォームを通じて即時利用可能です。

このモデルはGitHub Copilotにも統合されており、Copilot Pro、Pro+、Business、Enterpriseユーザー向けに段階的に展開されています。

安全性とアライメントへのコミットメント

Anthropicの広範なシステムカードによると、Opus 4.6は他のどのフロンティアモデルと同等以上の全体的な安全プロファイルを維持しており、安全評価全体でアライメントされていない行動の発生率は低くなっています。同社は、パフォーマンスの向上と引き換えに安全性が犠牲にされていないことを強調しています。

業界の文脈と競争

今回の発表は、OpenAIのCodexリリースからわずか72時間後であり、AI開発ツールにおける競争の加速ペースを浮き彫りにしています。ホワイト氏はメディアに対し、AnthropicはClaudeを「非常に小さなタスクを達成するために話しかけることができるモデル」から「実際に重要な実質的な作業を任せることができるもの」へと移行させたと語りました。

このリリースにより、Anthropicは、知識労働者が最小限の監督で自律的な実行が可能なAIシステムに実質的な専門タスクをますます委任する「バイブワーキング」時代に向けて準備が整いました。

Claude Opus 4.6は、Anthropicのこれまでの最も野心的なエンタープライズAI製品であり、コンテキスト処理、並列エージェント連携、およびドメイン固有の専門知識における技術的進歩を組み合わせることで、プロフェッショナルワークフローにおけるAIの役割に関する既存の前提に挑戦しています。