AnthropicがClaude Opus 4.5を大々的に発表: 80%のプログラミングベンチマークを初めて突破したAIモデル、性能は人間を超え価格は67%削減

November 25, 2025
Anthropic
3 min

ニュース概要

Anthropicは2025年11月24日、最新のフラッグシップAIモデル「Claude Opus 4.5」を正式にリリースしました。このモデルは、ソフトウェア開発、推論能力、複雑な多段階タスク処理において画期的な向上を実現しており、現在、Claudeアプリケーション、API、および主要な3つのクラウドプラットフォームを通じてユーザーに提供されています。これは、9月のSonnet 4.5、10月のHaiku 4.5のリリースに続く、Anthropicにとって2ヶ月で3度目の主要モデル発表であり、AI業界の競争が激化していることを示しています。


Claude Opus 4.5の最も顕著な変更点は、価格の大幅な引き下げです。入力トークン100万あたり5ドル、出力トークン25ドルと設定され、前世代のOpus 4.1の15ドル/75ドルと比較して67%の値下げとなり、最先端のAI能力がより広く利用可能になりました。この価格戦略により、OpenAIのGPT-5.1(1.25ドル/10ドル)やGoogleのGemini 3 Pro(2ドル/12ドル)との競争において、より魅力的な選択肢となります。

性能面では、Claude Opus 4.5はSWE-bench Verifiedベンチマークテストで80.9%の精度を達成し、80%の大台を突破した初のモデルとなりました。これはOpenAIのGPT-5.1-Codex-Max(77.9%)とGoogleのGemini 3 Pro(76.2%)を上回るものです。このベンチマークは、AIシステムが実際のソフトウェアエンジニアリングタスクでどのように機能するかを専門的にテストするものであり、Claude Opus 4.5の成績は業界の新たな基準を示しています。

さらに驚くべきことに、Anthropicが性能エンジニア採用時に使用する実際の技術試験でOpus 4.5をテストしたところ、このモデルはこれまでのすべての人間応募者の最高得点を上回りました。この結果は、AI技術がホワイトカラーの職業をどのように再構築するかについて、業界内で深い議論を巻き起こしています。

技術面では、Claude Opus 4.5は20万トークンのコンテキストウィンドウと6.4万トークンの出力制限を備え、知識のカットオフ日は2025年3月に更新されています。モデルはメモリ管理において大幅な改善が施され、特に長文コンテキスト操作に最適化されており、重要な詳細をより賢く記憶できるようになりました。これらの改善により、複数のHaikuサブエージェントの協調作業を指揮するメインエージェントとして特に適しています。

実際のアプリケーションでは、初期テスターからOpus 4.5がSonnet 4.5ではほとんど不可能だったタスクを処理でき、複雑なマルチシステム問題に直面しても手取り足取りの指示なしで解決策を見つけられるとのフィードバックがありました。有名な開発者Simon Willisonは、週末のテストでClaude Codeを使用してsqlite-utilsの大規模なリファクタリングを完了し、2日間で39ファイル、2022行の追加コード、1173行の削除を含む20回のコミットを行いました。

セキュリティ面では、AnthropicはOpus 4.5がこれまでで最も堅牢にアラインされたモデルであり、プロンプトインジェクション攻撃に対する防御において大きな進歩を遂げ、業界の他のどの最先端モデルよりも騙されにくいと述べています。これは、Claudeをミッションクリティカルなタスクに使用する企業顧客にとって特に重要です。

モデルのリリースと同時に、Anthropicは一連の製品アップデートを発表しました。Claude for Chrome拡張機能はすべてのMaxユーザーに開放され、Claude for ExcelはMax、Team、Enterpriseユーザー向けに正式リリースされ、ピボットテーブル、グラフ、ファイルアップロードをサポートします。デスクトップ版Claude Codeアプリケーションも正式リリースされ、Windows、macOS、Windows (Arm 64)プラットフォームをサポートし、開発者が複数のコーディングまたは研究セッションを並行して実行できるようにします。

注目すべきは、Anthropicが使用制限を調整し、Opus 4.5へのアクセス権を持つユーザーが以前のSonnetレベルと同様のレベルでモデルを使用できるようにしたことです。これは、ユーザーが日常業務で過度な制限を心配する必要がないことを意味します。

市場競争の状況では、MicrosoftとNVIDIAが先週、Anthropicに数十億ドル規模の投資を行うと発表し、このAIラボの評価額は約3500億ドルに上昇しました。Anthropicは2025年第1四半期に年間売上高20億ドルを達成し、前四半期の10億ドルから倍増しました。年間10万ドル以上を支出する顧客数は前年比8倍に増加しています。

Claude Opus 4.5のリリースは、AI業界が激しい競争に直面している時期に行われました。OpenAIは11月12日にGPT-5.1をリリースし、Googleは11月18日にGemini 3を発表しましたが、AnthropicはOpus 4.5で市場に応答した形です。Anthropicの製品責任者Scott White氏は、「私たちが市場にリリースする製品の数と、そこから生まれるフィードバックループに非常に興奮している」と述べています。

ターゲットユーザー層について、White氏はOpus 4.5の理想的なユーザーは、プロのソフトウェア開発者や、金融アナリスト、コンサルタント、会計士といった知識労働者、そして創造性を推進し、新しいものを構築したいと願う人々であると指摘しました。

開発者はAPIを通じてモデル文字列「claude-opus-4-5-20251101」を使用してClaude Opus 4.5を呼び出すことができ、プロンプトキャッシュによる90%のコスト削減とバッチ処理による50%のコスト削減を享受できます。このモデルは、Amazon Bedrock、Google CloudのVertex AI、Microsoft Foundryなどのプラットフォームで利用可能になっています。

Anthropicは、Opus 4.5が「前例のないユースケース」のために生まれた高度なモデルであり、特にプロのソフトウェアエンジニアリング、複雑なエージェントワークフロー、高リスクの企業タスクに適していると強調しています。そのハイブリッド推論能力により、即時応答と拡張思考の間で柔軟に切り替えることができ、APIユーザーはモデルが応答に費やす全体的な労力を細かく調整し、パフォーマンス、レイテンシ、コストのバランスを取ることができます。

業界パートナーからのフィードバックもOpus 4.5の強力な能力を裏付けています。Lovableは、このモデルがチャットモードで最先端の推論能力を提供し、深い推論が計画方法を変え、優れた計画がより良いコード生成につながると述べています。Warpは、Terminal BenchテストでOpus 4.5がSonnet 4.5よりも15%向上したと報告しており、これはプランニングモードでの使用において特に顕著です。金融モデリング企業Fundamental Research Labsの共同創設者Nico Christie氏は、社内評価で精度が20%向上し、効率が15%向上したことで、かつては手の届かないと思われていた複雑なタスクが実現可能になったと述べています。

Claude Opus 4.5のリリースは、Anthropicの技術力の新たな突破を示すだけでなく、AIアシスタントが単純なQ&Aツールから、複雑な専門タスクを自律的に完了できるインテリジェントシステムへと進化していることを示唆しています。価格の大幅な引き下げと能力の著しい向上により、AI技術の商業的応用はさらに加速し、あらゆる業界に深い変革をもたらすことが期待されます。