AWS米国東部データセンターのDNS障害がグローバルインターネットサービスの麻痺を引き起こす:AIプラットフォームと金融システムが深刻な打撃
概要
2025年10月20日、アマゾン ウェブ サービス(AWS)の米国東海岸データセンターで大規模な障害が発生し、世界中の数千のウェブサイトやアプリケーションサービスが数時間にわたり停止しました。この障害は、ChatGPTやPerplexityなどのAIプラットフォーム、RobinhoodやVenmoなどの金融サービス、SnapchatやSignalなどのソーシャルアプリケーションを含む広範囲に影響を及ぼしました。障害の原因は、AWS米国東部リージョン1(US-EAST-1)におけるDNS解決の問題であり、世界中で累計650万件以上の障害報告が寄せられました。
2025年10月20日未明、世界最大のクラウドサービスプロバイダーであるアマゾン ウェブ サービス(AWS)で深刻な障害が発生し、インターネットサービスが大規模に中断しました。この事態は、現代のデジタルインフラが単一のクラウドサービスプロバイダーに過度に依存するリスクを改めて浮き彫りにしました。
障害のタイムラインと影響範囲
AWSのヘルスダッシュボードによると、障害は米国東部時間10月20日午前0時11分(日本時間同日午後1時11分)に初めて報告され、主にバージニア州にあるAWS米国東部リージョン1(US-EAST-1)データセンターに影響を及ぼしました。
障害初期、AWSは複数のサービスで「著しいエラー率」と遅延が発生していることを確認しました。米国東部時間午前1時26分、同社は問題がDynamoDBデータベースサービスのDNS解決障害に関連していることを確認しました。DNSシステムはウェブサイトのドメイン名をIPアドレスに変換する役割を担っており、その障害により多数のアプリケーションがAWSでホストされているデータベースに正常に接続できなくなりました。
米国東部時間午前3時35分までに、AWSは主要なDNS問題が「完全に緩和された」と発表しましたが、サービスの復旧作業は午後6時までかかり、ようやく完了しました。障害は全体で17時間以上にわたり、一部のサービスでは午後になっても断続的な問題が発生しました。
AIサービスと金融プラットフォームが深刻な打撃
今回の障害は、人工知能サービスに顕著な影響を与えました。OpenAIのChatGPTではシングルサインオン(SSO)の問題が発生し、ユーザーは正常にログインして利用できませんでした。AI検索エンジンPerplexityのCEOであるアラビンド・スリニバス氏は、ソーシャルプラットフォームXで「Perplexityは現在ダウンしており、根本原因はAWSの問題です。解決に向けて取り組んでいます」と確認しました。
フィンテックプラットフォームも同様に大きな打撃を受けました。モバイル決済アプリVenmo、デジタル銀行Chime、暗号通貨取引所Coinbase、株式取引プラットフォームRobinhoodがいずれもサービス中断を報告しました。英国の複数の銀行の顧客はカード決済ができないと報告し、スコットランド銀行はソーシャルメディアで顧客に謝罪しました。
ソーシャル、ゲーム、教育分野が全面的に被害
ソーシャルメディアと通信アプリケーションが広範囲で機能停止しました。Snapchatユーザーは継続的に技術的な問題に遭遇し、暗号化通信アプリSignalの社長であるメレディス・ウィテカー氏は、サービス中断がAWSの障害に関連していることを確認しました。ビデオ会議プラットフォームZoom、コラボレーションツールSlack、デザインプラットフォームCanvaがいずれも接続問題に見舞われました。
ゲーム業界も例外ではありませんでした。人気ゲームのFortnite、Roblox、Pokemon GO、およびEpic Gamesストアがいずれもログインおよび接続障害を報告しました。米国の数千の大学やK-12教育機関で使用されているオンライン学習プラットフォームCanvasは、障害によりアクセスできなくなり、米国東部時間午後2時30分まで「AWS継続イベント」の警告が表示され、学生の課題提出やコース教材へのアクセスに影響を及ぼしました。
スマートデバイスと企業サービスが停止
Amazon独自のスマートアシスタントAlexaは完全に反応しなくなり、ユーザーは音声でスマートホームデバイスを操作できなくなりました。Ringスマートドアベル、Amazon Prime Videoなどのサービスも問題が発生しました。ニューヨークのラガーディア空港ではセルフチェックインシステムがダウンし、乗客が長蛇の列を作りました。
英国政府のウェブサイト、具体的には歳入関税庁(HMRC)および政府公式サイトがいずれもアクセス問題に見舞われました。ライドシェアサービスLyft、フードデリバリーアプリMcDonald's、出会い系アプリHingeなど、数百のサービスが影響を受けました。
障害追跡サイトDowndetectorのデータによると、世界中で累計1100万件以上の障害報告が寄せられ、ピーク時には1日の報告数が5万件を突破しました。
技術的根源と復旧プロセス
AWSはその後の更新で、障害の根本原因が「ネットワークロードバランサーの健全性を監視する基盤となる内部サブシステム」の問題にあったことを明らかにしました。このコアコンポーネントの障害が連鎖反応を引き起こし、まずDynamoDBのDNS解決の失敗を招き、その後EC2(エラスティック・コンピュート・クラウド)インスタンスの起動に影響を与えました。
米国東部時間午前8時43分、AWSは「ネットワーク接続問題の根本原因の範囲を絞り込んだ」と述べました。さらなる負荷を避けるため、同社は新しいEC2インスタンスの起動リクエストに対してスロットリング(流量制限)措置を実施しました。復旧プロセス中、AWSは段階的にスロットリングを解除しましたが、Lambdaサーバーレスコンピューティングプラットフォームに蓄積されたリクエストキューの処理には追加の時間が必要でした。
AWSは午後6時の最終更新で、「サービスは正常に稼働を再開した」と確認し、EC2インスタンスの起動スロットリングも障害発生前のレベルに戻ったと述べました。
業界の反応と警鐘
サイバーセキュリティ専門家のクリスチャン・エスピノーザ氏は、「今回のAWSと英国の主要プラットフォームに影響を与えた大規模な障害は、デジタル世界が驚くほど脆弱な基盤の上に成り立っていることを厳しく思い起こさせるものです。クラウドサービスの集中化、つまり少数のプロバイダーがほとんどの重要なシステムをホストしている状況は、単一障害点を作り出します。あるデータリージョンやプロバイダーがダウンすると、小売、金融、物流、通信のあらゆる分野に連鎖反応が波及します」と指摘しました。
インターネット性能監視会社CatchpointのCEOであるメディ・ダウディ氏は、今回の障害による経済的損失はまだ評価中だが、「極めて甚大」になる可能性があると述べました。
テスラCEOのイーロン・マスク氏は、障害発生中にXプラットフォームで嘲笑的な投稿を行い、自身のソーシャルプラットフォームが影響を受けていないことを強調し、Amazon創業者ジェフ・ベゾスを揶揄するミームをリポストしました。
AWSは世界のクラウドコンピューティング市場で約30%のシェアを占め、Microsoft AzureおよびGoogle Cloudと三つ巴の状況を形成しています。今回の事態は、世界のインターネットトラフィックの主要なハブの一つであるAWS米国東部リージョン1で発生しました。アナリストは、多くの企業がリージョン間またはクラウドプロバイダー間の冗長性メカニズムを十分に実装しておらず、単一障害点の影響が拡大したと指摘しています。
AWSが米国東部リージョン1で重大な障害を起こしたのは今回が初めてではありません。2020年、2021年、2023年にも、このリージョンで大規模なサービス中断を引き起こす事態が発生しています。
将来の展望
今回の障害は、企業が単一のクラウドサービスプロバイダーへの依存リスクを低減するため、マルチクラウドおよびハイブリッドクラウド戦略への移行を加速させると予想されます。業界関係者は、クラウドサービス中断に特化した事業中断保険が増加する可能性があると予測しています。
AWSは、今回の事態について徹底的な調査を行い、システム冗長性と障害復旧メカニズムの改善を約束すると表明しました。米国東部時間10月20日夜までに、すべてのサービスは正常に復旧しましたが、この数時間にわたる世界的な中断は、インターネットインフラの過度な集中化リスクに関する議論を再び巻き起こしました。