ネットサービス

AWSの大規模障害でウェブの半分がダウンし数十兆円規模の経済的損失が出たとの指摘、優秀なエンジニアがAWSを離れている証拠であるという指摘も


日本時間の2025年10月20日、Amazonが提供するクラウドコンピューティングサービス・Amazon Web Services(AWS)で大規模障害が発生しました。インターネット上の何百万人もの人々に影響を与えたAWSの大規模障害は、2024年に起きたCrowdStrike事件以来最悪の大規模障害とも言われており、数千億円規模の損害が発生したという指摘もあります。

Amazon’s DNS problem knocked out half the web, likely costing billions - Ars Technica
https://arstechnica.com/tech-policy/2025/10/amazons-dns-problem-knocked-out-half-the-web-likely-costing-billions/

Amazon says AWS cloud service back to normal after outage disrupts businesses worldwide | Reuters
https://www.reuters.com/business/retail-consumer/amazons-cloud-unit-reports-outage-several-websites-down-2025-10-20/

Amazon brain drain finally caught up with AWS • The Register
https://www.theregister.com/2025/10/20/aws_outage_amazon_brain_drain_corey_quinn/

日本時間の2025年10月20日、AWSのus-east(アメリカ東部)-1リージョンで大規模な障害が発生し、AWSを利用している多種多様なオンラインシステムがアクセス不能に陥りました。影響を受けたサービスにはAmazonの自社サービス以外にも、App Storeやイギリス政府の公式サイト、フォートナイト、パルワールド、Nintendo Switch Onlineなど多岐にわたります。

Amazon Web Services(AWS)障害が大規模化したのは「us-east-1」リージョンがSPOF化していることに起因している - GIGAZINE

by Tony Webster from Minneapolis, Minnesota, United States

AWSで起きた大規模障害の影響を受けたサービスは、Snapchat、Signal、Redditといった人気サービスから、航空サービスや銀行・金融サービスまでさまざまです。最終的に何百万もの企業が業務を停止し、従業員のシステムログインや商品代金の支払い受付ができなくなりました。

インターネットパフォーマンス監視サービスを提供するCatchpointのメフディ・ダウディCEOは、「今回のインシデントは、インターネットの複雑さと脆弱(ぜいじゃく)性、そして私たちの仕事のあらゆる側面がインターネットにどれほど依存しているかを浮き彫りにしています。この障害による経済的影響は、何百万人もの労働者の生産性の低下により業務が遂行できず、航空会社から工場に至るまで、事業活動が停止または遅延するため、数千億ドル(数十兆円)に上るでしょう」と語りました。

AWSはステータスページ上で、障害が発生したのは「AWSで最も古く、ウェブサービスとしては最大規模のus-east-1で発生した」と報告。これに対して、ロイター通信はAWSのus-east-1で大規模障害が起きたのは、過去5年間で3度目であると指摘。今回の障害についてAmazonは詳細な説明を行っていませんが、ロイター通信は「DNSに起因しており、アプリケーションがAWSのDynamoDB APIの正しいアドレスを見つけられなかったため」と指摘しています。なお、DynamoDBはユーザー情報やその他の重要なデータの保存に利用されているクラウドデータベースです。


ZDNetはAWSの障害について、最初の兆候は「多数の主要サービスにおけるエラー率とレイテンシの増加だった」と指摘。「エンジニアは後に、DNS解決の問題がこれらの問題の根本原因であると特定し、迅速に修正したものの、他のAWSサービスにも障害が発生し始め、20以上のAWSサービスが停止したため、プラットフォームは機能不全に陥った」と解説しています。

なお、ZDNetによるとインターネット上の接続障害などに関する報告をリアルタイムでまとめるDowndetectorでは、障害発生時に800万件以上の報告が寄せられていたそうです。

コーネル大学でコンピューターサイエンスの教授を務めるケン・バーマン氏は、「ソフトウェア開発者はより優れた耐障害性を構築する必要がある」「アプリケーションを立ち上げるためにコストを削減し、手抜きをした後で最後のステップを省き、実際にはシステム停止に対する保護を怠った企業こそ、後で精査されるべき企業です」と語り、Amazonは今回の障害を防ぐためにもっと多くのことをできたはずだと示唆しました。


2023年末にはAWSを退職したジャスティン・ギャリソン氏が、同社における人員削減の動きを痛烈に批判し、AWSで大規模イベント(LSE)が増加しているため、2024年には大規模な障害が発生するだろうと予測しました。このような指摘があることを踏まえ、The Registerは「今回のAWSの障害が優秀なエンジニアがAWSを離れたことが原因である可能性がある」と報じています。

なお、AWSは2022年から2万7000人以上の人員削減を実施していますが、同社は人員問題について口が堅いことで有名であるため、このうち何人がAWSの従業員だったのかを知ることは困難です。また、流出した内部資料から、Amazonの離職率が最低69.5%、最高81.3%に達しており、この人材流出による損失は年間80億ドル(約1兆2000億円)にもおよぶと推計されています。このことから、「辞めてほしくない優秀な人材がAmazonを離れていることは明らか」とThe Registerは指摘しました。

これらを踏まえ、The Registerは「深刻な障害の原因を理解していた人材はますます失われつつあるようで、新しくスリムになったチームは、こうした障害を防ぐことができないようです。それでも障害の検知と復旧までの時間を大幅に短縮するために必要な組織的な知識が欠けているのは問題です」「AWSの運用の強みは、経験豊富な余剰人員によって築かれており、人員削減を行えば、基本的な機能が崩壊し始めます」と指摘しています。

◆フォーラム開設中
本記事に関連するフォーラムをGIGAZINE公式Discordサーバーに設置しました。誰でも自由に書き込めるので、どしどしコメントしてください!Discordアカウントを持っていない場合は、アカウント作成手順解説記事を参考にアカウントを作成してみてください!

• Discord | "AWSの大規模障害で身の回りや仕事にどんな影響があった?" | GIGAZINE(ギガジン)
https://discord.com/channels/1037961069903216680/1430485664566345760

この記事のタイトルとURLをコピーする

・関連記事
Amazon Web Services(AWS)障害が大規模化したのは「us-east-1」リージョンがSPOF化していることに起因している - GIGAZINE

AIで若手社員を置き換えるのは「今まで聞いた中で最も愚かなこと」だとAWSのマット・ガーマンCEOが語る - GIGAZINE

Amazonが1万4000人の管理職を解雇予定、年間5400億円節約できる見込み - GIGAZINE

Amazonがクラウドサービス「AWS」の実店舗やマーケティング部門で数百人の従業員を解雇 - GIGAZINE

in ネットサービス, Posted by logu_ii

You can read the machine translated English article A massive AWS outage has taken down half….