ニュース

「負荷を過小評価していた」――Google、Gmail障害の原因を説明

Gmailの障害は、Googleが負荷を低く見積もっていたために、トラフィックを転送するルータが過負荷状態になったことが原因だった。


 米Googleは、9月1日にGmailで起きたサービス障害の原因について、ルータの過負荷によるものだったことを明らかにした。

 障害の発端となったのは、同日朝に定期アップグレードのため、Gmailの一部サーバをオフラインにしたことにあると同社は説明している。これらサーバがオフラインになっている間、GmailのWebインタフェースはほかのサーバにトラフィックを送る。このときに、リクエストルータ(トラフィックを適切なGmailサーバに転送するサーバ)の幾つかが過負荷状態になった。Googleが最近リクエストルータに変更を加えた際に、「負荷を少し過小評価していた」ためだという。

 過負荷状態のリクエストルータからほかのルータにトラフィックが転送され、さらに過負荷状態のルータが増え、数分のうちにすべてのリクエストルータが過負荷になった。この結果、Gmailサーバにリクエストが転送されず、ユーザーがGmailにアクセスできなくなった。ただし、IMAP/POPアクセスの場合は違うルータを使っているため、通常通りに動いていた。

 Googleのエンジニアリングチームはキャパシティ不足が問題であると気づき、リクエストルータを追加してサービスを復旧させたという。

 Googleは、Gmailの障害は約100分に及んだとしている。同社は初めこれを「小さな問題」と呼んでいたが、「重大な問題」として扱うと謝罪している。同社は既にリクエストルータを増やすなどの対策を取っており、ほかにも再発防止策に取り組むと述べている。

関連キーワード

Gmail | Google | ルータ | サービス障害


Copyright© 2009 ITmedia, Inc. All Rights Reserved.





キャリアアップ



エンタープライズ・ピックアップ

news011.jpg ITmedia リサーチインタラクティブ 第1回調査:クラウドの真相
ITmedia エンタープライズとITRは「クラウドコンピューティング」関連の読者調査を7月に実施した。クラウドの認知度は9割を超え、実際の活用も進みつつある。その反面、セキュリティやサービスレベルに対する懸念は根強い。企業ユーザーが考えるクラウドの今をお伝えする。

news015.jpg オープンソースソフトウェアの育て方:メーリングリストを120%活用するテクニック
メーリングリストは、プロジェクト内でのコミュニケーションに必要不可欠なものです。本稿では、メーリングリストを徹底的に活用し尽くすためのテクニックを余すところなく紹介します。

news021.jpg コミュニケーションパスは最小限に:ソフトバンクで身につけた仕事術は生きる
著書『ソフトバンク流「超」速断の仕事術』から、複数の仕事を並行して実施することの重要性を説明します。

news001.jpg 最強最速アルゴリズマー養成講座:オーダーを極める思考法
プログラムの実行に掛かる時間を把握しておくのは、プログラミングを行う上で基本的な注意点です。今回は、計算量のオーダーについて学びながら、TopCoderのMedium問題を考えてみましょう。

news081.jpg オルタナブログ通信:選挙がTwitterにもたらした変化
ビジネス・ブログメディア「ITmedia オルタナティブ・ブログ」では、200組を超えるブロガーがITにまつわる時事ネタなどを日々、発信している。今週は、その中から「Twitter」「携帯電話」をテーマに紹介する。