7月2日に発生したKDDIの大規模障害は2日が経過しても完全には収まらなかった。7月4日夕方以降、7月5日午後3時36分の完全復旧までは「ほぼ終息したものの、経過を見守る」状況が続いた。
この大規模障害は音声を中心としたものだったが、種々の事情により、当初はデータ通信にも大きな影響を受けた。
そうしたことが影響したのは、なにも個人だけではない。企業契約に基づく多くの業務用端末や、コネクテッド・カーにも被害が及んでいる。
今の世の中、通信・通話をするのは人間だけではない。むしろ今後はさらに、機器同士が通信することによって生まれる価値が拡大していくだろう。
その時、このような被害はどう回避すればいいのだろうか? 少し、考えてみたいと思う。
まず、今回の障害について少しだけ、原因などを振り返ってみたい。といっても、KDDI自身にも全てが判明しているわけではないので、あくまで「経緯」の理解に近い。
7月2日午前1時35分、メンテナンスの一環としてコアルーターのうち1つを、旧製品から新製品へ切り替え作業をした際、その影響からか、音声通話を担当する「VoLTE交換機」でアラートが発生。音声トラフィックの一部が短時間、不通になった。
そのアラームに対処するため、音声トラフィックを元に戻す「切り戻し処理」を実施したが、それを発端として再接続要求などの通信流量が増大、結果として、VoLTE交換機で通信が集中して不具合が発生する「輻輳」(ふくそう)が全国で発生した。さらにそこから「加入者DB」に影響が出て、輻輳の影響は増大する。
2日午前3時、VoLTE交換機の負荷軽減を目的とした「流量制御」が始まり、全国規模で音声通話・データ通信がしづらくなっていった。
種々の対策の結果、最終的に5日14時51分、流量制限は解除され、通信は全面的に回復している。
……とまあ、シンプルに言えば「多重玉突き事故」のようなものである。
特に影響が大きかったのは、音声通話だ。これは、VoLTE交換機が長く動作不良を起こしていたためだ。流量規制に伴ってデータ通信がしづらい時期はあったが、時間がたつとともに「データ通信はできる」という話になっていったのもこのためである。
Copyright © ITmedia, Inc. All Rights Reserved.
続きを読むには、コメントの利用規約に同意し「アイティメディアID」および「ITmedia NEWS アンカーデスクマガジン」の登録が必要です