経営のトピックス-PR-
ANAシステム障害の原因判明、シスコ製スイッチの「世界初のバグ」でDBサーバーがダウン
全日本空輸(ANA)は2016年3月30日、3月22日に発生した国内線システムの不具合について、原因や再発防止策などを公表した。国内線システムの4台のデータベース(DB)サーバーをつなぐ米シスコシステムズ製イーサネットスイッチの故障が原因だった。
4時間40分かけて4台が次々停止
ANAによれば、3月22日午前3時44分にDBサーバーの1台が停止した。その後2台が停止し、約4時間40分後の午前8時22分に最後の1台も停止。DBサーバーが停止した理由は「正常に機能が働いた」(ANA広報)ため。4台のDBサーバーはデータを同期しており、同期処理が異常終了した場合に自動停止する機能を備えていた。
同期処理が失敗した原因は、4台をつなぐスイッチの不具合。具体的には、スイッチが故障状態であるにもかからず、故障を知らせる「故障シグナル」を発信しなかった。国内線システムは故障シグナルを検知するとスイッチを予備機に切り替えるが、今回はその機能そのものを作動できなかった。
スイッチは完全に停止したわけではなく、「不安定ながらも動作していたようだ」(同)。そのため、DBサーバー間の同期は順次失敗し、停止していったと見られる。
ANA広報によると、スイッチは米シスコシステムズ製「Catalyst 4948E」という。「2010年6月の発売開始以降、世界で4万3000台、うち日本で8700台を販売しているが、今回の不具合は初めての事象と聞いている」(ANA広報)。なぜ「故障シグナル」が発信できなかったかは分かっていない。
1台での縮退運転を決断
4台の完全停止から37分後、ANAは1台のDBサーバーを再起動。だが「2台起動すると2台とも停止する」(同)といった不安定な状況が続いた。
最新ニュース記事一覧へ >>
- 富士通が新金融ソリューション群を発表、3年で500億円の事業に (2016/03/30)
- [データは語る]「デジタル化への支出が75%以上」の企業は世界平均で20%、日本企業は8%―ガートナー ジャパン (2016/03/30)
- [データは語る]国内企業の5割以上がエンタープライズITトランスフォーメーション成熟度で「レベル3」以上-IDC (2016/03/30)
- イッツコムが渋谷区と情報連携、「防災行政無線」の情報をIPボックスで提供 (2016/03/30)
今週のトピックス-PR-
ITpro Special
What's New!
Pick Up!
- 対談メディーバ×オープンストリーム
- Azureと連携したプライベートクラウド
- MS平野社長が自ら語るIT活用効果とは
- OSSを活用!選ばれるミドルウエアとは?
- IT部門こそイノベーションの「主役」である
- IT部門が管理しないグループウエア≫詳細は
- ベンダー生き残りのカギはここにある!≫
- デルタ航空やコカコーラに学ぶデジタル経営
- 3つの施策に見える、NECが躍進する理由
- 認証印刷の先へ 紙からの情報漏洩を防止
- BIG-IPでセキュリティPDCAを確立
- 身近に迫るサイバーテロの危険をどう防ぐか
- IoTの可能性を広げるマーケットプレイス
- ITインフラのコスト削減方法に関する調査
- ポケットサイズの「企業の重要資産」とは?
- わずか1行のコードがITインフラを制御可?
- 調査結果が示す!モバイルワークのリスク
- FacebookやアリババがOSSを使う理由とは
- セキュリティ現場は皆がデータ流出経験者?
- 48時間で影響分析完了!? ERP移行の新常識は
- ワークスタイル変革に関する調査
- ワークステーションと高性能PCに関する調査
- コンパクトな複合機がビジネスを変える!
- レノボとニュータニックス、成長市場で協業
- Windows10への引っ越しツール
- 京セラのアメーバ経営を支援するクラウド
- クラウドビジネスの立ち上げを支援します!
- ストレージは今、50年に一度の大変革期に
- “アイデアエコノミー”の時代がやってきた
- 池澤あやかがIBM Bluemix Watson APIを学ぶ