パスワードを忘れた? アカウント作成
12748088 story
バグ

4月1日に発生したJALのシステム障害は追加されたキャッシュの排他処理によるデッドロックが原因 4

ストーリー by hylom
どうしてこうなった 部門より
あるAnonymous Coward 曰く、

4月1日、日本航空の重量管理システムで障害が発生したが、この原因が新たに追加されたキャッシュの排他制御機構にあることが判明した。元々実装されていたディスクの排他制御との間でデッドロックが発生したために障害が起きたという(日経ITpro)。

3月23日に開発元から提供されたパッチでキャッシュの排他制御機構が追加されたそうだが、なぜこの排他制御機構が追加されたのかは不明だという。

  • この場合のキャッシュの排他制御機構って何だろう。 良かれと思ってDogpile対策にStale Cache返却ロジックでも勝手にfcntl lockで組み込んだのかね?(勝手な想像)
    ここに返信
    • by Anonymous Coward

      キャッシュと本物が互いの排他をとって互いに更新しようとしたんじゃない?

      • 前提
        ・キャッシュは、ほぼ読み込みのみ
        ・ディスクは、読み書きがある
        ・キャッシュとディスクはネットワーク上の別ノード

        当初
        ・ディスクのみ排他処理アリ

        パッチ後
        ・キャッシュ、ディスクともに「個々に」排他処理アリ

        問題点
        ・トランザクション的に次の2パターンがあった
         1.キャッシュアクセス → ディスクアクセス
         2.ディスクアクセス → キャッシュアクセス
        ・キャッシュアクセス、ディスクアクセスで別々に排他処理をしていた

        開けてみればシンプルなデッドロックではありますが・・・・
      • by Anonymous Coward

        白ヤギさんからお手紙ついた、黒ヤギさんたら読まずに食べた
        仕方がないのでお手紙書いた「さっきの手紙のご用事なあに」

        黒ヤギさんからお手紙ついた、白ヤギさんたら読まずに食べた
        仕方がないのでお手紙書いた「さっきの手紙のご用事なあに」
                     :
                     :
                     :
        こんな感じ?

typodupeerror

クラックを法規制強化で止められると思ってる奴は頭がおかしい -- あるアレゲ人

読み込み中...