4月1日に発生したJALのシステム障害は追加されたキャッシュの排他処理によるデッドロックが原因 4
ストーリー by hylom
どうしてこうなった 部門より
どうしてこうなった 部門より
あるAnonymous Coward 曰く、
4月1日、日本航空の重量管理システムで障害が発生したが、この原因が新たに追加されたキャッシュの排他制御機構にあることが判明した。元々実装されていたディスクの排他制御との間でデッドロックが発生したために障害が起きたという(日経ITpro)。
3月23日に開発元から提供されたパッチでキャッシュの排他制御機構が追加されたそうだが、なぜこの排他制御機構が追加されたのかは不明だという。
キャッシュの排他制御機構? (スコア:1)
Re: (スコア:0)
キャッシュと本物が互いの排他をとって互いに更新しようとしたんじゃない?
Re:キャッシュの排他制御機構? (スコア:1)
・キャッシュは、ほぼ読み込みのみ
・ディスクは、読み書きがある
・キャッシュとディスクはネットワーク上の別ノード
当初
・ディスクのみ排他処理アリ
パッチ後
・キャッシュ、ディスクともに「個々に」排他処理アリ
問題点
・トランザクション的に次の2パターンがあった
1.キャッシュアクセス → ディスクアクセス
2.ディスクアクセス → キャッシュアクセス
・キャッシュアクセス、ディスクアクセスで別々に排他処理をしていた
開けてみればシンプルなデッドロックではありますが・・・・
Re: (スコア:0)
白ヤギさんからお手紙ついた、黒ヤギさんたら読まずに食べた
仕方がないのでお手紙書いた「さっきの手紙のご用事なあに」
黒ヤギさんからお手紙ついた、白ヤギさんたら読まずに食べた
仕方がないのでお手紙書いた「さっきの手紙のご用事なあに」
:
:
:
こんな感じ?