CloudWatch 新アクション機能 – EC2インスタンスのリブート
Amazon CloudWatch はAmazon Elastic Compute Cloud (EC2) インスタンスを含むクラウドリソース、アプリケーションの監視を行います。クラウド、システム、アプリケーションメトリックを監視し、グラフ形式で確認、指定した閾値を超えると (CloudWatchアラームを介して) 通知するよう設定することができます。アラームが発生した場合、EC2インスタンスを停止、終了することも可能です (詳細に関しましては、下記blogを参照ください-Amazon CloudWatch – Alarm Actions)。
新機能 - インスタンス再起動
本日4つ目のアクションを発表しました。これにより、CloudWatch のアラームが発生した際にEC2インスタンスを再起動するように設定できるようになりました。クラウド、システム、およびアプリケーションメトリックの監視、アラート通知と併用することで、より柔軟にご利用頂くことができます。
instance status check が繰り返し失敗した場合は、インスタンスを再起動することができます。メモリリークを起こす暴走しているアプリケーションやサービスが原因となり、メモリが不足しているかもしれません。インスタンスの再起動は、この状況を改善するために迅速かつ簡単な方法です。EBS-Backed インスタンスタイプであったり、インスタンスが壊れた時にのみ適用されるごく一部の復旧作業とは対照的に、このアクションはすべてのインスタンスタイプで利用可能で、インスタンスの状態に関係なく効果的です。
アプリケーション メトリックを監視するためにCloudWatch API または AWS コマンドラインインターフェイス (CLI) を使用すると、アプリケーションが繰り返し期待通りに応答しなかった場合、インスタンスを再起動することができます。プロセスがスタックしているか、アプリケーションサーバーが正常に動作しないこともあるでしょう。多くの場合、(仮想) リセットスイッチを押すことが、再び正常に動作させるための簡単でシンプルな方法でしょう。
アラームの作成
CPU使用率が長期間90%を超えたままであれば、インスタンスの1つを再起動するアラームを作成する手順について見ていきましょう。AWS Management Console 中にインスタンスを見つけ、Alarm Status 欄のアイコンをクリックします。
”Take Action” をクリックし、”Reboot Instance”を選択、パラメータの設定を行います (今回はCPU使用率が90%以上の状態が15分以上続く場合)。
必要に応じてステップの一部としてIAMロールの作成が確認されます (これは新機能です)。
このロールはCloudWatchの”Describe”機能とEC2 APIをコールを許可するものになります。またインスタンスの再起動、停止、終了も許可します。
”Create Alarm”をクリックし、設定は完了です!
この機能は現在利用可能であり、すべてのAWS Regionで本日より利用可能になります。
--Jeff; (翻訳は酒徳が担当させて頂きました。原文はNew Amazon CloudWatch Action – Reboot EC2 Instance)
コメント