|
1. はじめに
データホテルパトロールは、本来24時間休むことが不可能な、サーバ監視業
務の負担を自動化することで軽減する為のツールです。
WEBインターフェースにより経験の少ない人にも比較的簡単に監視設定が行え
るように工夫しています。
▽ 目次
2. 監視の基本設定の変更方法
3. 新規の監視設定追加
4. 監視項目の編集及び複製の作成
5. 監視結果の表示
6. エラーメールの内容
7. 監視設定のコツ
8. 利用規約
2. 監視の基本設定の変更方法
「基本設定」では、監視項目の基本的な動作を定義出来ます。
ただし、最初のうちはアラートメールの送信設定以外に変更の必要はない
でしょう。
まずデータホテルパトロールの管理画面にログインし、「基本設定」のタブを
クリックします。
「基本設定」画面では以下の項目が設定可能です。
これらの設定はあなたが登録している監視項目すべてに対して有効となります。
編集の反映は一番下の「更新」ボタンをクリックしてください。
約5分で内容が反映されます。
▽ 監視インターバル
監視の基本インターバルは1分ですので、最短の設定は1分となります。
しかしこのように短いサイクルで実行することは問題もあります。
例えばエラーのメールが頻繁に送信されてしまいますので、
「メールの送信方法」の項目にて間欠的にメールを送信する工夫が必要です。
またWEBサーバ側にログが大量に残るなどの問題もあるかもしれません。
その場合はインターバルの設定を長めに設定する必要があるでしょう。
現状で設定の選択肢は
1、2、3、4、5、10、15、20、25、30分、1時間、2時間、4時間、6時間
が選択出来ますが、バランスを考えて3分から5分程度をお勧めしています。
以前は一旦設定したサイクルが一巡するまで新しい設定が反映されない問題
がありましたが、現在は修正されております。
▽ 監視モード
監視の実行のタイミングを以下の3種類から指定できます。
日時を指定した場合は、「監視開始時刻」と「監視停止時刻」にて、範囲を指定します。
: 常時監視
: 指定日時の範囲で繰り返し監視を実行
: 指定日時の範囲は監視を行わない
: 監視停止日時で指定した時間に1度のみ監視を実行
▽ 監視開始時刻
監視モードで「指定日時の範囲で繰り返し監視を実行」を選択した場合の開
始日時
▽ 監視停止時刻
監視モードで「指定日時の範囲で繰り返し監視を実行」を選択した場合の停
止日時監視モードで「監視停止日時で指定した時間に1度のみ監視を実行」を
選択した場合の監視実行日時
「監視開始時刻」と「監視停止時刻」は例えば「月」を無効とした場合は、
その右辺の「日、時、分」は全て設定してください。
間を飛ばして設定できません。
▽ メールの送信方法
監視アラートメールの送信方法を以下の6つから選択できます。
新規で登録頂いた状態では「送信停止」に設定されています。
1: 常に送信
2: 送信停止
3: 3回異常で自動停止、3回正常で復帰
4: 3回異常で自動停止、1回正常で復帰
5: 3回異常で自動停止、3回正常で復帰 復帰通知有り
6: 3回異常で自動停止、1回正常で復帰 復帰通知有り
7: 1回異常で自動停止、1回正常で復帰 復帰通知有り
注意点!
3,4,5,6,7 を選択した場合、IDに登録されている監視項目の一つでもエラーになる、または
すべての項目が正常である場合にしか送信停止開始のアクションを起こしません。
但し例外として、この間も他の監視設定がエラーを拾った場合はその都度メールを送信します。
しかし理想としては一つのIDで できるだけ同一のサーバに対する監視を行うよう工夫をしてください。
もちろん複数のIDを登録されて頂いても構いません。
5,6,7 はメール停止状態から復帰した場合に、その旨をメールで通知してくれます。
3,4,5,6,7 は自動でエラーメールの送信を停止しますので、メールの読こぼしに注意してください。
基本は1の「常に送信」をお勧めします。
▽ メールのプライオリティー
アラートメールのヘッダーにプライオリティーを追加することが出来ます。
通常は3に設定されています。
▽ 備考
この監視についてのメモなどが入力できます。
3. 新規の監視設定追加
「監視設定」の画面で「監視項目の追加」をクリックすると、対話的に新規の
監視設定が行えます。
PORT、とSNMPの選択が可能ですが、ここでは比較的簡単なPORT監視のみ説明し
ます。
SNMP監視については、こちらを参考にしてみてください。
必要な項目が埋まった時点で次に説明する監視エディターに内容が反映されます。
細かい調整はエディタ内で編集可能です。
■ 監視エディタ
監視エディタには以下の設定項目があります。
項目は監視の属性により一部変化します。
▽ 監視状態
設定した監視を実行する(ON)か停止する(OFF)かを選択できます。
(OFF)が初期状態です。
▽ 監視属性
通常監視とSNMP監視が選択できますが、SNMPについてはここでは説明致しま
せん。
▽ 検知条件
通常は接続ができないなどの異常を検知した場合にエラーと判断しますが、
「正常動作でアラート」を設定すると、設定した監視動作が成功した場合に
エラーと判断します。
つまり正、逆の設定が可能ですが、通常は「異常検知でアラート」設定にし
てください。
▽ 監視プロトコル
ICMP(v4v6)、TRAC、TCP(v4v6)、UDP、URL&GET&OPT&DEF(http各v4v6)、SSL(https)、SMTP(v4v6)、HOST、MYSQL、PGSQL、SSH(v4v6)、POP(v4v6)、FTP(v4v6)などの選択
ができます。
- ICMP -
対象サーバまでのネットワークの状態や、対象サーバの存在を確認する為
にICMPを利用することは有効です。
但し、ICMPは対象となる機器がICMPプロトコル対応していることが条件と
なるので、事前に確認してください。
この監視はICMPエコー要求に対して対象の機器がエコー応答を返すことを
10回程度繰り返し、その都度パケットの往復時間を計測し平均値を出します。
10回の内に2回以上パケットが戻らない場合と、往復時間がしきい値を2回以上
越えた場合、そして当然ですが疎通そのものが出来ない場合はエラーとなります。
しきい値で「1」を選択した場合、100msがしきい値になります。
- V6ICMP -
ICMPのIPV6対応版です。
使い方は同じですが、同じURLでこちらを選択するとIPV6の名前解決を試みます。
- ICMP2 -
以前存在した監視ですが、現在はICMPを選択した場合と同じ動きをします。
- TRAC(試験公開中)-
対象サーバまでの経路の変化と、経路の各ルータとのRTTをチェックします。
対象サーバのUDP33434〜33449番ポートに対してUDPパケットを送信し、対象
がICMPポート不達パケットを返すことを期待していますので、FWでこの
ポートをオープンしておく必要があります。
それまでの経路を記憶しておき、前回の経路情報と比較します。
前回の経路と変化があった場合はエラーと判断しますが、その回の経路情報
を新たに記録しますので、エラーメールが飛ぶのはその時一回だけとなります。
- TCP -
この監視は対象のIPとポート番号にて正常にTCPコネクションが行えることを
5回連続して確認し、その都度接続に要した時間を計測して平均値を出します。
もしも接続が行えないことが2回を越えたり、接続に要した時間がしきい値を
上回った場合が2回以上おきた場合、疎通そのものが行えない場合は絵エラー
となります。
しきい値で「1」を選択した場合、1000msがしきい値になります。
- TCP6 -
TCPのIPV6対応版です。
使い方は同じですが、同じURLでこちらを選択するとIPV6の名前解決を試みます。
- UDP -
対象のポートに対してパケットを投げ、ICMPポート不達パケットが戻るか
戻らないかを判断しています。なので対象がICMPをサポートしていること、
ICMPに対してフィルタリングが行われいないことが条件となります。
またUDPははっきりとしたコネクション形態を取れないので、あくまでも
参考と考えてください。
- URL -
先に上げたTCP監視に加え、対象のURL(http,https)が正常かを判断します。
WEBサーバが返すステータス番号を判断しますが、判断の基準は以下に従います。
200番台 :
正常と判断します。
300番台 :
Locationヘッダーがあれば、そのURIに接続しなおします。
但しその動作は5回以上繰り返しません。
それ以上の回数繰り返す場合はエラーになります。
401番 :
BASIC(基本)認証の場合、もしもアカウント名と平文パスワードを定期的に
ネットに流すことに何らためらいが無いのでしたら、以下のように記載する
ことで認証を通過させることが出来ます。
もしも認証に失敗する場合はこの401番を返すのでエラーと判断されます。
ipV4 --> http://username:passwd@127.0.0.1:80/admin/index.html
ipV6 --> http://username:passwd@[::0]:80/admin/index.html
上記以外 :
エラーと判断します。
「http://、https://」の部分はあっても無くてもかまいません。
「http://、https://」のようにプロトコルが指定されている場合は、
指定したポート番号よりもこちらを優先します。(80、443)
但しURLの中にポート番号が記載されている場合はそちらが優先されます。
「https://」プロトコルが指定されない場合、SSLの接続は行いません。
但しLocationの転送先が「https://」で始まっていればそのURLに対してのSSLの接続を行います。
[HEAD]を送りますが、[GET]を使いたい場合はURLの代わりにGETを使ってください。
URLは問い合わせ後にステータスを返すまでの時間を計測しています。
この時間は閾値1を一秒と判断し、オーバするとエラーと判断します。
ブラウザーでは普通に見えるのに必ずエラーとなる場合で、エラー情報に
「戻りデータが受け取れない」と返る場合は、監視したいURLのWEBサーバで[HEAD]
メソッドを許可していない可能性がありますので、URLの代わりにこのGETを
試してみてください。
- GET -
基本的にURLと同じ動作をしますが、[HEAD]メソッドの代わりに[GET]を送ります。
またURLの場合はステータスを受け取る時間を監視しますが、GETを指定するとファイル全体を受け取る時間を監視します。
URLを使っていて、ブラウザーでは普通に見えるのに必ずエラーとなる場合で、
エラー情報に「戻りデータが受け取れない」と返る場合は、監視したいURLの
WEBサーバで[HEAD]メソッドを許可していない可能性がありますので、URLの
代わりにこのGETを試してみてください。
- OPT -
URLと同じ動きをしますが、[OPTION *]を送信します。
- DEF -
GETと同じ動きをしますが、ファイルを読み込みながらSHA1のハッシュ値を計算し記憶します。
次回この記憶したハッシュ値との違いがある場合は、ファイルの書き換えの可能性があると判断してメールを送ります。
注意点として毎回ハッシュを記憶しますので、書き換えの検知は一回しか行えません。
(2011年8月22日現在、SSL接続を行った場合では未対応です)
- URL6,GET6,OPT6,DEF6 -
URL,GET,OPTのIPV6対応版です。
使い方は同じですが、同じURLでこちらを選択するとIPV6の名前解決を試みます。
- SSL -
「URL」監視にて「https://」を指定した場合と同じですが、こちらはLocationヘッダーを追いません。
「https://」などのプロトコルを指定しない場合でもSSLでの接続を行います。
この監視はCERT証明書の期限や整合性の確認も行います。期限は設定の無
い場合は通常12日前にエラーを通知します。閾値は編集画面で可能ですが
、短くした場合でも3日前に再度エラーとなります。必要が無い場合は0に
設定してください。
2010年5月26日現在、BASIC認証には未対応です。
- SMTP -
helo コマンドに対して返すステータスコードが200番台であるかを判断し
ます。200番台以外はすべてエラーと判断します。
- SMTP6 -
SMTPのIPV6対応版です。
使い方は同じですが、同じURLでこちらを選択するとIPV6の名前解決を試みます。
- SNTP -
監視のサーバ内部のNTP時間と、監視対象のntpdの時間を比較し、閾値を
越えた場合にエラーになります。
監視する対象が監視用サーバに対してUDP123番ポートのLISTENを許可する
必要があります。
- HOST -
ホスト名を監視サーバ内で名前解決したIPアドレスと、指定したIPアドレ
スを比較します。
違いがあるか、名前解決が出来ない場合にエラーとなります。
TCPやUDPなどでIPアドレスではなくホスト名を指定した場合も、内部で同
様の確認を行っています。この監視はホスト名に対応するIPアドレスの後
ろに、実際に名前解決を行いたいDNSサーバのIPアドレスを指定出来ます。
その場合はIPとDNSのIPの間を’D'で区切ってください。また複数のIPアド
レスを返す場合、それらのIPを列記出来ます。その場合は各IPアドレスを
’P'で区切ってください。この監視は指定したIPアドレスの動作も監視し、
問題があればエラーの内容を返しますので、特定のDNSサーバの動作監視も
兼ねることが出来ます。
具体的には複数のIPアドレスをDNSが返す場合、「監視するAレコードに対
応するIPアドレス」の項目には以下のように記載出来ます。
(round robin ip1)P(round robin ip2)P(round robin ip3)D(DNS IP)
- MYSQL(処事情ありまして現在御利用になれません)-
MYSQL監視は実際に指定されたホストのMYSQLに指定した問い合わせを行い、
問に対しての答えは一つ以下の場合はエラーと判断します。
特に細かい指定を行わない場合は対象ホストにrootユーザーで接続し、
「SHOW DATABASES;」を問い合わせます。細かい設定を行う場合は、クエリ
ーはクエリーの項目に記載し、その他は「監視先」の項目に対して以下の
ような記載を行うことで調整が可能です。
server=127.0.0.1 username=taro passwd=hoge database=mysql
区切りはスペースになります。
また対象のMYSQLは他の監視同様に監視サーバからの接続の許可を与える
必要があります。
- PGSQL(処事情ありまして現在御利用になれません)-
PGSQL監視は実際に指定されたホストのPGSQLに指定した問い合わせを行い、
問に対しての答えは一つ以下の場合はエラーと判断します。
特に細かい指定を行わない場合は対象ホストにrootユーザーで接続し、
「SHOW DATA_DIRECTRY;」を問い合わせます。細かい設定を行う場合は、クエリ
ーはクエリーの項目に記載し、その他は「監視先」の項目に対して以下の
ような記載を行うことで調整が可能です。(mysqlと同じです)
server=127.0.0.1 username=taro passwd=hoge database=taro
区切りはスペースになります。
また対象のpostgresは他の監視同様に監視サーバからの接続の許可を与える
必要があります。
- SSH -
SSHDに接続すると、まず最初に平文でSSHDのバージョン情報を返しますが、これ
が正常に返されるかを確認します。
SSH自体での接続の確認までは行っていません。
暗号化の確認も行っておりません。
- POP -
POPに接続すると、まず最初に'+OK'を返してきますが、これが正常に返さ
れるかを確認しています。
- FTP -
FTPに接続すると、まず最初にステータス番号を返してきます。これが200
番台であることを確認しています。
- SSH6,POP6,FTP6 -
SSH,POP,FTPのIPV6対応版です。
使い方は同じですが、同じURLでこちらを選択するとIPV6の名前解決を試みます。
▽ 監視先
監視を行いたいサーバまたはネットワーク機器のIPアドレスまたはドメイン
名を指定します。
▽ 監視先ポート
監視先のポート番号を指定します。
▽ 監視のタイムアウト(秒)
この監視が素直に終了しない場合に、タイムアウトする時間を指定します。
現状で30秒もの長い設定時間が可能です。
しかし監視のインターバルが最短で60秒ですので、トータルの終了時間が
インターバルを越えた場合、監視が重複しないように次回まで実行を待ちます。
この場合は飛び飛びに実行されます。
またプログラム開始時間からのインターバルであり、10分おきの設定の場合、
正確に※時10分、20分と動作するわけではありません。
またシステムの負荷の具合や、プログラムの再起動などにより、時間が伸びる
場合があります。
▽ 監視優先度
4段階の設定が行えます。レベル2より上でアラートメールの送信が行われま
すが、メールのヘッダーに追加されるプライオリティーとは別のもので、そ
れ以外はWEBインターフェース上での色分けの設定となります。
1: 高(赤)
アラートメールが送信されます。
2: 中(マゼンダ)
アラートメールが送信されます。
3: 低(オレンジ)
アラートメールは送信されません。
4: Test(グリーン)
アラートメールは送信されません。テストモードなのでエラーで無い場合
でもエラーとして何らかの戻り値を管理画面上で表示します。
新規に監視を追加したり編集をした場合は、一旦このTESTステータスで結
果を見ましょう。
▽ 監視先サーバ説明
エラーの通知メールの「監視先の情報」の覧に記載されます。
▽ 監視内容説明
アラートメールの「監視の情報」に記載されます。
メール受信時の対応方法等を記載しておくと便利です。
4. 監視項目の編集及び複製の作成
「監視設定」のタブをクリックすると、既に登録している監視項目のリストが出
ます。
▽ 編集
「編集」をクリックすることで対象の監視項目を編集出来るエディターが開き
ます。 また、「編集」画面では監視項目の削除を行うこともできます。
▽ 複製
「複製」をクリックすると対象をコピーとした監視項目を編集して、追加の監
視項目を作成することができます。
▽ テスト
「テスト」を押すことで、対象の監視の動作をその場でテスト出来ます。
5. 監視結果の表示
監視のエラーはアラートメールとして通知されますが、「監視結果」の画面から
も確認可能です。
新しく検知したエラーは上から順に表示されます。
▽ 監視設定変更
一番左の「監視設定変更」をクリックすることで、そのエラーの元となってい
る監視項目を編集することがます。
▽ 詳細表示
より詳細なエラーの内容は「詳細表示」をクリックしてください。
▽ 監視テスト
「監視テスト」を押すことで、対象の監視の動作をその場でテスト出来ます。但
しこのテストは実際に監視が行われるIPアドレスからのチェックとは限りません。
また監視結果の保存期間は12日、監視テスト結果の保存期間は最大で1日となっ
ています。
6. エラーメールの内容
送信されるアラートメールの内容には以下の情報が含まれています。
監視によるエラーはメールに記載されて、登録時に入力したメールアドレスに送信
されます。
/* ----
Subject: ZITHER Watchdog <登録したID> 監視先でエラーを観測しました
From: report@patrol.datahotel.ne.jp
To: [登録メールアドレス]
X-Mailer: zither-[バージョン番号]
エラーを観測しましたので、以下の監視内容を確認してください
監視項目の編集は以下のURLから行うことができます。
https://patrol.datahotel.ne.jp/customer/
-- 以下のポートが閉じています --
重要度 :
プロトコル :
ホスト名 :
監視ポート :
待ち時間 :
監視情報 :
監視先情報 :
Error 情報 :
-- */
7. 監視設定のコツ
監視はデータホテルの管理する何台かのサーバから行われます。
ファイアウォールやウェブサーバの設定などでフィルタリングされている場合、監
視が行えません。そのため、監視される対象はこれらのサーバからの接続を許可す
る必要があります。以下のネットワークからの接続を許可してください。この範囲
内でのIPアドレスの変更は頻繁に行われます。
203.104.110.0/26
もしもUDP監視を行う場合、ICMPへのフィルタリングを解除してください。UDP監視
ではICMPの機能を利用しています。
上記ネットワークは弊社都合で変更する場合がありますが、変更する際にはウェブ
ページかメールあるいはその両方で事前に告知を行います。
また、エラーを検知した際のアラートメールは、以下のメールアドレスから送信さ
れます。
受け取れない場合は、メーラでのフィルターや振分け設定や携帯電話であればドメ
イン指定受信の設定を確認して下さい
report@patrol.datahotel.ne.jp
新規に監視設定を行った場合や、編集を行った場合は監視のプライオリティーをTE
STモードにて一旦状況を確認しましょう。
TESTモードはその監視が正常でも異常でも何らかの答えを返します。(メールは送
信されません)。また編集画面や監視結果の画面にある「監視テスト」のボタンを
押すことで、その監視項目を即座に確認することが出来ます。
送信メールや監視の基本設定をを監視のカテゴリーごとにわけたい場合は複数のア
カウントを取って頂くことで可能です。一つのアカウントで登録出来る監視数は最
大30件に設定されています。
8. 利用規約
以下のURLをご確認ください。
https://patrol.datahotel.ne.jp/tmpcheck.php
|
|