パフォーマンスモニタの監視項目 [Windows]
システム監視は、監視目的(ボトルネック、エラーや使用状況の検出)を明確にしておくことです。しかし、幾つかの項目の閾値は一般的な数値として定義できますが、多くの項目はシステム運用中にデータを取得しシステムに適合できる閾値を見極めることが大事だと思います。
扱う項目や依頼数の変化と監視項目の変化のデータを取り将来起こりうるボトルネックや障害を予想する為にもデータは日々取得し日次、週次、月次、半期及び年次などで分析を行う必要があります。
監視する項目
・CPUのボトルネックと使用状況
・メモリのボトルネックと使用状況
・ディスクのボトルネックと使用状況
・ネットワークのボトルネックと使用状況
スループット
スループットは単位時間(秒)当たりにシステムが実行できる処理数
ボトルネック
ボトルネックは、システムが処理を行っている時にリクエストからレスポンスを返す過程で滞留を起こしスループットの低下の原因になっているもの
Windows系の監視を行う場合は、パフォーマンスモニタにより監視を行うのが視覚的にも分かりやすくお手軽に使えると思います。
定期的にデータが欲しい場合も、ログファイルやDBに記録ができ定期的に情報を得ることも可能でです。また、リモートホストへのアクセスも権限があれば取得可能です。
*定期的にログを取得する場合は、シャットダウンのタイミングでログが収集されなくなるので”サービス”の”Performance Logs and Alerts”を”手動”から”自動”に切り替えてください。
パフォーマンスモニタでリモートサーバのデータを取得する場合は、下記の手順で取得します。
・[管理ツール]→[パフォーマンス] で[パフォーマンス]画面を開きます。
・[パフォーマンス ログと警告] を選択して、[新しいログの設定]で[オブジェクトの追加]画面を開きます。
・[オブジェクトの追加]画面で[次のコンピュータからカウンタオブジェクトを選ぶ]を選びコンピュータ名を追加します
LogicalDiskのパフォーマンスデータを取得すためにはdiskperfコマンドで監視を有効にしてください。
diskperfコマンド
引数:
-yv LogicalDiskを有効にする
-yd PhisicalDiskを有効にする
-y PhisicalDiskとLogicalDiskの両方を有効にする
-nv LogicalDiskを無効にする
-nd PhisicalDiskを無効にする
-n PhisicalDiskとLogicalDiskの両方を無効にする
* dsikprefコマンドの結果はシステムの再起動後になります。
パフォーマンスモニタ監視オブジェクト一覧
Memory
カウンタ | 監視目的 | 説明/判定 |
Available Bytes | 使用状況 | プロセスの実行に使用できるバイト数 常に5MBより大 小さい値 → RAM不足 また、値が減少していく場合はメモリリークの可能性あり。 |
Pages/sec | ボトルネック | RAM,ディスク間読み書き込みページ数 20以下(理想は4,5) 大きい値 → ページングファイル使用 PAGEFILE.SYSのディスクのLogical Disk\Avg. Disk sec/Transferが共に10より大きな値の場合はメモリ増設の必要があり |
Commit Limit | ボトルネック | 物理/仮想メモリを合わせた利用可能メモリ最大容量 ページ ファイルが最大ページファイルサイズに達している場合は、イベントビューアに"2001"、"2016"、"2019"または"2020"のエラーが表示されます。 "2001"、"2016"、"2020"の場合は、メモリーリークの恐れがありますので、プロセスのPage File Bytes または Working Set を監視してください。 "2019"の場合は、アプリケーションのシステムコールが、割り当てられた非ページプールを統べて使い果たしたために発生します。システムのMemory Pool Non Paged Bytes を確認してください。 "2019"と共に"利用可能な記憶領域が不足しているので、このコマンドを処理できません。"が表示された場合は、アプリケーションのシステムコールが正しくない可能性があるので、各プロセスの非ページプール割り当てを確認してください。 |
Commited Bytes | ボトルネック | メモリ使用量 物理メモリより大きい値 → ページングが頻繁に発生、メモリの増設が必要 |
カウンタ | 監視目的 | 説明/判定 |
Page Faults/sec | ボトルネック | メモリ上の指定されたワーキングセット内でのページフォルト 大きい値(20以上) → ページングが過度 |
Working Set | ボトルネック | アプリケーションが使用するメモリ使用量 |
%Processor Time | 使用状況 | サービスごとのCPU使用率 80%以上→高速なプロセッサにアップグレードするか、マルチプロセッサ化する。 |
% Privileged Time(_Total) | 使用状況及びボトルネック | 特権モードで費やされるCPU時間 User Time の 15% 未満 高い場合、障害をともなう機器によって発生した多数の割り込みが原因である可能性があります 25%を超える場合は、ディスクに問題がある場合が多いので高速なディスクに交換する必要があります |
% User Time(_Total) | 使用状況 | ユーザー モードで費やされるCPU時間 |
Pool Nonpage Byte | 使用状況 | カーネルモードプログラムのスワップアウト不可のメモリ容量を表示 Pool Paged Byte と共に監視しどちらかの値だけが増加していく場合はメモリリークの可能性あり。 |
カウンタ | 監視目的 | 説明/判定 |
% Usage | ボトルネック | 使用中のページファイルインスタンスの合計をパーセントで表示 70%以上の場合は、メモリー使用量を調査し、必要に応じてRAMを増設する |
カウンタ | 監視目的 | 説明/判定 |
%Processor Time | ボトルネック | CPU使用率 継続して90%以上 → CPUのアップグレード/追加が必要 |
%Privileged Time | ボトルネック | カーネルコマンド実行のための特権時間に費やす時間の割合 できるだけ小さい値 大きい値 → ディスクI/Oサブシステムのパフォーマンスを上げる必要 |
Interrupts/sec | ボトルネック | 秒ごとにプロセッサが受け取って処理するハードウエア割り込みの平均値 1,000未満 4以上→CPUがボトルネックになっている システムの変更が無いのに急激に値が増えた場合は、ハードウェア障害の恐れあり |
Processor Queue Length | ボトルネック | CPUで命令が処理できなくて、待ちに入っている数。 2未満 2以上→CPUがボトルネックになっている。 間隔を置いて数回取得する必要があり |
%User Time | ボトルネック | プロセッサがユーザープロセス実行に費やす時間の割合 他プロセス/アプリケーションが動作を妨げている可能性 |
カウンタ | 監視目的 | 説明/判定 |
Queue Length | ボトルネック | CPU のサーバー作業キューの現在の長さです。 4を超える状態が続く場合は、プロセッサに負荷がかっています。 |
カウンタ | 監視目的 | 説明/判定 |
%Total Processor Time | ボトルネック | 全プロセッサの平均 |
Processor Queue Length | ボトルネック | プロセッサキューにあるスレッド数 2以下 2より大きい値 → CPUのアップ グレード/追加が必要 |
Context Switches/sec | ボトルネック | プロセッサがスレッドを切り替える1秒あたりの回数 8000に達している → CPUのアップグレード/追加が必要 |
カウンタ | 監視目的 | 説明/判定 |
% Free Space | 使用状況 | 論理ディスク ドライブ上で使用可能な領域全体に対する空き領域の割合 |
カウンタ | 監視目的 | 説明/判定 |
%Disk Time | ボトルネック | ディスクI/O処理時間の割合 65%より小 |
Avg. Disk Bytes/Transfer | ボトルネック | 書き込みまたは読み取り操作中にディスク間で転送されたバイト数の平均値です 20KByte以下の場合は、ディスクI/Oがボトルネックになっています。 |
Avg. Disk sec/Transfer | ボトルネック | ディスク転送時間の平均秒数です 0.3 秒より大きい値は、エラーのためにディスク コントローラがディスクを再試行している場合があります。 |
Avg. Disk Queue Length | ボトルネック | ディスクI/O待ちキュー長の平均 スピンドル数+2より大きい値 → ディスクI/O処理要求で待ち発生 |
Current Disk Queue Length | ボトルネック | ディスクI/O待ちキュー長の平均 >2より大きい値 → ディスクI/O処理要求で待ち発生 |
Disk Reads/sec | ボトルネック | 読み取り操作比率 一般にUltra Wide SCSIディスクは1秒当たり、50~70のI/O処理が可能 |
Disk Write/sec | ボトルネック | 書込み操作比率 |
カウンタ | 監視目的 | 説明/判定 |
Current commands | ボトルネック | キューないのリダイレクタへの要求の数 ネットワークアダプタの数を超えている場合は、 ・通信相手がサーバーのリダイレクタより遅い。 ・ネットワークで容量の問題が発生している可能性がある。 ・リダイレクタがビジーで、アダプタが追従できない。 の要因の可能性があります。ネットワークのセグメント化などの対応が必要 |
Network Errors/sec | エラー状況 | エラーの数 イベント ログをチェック |
Reads Denieds/sec |
エラー状況 | ビジー状態で要求を拒否した数 カウントされている場合はメモリ割り当ての問題がある可能性あり |
カウンタ | 監視目的 | 説明/判定 |
%Net Utilization | スループット | ネットワーク・セグメントの利用率 Ethernetネットワークでは40%~60%を超えない |
カウンタ | 監視目的 | 説明/判定 |
Bytes Total/sec | スループット | 1秒あたりのNIC上で送受信されるバイト数 |
Packets Outbound Errors | スループット | エラーが原因で伝送されなかった発信パケットの数 |
Packets/sec | スループット | 1秒あたりのNIC上で送受信されるパケット数 |
カウンタ | 監視目的 | 説明/判定 |
Bytes Total/sec | スループット | 1秒あたりのサーバーがネットワーク間で送受信したバイト数 Bytes Total/secの合計がネットワークの最大転送速度とほぼ等しい場合、ネットワークをセグメントに分割する必要 |
Raw Reads Rejected/sec Raw Writes Rejected/sec |
ボトルネック | ファイル転送のビジー ファイル転送でビジーのときに使用されるRAW作業項目が使い切った時カウントされます。発生時にはレジストリ値のRawWorkItemsを増やす必要があります |
Error System | エラー状況 | 内部サーバー エラーが検出された回数 サーバに問題がる場合はほとんどなので調査が必要 |
Errors Access Permissions | エラー状況 | クライアントとしてのファイルのオープンが失敗し、STATUS_ACCESS_DENIED が出された回数数 ファイルへのアクセスをランダムに試みていることがわかります。急激に増えている場合は、Dos攻撃の可能性があります。 |
Errors Logon | エラー状況 | サーバーへのログオンに失敗した回数 急激に増えている場合は、サーバーのセキュリティを破ることを目的とするパスワード推測プログラムなどが使用されている可能性があります。 |
Error Granted Access | エラー状況 | ファイルへのアクセスが拒否された回数 アクセス権限を持たないユーザーがファイルにアクセス。急激に増えている場合は、Dos攻撃の可能性があります。 |
File Open | 使用状況 | サーバー上で現在開かれているファイルの数 現在のサーバーの処理状況を判定 |
Work Item Shortages | ボトルネック | 起動時にプロセッサに割り当てられる作業項目の数 3以上の場合は、InitWorkItems または MaxWorkItemsをレジストリ[HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\LanmanServer\Parameters]の下に追加し、InitWorkItemsには任意の値(1~512)、MaxWorkItems(1~65,535)に4,096の倍数を指定し、閾値値が3未満なるように調整 |
Pool Nonpaged Failures | ボトルネック | 非ページ プールからの割り当てが失敗した回数 発生した場合は、コンピュータの物理メモリが少なすぎることを示します |
Pool Paged Peak | ボトルネック | 最大ページング ファイル サイズと物理メモリ容量 |
カウンタ | 監視目的 | 説明/判定 |
Datagrams Received Header Errors | 監視 | 不正なIPヘッダエラー(正しくないチェックサム、バージョン番号の不一致、そのほかのフォーマット エラー、タイムアウト、期限切れ TTL、IP オプション処理時に検出されたエラーなど) が原因で破棄されたデータグラムのカウンタ。 ルータなどのネットワーク機器エラー及びサービス拒否攻撃(DoS攻撃)などで発生する可能性がある。 |
Datagrams Received Unknown Protocol | 監視 | 正常に受信されたが、不明またはサポートされていないプロトコルが原因で廃棄されたローカル アドレス指定のデータグラムの数 |
Windows2003やWindowsXpではlogmanというコマンドがあるので、これを使用してデータを収集すると便利です。
logmanは、リモート コンピュータのログファイル データの収集を開始、停止、実行中のログおよびトレースを照会することが出来ます。
トラックバック 2
AIXのnmonみたいなのがあるわけで、 コントロールパネル-管理ツール-パフォーマンスで。 それぞれの測定値に関しては この本を見て頂くか、 以下のサイトなどを参考にされるとよいでしょう。 メモリ使用量の調査。用語メモ書き… http://jehupc.exbl…[続く]
現在開発中のアプリをパフォーマンスをチェックするため、Windows付属のパフォーマンスログを使いチェックしてみました。 瞬間的なメモリ使用量はタスクマネージャでもみれます。 特にWindowsXPのタスクマネージャは表記がかなり不親切です。 まずデフォルトで出てくる「…[続く]
コメント 0