サーバが重いというのでステータスを確認してみた。
load average: 4140.33, 3163.64, 1793.70
ロードアベレージは一定時間内の CPU の待ちプロセス数の平均値で、uptime というコマンドの出力の場合、左から「過去1分」「過去5分」「過去15分」の値を確認できます。
4000超えは、はじめて見たよ。
銀行のATMに4000人並んでるイメージですな。
※ちなみに社内ツール用のサーバで、サービスに投入してるサーバじゃありません。念のため。
サーバが重いというのでステータスを確認してみた。
load average: 4140.33, 3163.64, 1793.70
ロードアベレージは一定時間内の CPU の待ちプロセス数の平均値で、uptime というコマンドの出力の場合、左から「過去1分」「過去5分」「過去15分」の値を確認できます。
4000超えは、はじめて見たよ。
銀行のATMに4000人並んでるイメージですな。
※ちなみに社内ツール用のサーバで、サービスに投入してるサーバじゃありません。念のため。
3桁までならありますが、4桁はさすがにないですね。
そこまで行くと、uptime のレスポンスが返ってくるのに、どれだけ待たされるのか?という感じがします。
ApacheやDBで LAが一定値を超えたら、サービスをリスタートさせるっていうのをcronに設定していることがあります。そうしないと、LAが高くなる一方で結果ダウンしてしまうので。根本的な解決ではないのですけど。
DMMさん位の規模になると、LA2桁くらいは普通にありそうですね。