サーバ監視は落ちたかよりもロードアベレージで見た方が良いかも

先日、サーバが激重でした。

SSHも重く何とか開けuptimeで確認したら40もありました。
先日鯖缶とか言って監視用ソフトを作りましたが
結局役に立たず、httpdの再起動や停止、起動に
何回か失敗しましたが、そのうち成功し
ロードアベレージも1以下の正常な値に戻っていました。

多分、原因はアパッチWEBサーバでしょう。
ロードアベレージは1コアのCPUの場合1以上あるとプロセスの
実行に待ち時間が発生するので数値が高くなると
重いと言われています。
マルチコアの場合コア数×1の値ですがいろいろ細かい事
があるので目安とすれば良いでしょう。

やはり、サーバが重い状態では監視ソフトを使っても
一応接続はできるのでエラーにはならず意味がないので
ロードアベレージが急激に上がったら
メールで送信する様なスクリプトをCRONに仕込んでみようと思います。

重いうちならhttpdの再起動だけで済むかもしれませんし
サーバも早期発見して処置すればサーバ自体の再起動を
しなくて済むかもしれません。

本当はhttpdの重くなる原因を突き止めなければなりませんが
あまりにサーバが重いと何も出来ません。

スポンサーリンク