プロセス数を監視して、多くなったらログへ

ブログ | 2011/5/2 23:45
最近、1週間毎くらいに落ちるので、ちゃんと調べる。
いつもは、ほぼフリーズ状態になっていて、何もできないのだけれど、たまたまコンソールが立ち上がっていて、少し情報が見えた。プロセス数が320とかになっていて、ほぼ固まっているような感じということは分かった。shが溜っていたから、バッチ処理のどこかで躓いて、ずんずん溜っていくということなのだろう、きっと。

で、プロセス数が200以上になると、ログにps auxを出力するshを書いて、毎分のcronに仕掛けておいてみる。

#!/bin/sh

isAlive=`ps -ef | wc -l`
if [ $isAlive -gt 200 ]; then
 echo === ps aux [$isAlive] ================================ `date "+%Y/%m/%d-%H:%M:%S"`
 ps aux
 echo === ps aux finish ================================
fi
▼追記 2011/5/11 15:20
2週連続、月曜の早朝に落ちて、今週は火曜日早朝にも落ちたので、本気で取り組んだのだけれど、結論からすると、mysqlのバックアップ時にプロセスが溜って、ウーウー状態になっていたということのようだ。
バックアップも含めて、一台での運用に無理があったということで、ちゃんとレプリケーションして、そっちでmysqldumpすることにした。
で、レプリケーションするマシンがないなと考えていたところ、VMwareFusion3にfreeBSDがインストールできることが分かったので、あれやこれやで、1台のmacminiに2系統のレプリケーションが完成。

これで落ちない筈。
縮小 拡大

ログインしておくと、後で編集が可能です。

Rottel内コンテンツ

ユーザー一覧

Rottelとは?
利用規約
開発飲料
利用者の声
ヘルプ
close