デーモン監視

ゾンビになっててもわかるように…ってことは、稼働するプロセスに対して何らかのメッセージを送って、その戻り値を見ることができればいいのだけど。
DHCPの場合はなかなかそうはいかないのです。
ポート67/6番の単純な応答監視だとホントにDHCPによるIPアドレス払い出しを行っているのか確認できない。
実際にIPアドレスを払い出しているかどうか、その値が正しいものかどうかを確認するには、実機で確認するしかない。
(DNSならテキトーなAレコードをクエリして戻り値を確認すればいいだけの話なんだけど)
ここがね、すごく面倒。
なので、提案。
DHCPはコケるもんだ、という認識を持ちたい。
コケたときに被害を最小限にするには、とか考えるといろいろ方法はあるんだけど(レンジ違いのサーバを用意するとか、オススメしないけどFailoverにするとか、代替サーバを用意しておくとか)、決定的に"ダウンさせない/ダウンを予期する"ことは無理なんじゃねーの?、と。
DHCPサービスに100%常時稼働のSLAは張れないね、っていうのが結論でした。