障害呼び出し

昼前にNさんから電話あり。
休み前にお願いしていたサーバのネットワーク不具合について
別件で作業に来たOさんに確認してくれるとのことだった。
管理者用のIDとパスワードを教えて、再度お願い。


昼前に地震があった。大きい地震で揺れている時間が長かった。
宮城県震源で、このあたりでも震度4とのことだった。
その直後、再度電話ある。
サーバのボリュームが外れてしまい、見えなくなったとのこと。
現場にあるサーバなので恐縮だが実機を確認してもらう。
地震のニュース速報を見ると、大きい地震であり、そのことも伝えようと
折り返し電話すると、興奮した声でサーバのDISKがすべてFAILEしていると言う。
返答に困った。最悪の自体という奴だ。


しょうがなく再度会社に行き、実機を確認するとやはり全てのDISKが死んでいる。
やっちまたなあと、あきらめながらリブートするも状況変わらず。
Logical Drive Not Foundなどど出やがる。
RAIDのコントローラかなあと諦め、今度はコールドブートへ。
RAIDのファームウエアのユーティリティは起動する。そこでDISKの構成情報を見てみると
今度は全てのDISKがONLINEに戻っている。
そのまま構成情報をSAVEすると障害アラームが止まった。
もしかして、もしかして〜と祈りながらリブートすると、通常に立ち上がった。
よかった〜。でもこんなこと初めて。


ネットワークに接続できない不具合もDirectry Serviceの再構築コマンドで
復旧したようだ。合わせてよかった〜。


昨日に続き、障害続きだなあ。
この休みは都合で4回、出社したことになる。