どうもこんばんは。

ずっとTwitterでしか進捗更新をしていませんでしたが、公式にも報告をしておきます。

今回の障害は、2011/11/23 17:40頃に外部サーバからの監視アラートが携帯に届き、障害を知る。

たまたま家にいたので調査の結果NICがリンクダウンしていたため、更に調査。

NICがどうやっても復旧せず、サーバ再起動を試すもシャットダウン後に電源が入らなくなり、どうにか起動するもBIOS画面がぐちゃぐちゃに。。

これらの現象からマザーボードの故障と判断し、部品の手配を始めましたがこのHP製のサーバ ML115 G5は結構前のモデルで流通量はかなり多かったはずなのに、中古でもあまり出回ってない事を知る。

部品の手配を諦め、サーバ本体を探し始め新潟のドスパラで中古を発見し、早速注文。

翌日の2011/11/26に届き、HDDを新サーバに引っ越し、無事復旧が完了。

 

停止時間としては2011/11/23 17:40~2011/11/26 16:40となっており、ユーザの皆さんには大変ご迷惑とご心配をおかけしました事をお詫びいたします。

現在は全てのサービスが復旧し正常に稼働しております。

おまけとして、余っていたメモリを追加し合計6GBでの運用となります。(4GB→6GB)

3年間以上ほぼ通電しっぱなしで運用してきたのでサーバも疲れがきたか。。

 

この教訓を活かし、早めに新しいシステムへの移行も考慮したいと思っています。

次回のシステムは現在のサーバをP2Vで仮想化しVMWareで管理していこうと考えていますが、いかんせん先立つものがないのですぐには実施できません。

またその時はこちらで報告します。

 

以上です。