2015年2月28日土曜日

HP Microserverで遭遇したトラブル

現在、我が家にはデータの保存用として2012年に購入したHewlettPackardのMicroserver(N40L)を運用しています。
当初は4台程度ハードディスクを搭載できる、NAS機能付きケースを購入しようとしたのですが、ほぼ同程度の価格で、5台のハードディスクを搭載できるサーバーPCが購入できたので、こちらにした次第です。
OSには、やはり格安で入手できたWindows HomeServer 2011を使用しています。


3TBのハードディスク4台を、2台ずつRAID 1(Mirror)にして冗長化を図っていましたが、このたび5TBのハードディスクを2台入手したので、2組のRAID 1構成のうち1組を5TBのRAID 1構成へと変更する事にしました。(写真は既に1組のRAID 1構成からデータを退避させた状態)


単純にAMDのRAID管理ツールであるRAIDXpertを使用し、現在の3TBのRAID 1構成(2台のハードディスク)を外し、5TBのRAID 1構成を組んで、外した3TBにあったデータを5TB側にコピーし終わったところまでは順調でしたが、ここでトラブルが発生です。


再起動したところ、5TBでRAID 1を組んでいたはずのハードディスクが個々(2台)に認識されRAID 1構成が崩壊してしまいました。
ハードディスクにアクセスしたところ、フォーマットを促され、コピーしたデータも消失してしまいました。

消失したデータ自体はまだオリジナルのデータが残っているため、損失はありませんが、コピーに要した時間(6時間程度)が無駄になりました。


仕方ないので、もう一度、RAIDXpertを使用し、同じ作業を繰り返し(再度、7時間)、いざ再起動させるとまたRAID 1構成の崩壊。

RAIDXpertの使用を止め、BIOSのPOST画面後のRAIDユーティリティー(Ctrl + F)にてRAID 1構成を作製し、再度、データのコピー(またまた7時間…)を行ってみても、再起動後にはやはりRAID 1構成の崩壊…。

マザーボードのRAID機能をやめ、OS(Windows HomeServer 2011)の機能によるミラーリング(ダイナミックディスク)でRAID 1構成を行い、そこにデータをコピー(またまたまた7時間)して再起動させたところ、問題は無かったので、ハードディスクのトラブルは考えられませんでした。

ハードディスクのトラブルは考えられないので、RAIDのドライバーを更新してみることにしました。
最新のドライバーはHewlettPackardのホームページ(HPのHP…ややこしい)には掲載されていなかったので、AMDのサイトより入手しました。


ところが、最新のRAIDのドライバーをインストール(3.2.1540.75 → 3.3.1540.33)して、再起動すると、今度は、今回、手を加えていないもう1組の3TBのRAID 1構成も崩壊し、状況はさらに悪化しました。(しかも4台ではなく、何故かE:、F:、G:の3台)


幸い、RAIDのドライバーを元に戻し(3.3.1540.33 → 3.2.1540.75)たら3TBのRAID 1構成にはアクセスできるようになったので、ドライバー次第でRAIDボリュームの見え方が変わる事がわかり、ここは何としても最新のドライバー(3.3.1540.33)を試してみたくなりました。



ここで、これまでの経緯をおさらいします。
  • 3TBのRAID 1構成、2組のうち、1組を5TBのRAID 1構成へと変更。
  • 再起動後、5TBのRAID 1構成が崩壊。
  • 確認の為、もう一度同じ作業をしても、やはり5TBのRAID 1構成が再起動後崩壊。
  • RAIDXpertではなく、POST時のRAIDユーティリティーでRAID 1構成を作製しても状況は変わらず。
  • OSの機能によるRAID 1構成は再起動後も問題なし。(ハードディスクは異常なし)
  • RAIDのドライバーを更新したところ、もう1組の3TBのRAID 1構成も崩壊
  • ドライバーを戻したところ、3TBのRAID 1構成は復活。(ドライバー次第で挙動の変化を確認)←いまここ 
ということで、最新のドライバー(3.3.1540.33)にすると崩壊してしまう、もう1組の3TBのデータを別のハードディスクに一度退避させ(こちらは5時間程度)た後、最新のドライバーに再度更新をして、新規に3TBのRAID 1構成と、5TBのRAID 1構成を作製しました。
そして新たに作成した3TBと5TBに、必要なデータをコピーしました。(両者で10時間以上)


結果的には、ビンゴで、再起動後も5TB側のRAID 1構成も崩壊することなく、無事に認識されました。

原因としては、従来使用していたドライバーのリリース時に4TBを超えるハードディスクが存在していなかったため、今回の5TBのハードディスクでの挙動が怪しかったものと推測されます。

タチの悪いことに、古いドライバー環境だと、データを何もコピーしていない時には、何度再起動してもRAID 1構成は崩壊する事もなく、2TB程度のデータをコピーしたところで、再起動後にRAID 1構成が崩壊するという挙動を示し、検証に時間ばかりが無駄にかかりました。

また、RAIDのドライバーを更新すると、それまでのRAID構成が崩壊するという信じがたい状況に対する判断の遅れも、対応の遅れに繋がっています。(常識?)

大容量ハードディスクを使用する際は、やはりそれなりに注意が必要ですね。

0 件のコメント:

コメントを投稿