NASのHDDがSMARTエラーを吐いていたので、換装再構築してみた(QNAP HS-210 WD RED)

PC

昨年(2019年)ですが、QNAP HS-210に使用しているHDDからSMARTエラーが検出されました。
使用していたのは、ウエスタン・デジタルのNAS専用高耐久のHDDで知られるWD REDシリーズ。

おとなしく故障HDDの交換、RAIDの再構築を行うことで無事に復旧しました。
この記事では私が行った手順を紹介したいと思います。
QNAP NASのHDD換装時に参考にしていただければ幸いです。

NAS運用開始5年、ついにエラーを吐き始めた

自宅新築と同時にQNAP HS-210 による NAS環境を構築して早4年半。
NASを普通に使う分には何の問題なく、平和な日々が過ぎていきました。

「久しぶり管理画面見てみるか、使用容量も気になるし。」と
NASの管理画面を見たら、何やらHDDでエラーが発生している…だと!

おいおいおいおい!ずっと気がついていなかったよ!
データ消えたら家人からのプレッシャーが洒落になんねーよ!わあああん。
と焦る気持ちを抑えつつ、何の異常なのかもう少し調べることにしました。

S.M.A.R.T.のエラー詳細

HDD障害といえば、そう!SMART情報の確認です。

Self-Monitoring, Analysis and Reporting Technology (セルフモニタリング・アナリシス・アンド・リポーティング・テクノロジー、略称: S.M.A.R.T.; スマート) は、ハードディスクドライブと、ソリッドステートドライブの障害の早期発見・故障の予測を目的としてディスクドライブに搭載されている機能である。

この機能は、各種の検査項目をリアルタイムに自己診断し、その状態を数値化する。ユーザーはその数値を各種のツール(後述)を用いることで知ることが出来る。全ての故障を予期することは出来ないが、安定した利用環境における経年劣化による故障を知るには非常に有効である。

https://ja.wikipedia.org/wiki/Self-Monitoring,_Analysis_and_Reporting_Technology

当然、QNAPのHS-210に搭載されているTurboNASでもSMART情報は参照できるようになっています。
障害発生時のSMARTの状況は以下のようなものでした。

ID:197 Current Pending Sector で大幅に閾値を超えてしまっているようでした。

この ID:197 Current Pending Sector が何かというと…

C5(197) – 代替処理保留中のセクタ数

ハードディスクのファームウェアによって、代替処理すべきと判定されているセクタの数。セクタ読み出しエラーが発生した場合に、代替処理保留セクタとして登録されます。通称、ペンディングセクタ

セクタ代替処理は、次のアクセスがあるまで一旦保留(ペンディング)されています。当該セクタの読み出しに成功すれば、代替領域へデータをコピーします。読み出しに失敗した場合は、次回このセクタへの書き込み時に代替処理されます。

https://pctrouble.net/storage/smart_badsector.html

一部のセクタが読み込めない状態のようです。
この値がじわじわと増えるようであれば、「HDDの寿命」と言うべきものです。
NASの閾値は 0 のようなので 125 という値はやばいですね。
「もういい加減早く交換しろやゴルァ」
という状況で差し支えないかと思います。

代替のNAS用HDDの購入

やばい状況を確認したところで、早速代替のHDDを注文することに。
今回も当然ウエスタン・デジタルの WD REDです。
QNAP の HS-210 は完全ファンレス構造になっているのもあって、NAS専用のHDDである WD REDを使用することが必須だと思っています。(メーカーも当然推奨)

故障したHDDと微妙にパッケージは異なりますが、故障したHDDと同じ4TBのモデル(WD40EFRX)です。
NAS構築時よりは安くなりましたが、それでも普通のHDDに比べれば随分高い…。

再構築

QNAP の HS-210 はホットスワップに対応しているため、通電状態でディスク交換が可能なモデルです。
ついに、その機能を使う時がきた!とドライブのメニューを探しましたが、なぜか交換できる箇所は無し…。
どうやら、障害発生時はホットスワップ機能が使えないとのこと。同様の事例が紹介されていました。

QNAP製のNAS TS-231+でRAID1を構成しているHDDにエラーが発生したので交換してみる
 初めてのNASとしてQNAP製のTS-231+を導入したのは今から約2年前の2016年秋のことでした。TS-231+は家庭向けの2ベイNASボックスで、これにWestern Digital REDシ

ここは大人しく、素直にシャットダウン。電源を落とした状態で交換することとします。

HDD交換作業を行い、再びNASの電源を投入。
TurboNASのダッシュボードを確認すると…

無事にRAID再構築処理が開始されました!
この後、再構築完了まで1日程度かかったのですが、通常運用には何の問題もなく使用できています。

まとめ

QNAP の HSシリーズは完全ファンレス構造ということもあって、24時間運用のNASとしてはかなり過酷な環境に分類されると思います。
当然ながらメーカー推奨のHDDもWD REDシリーズとなっています。

我が家の場合、4年半で異常(障害)となったわけですが、24時間通電運用を考えた場合、十分持ってくれたというのが印象です。メーカー保証も3年間ですし。当初購入のもう1台はまだ壊れてないし!

気をつけてなければならないのは、1点だけ。
QNAP HS-210 は障害HDDのホットスワップに対応していない
ということだけです。
この点で無駄に調査時間がかかってしまいましたが、おとなしくシャットダウンして交換、電源再投入すれば自動的に再構築されるため、そこまで複雑な手順は必要ありません。

QNAP NAS のHDD障害時の参考になれば幸いです。

コメント