VMwareからLSIのカードのRAIDアレイを管理するTips
とある事情でVMバイザでRAIDを作成する必要があったので作成
とある事情で物理VMサーバ上でRAIDを作成する必要があったので作成
2018/2月 追記:ESXi 6.5ではmegacliは動かないのでstorcliを使ってください
検証環境:
- VMware-VMvisor-Installer-5.5.0.update02-2068190.x86_64
- LSI MegaRAID 8708EM2 (LSI SAS1078チップ使用)
- Fujitsu D2516-D11 (LSI SAS1078チップ使用)
- ESX6系及びMegaRAID 9xxカードは未検証
...
/opt/lsi/MegaCLI # ./MegaCli -AdpGetProp RebuildRate -aALL Adapter 0: Rebuild Rate = 30% Exit Code: 0x00 /opt/lsi/MegaCLI # ./ MegaCli -AdpSetProp RebuildRateAdpSetProp RebuildRate -99 -a0 /opt/lsi/MegaCLI # ./MegaCli -AdpGetProp RebuildRate -aALL Adapter 0: Rebuild Rate = 99% Exit Code: 0x00
...
/opt/lsi/MegaCLI # ./MegaCli -pdlist -a0|grep Firm Firmware state: Online, Spun Up Device Firmware Level: AB0Q Firmware state: Online, Spun Up Device Firmware Level: AB0Q Firmware state: Online, Spun Up Device Firmware Level: AB0Q Firmware state: Online, Spun Up Device Firmware Level: AB0Q Firmware state: Online, Spun Up Device Firmware Level: C7TP Firmware state: Online, Spun Up Device Firmware Level: C7TP
よく分かりませんが。。
以上で、ディスク障害の手順は完了です。
以上で、ディスク障害の対応手順(オレオレ検証)は完了です。
その他
その他のチューニングと言うか諸々について
7日ごとにHDD-LEDが強烈に点滅するのを変えたい
ConsistencyCheck (CC)がデフォルトで168時間毎になっているためです。確認、変更はMegacliからできます。
コード ブロック |
---|
/*** 確認 ***/
~# MegaCli -AdpCcSched -info aall
Adapter #0
Operation Mode: Concurrent
Execution Delay: 168
Next start time: 02/10/2018, 03:00:00
Current State: Active
Number of iterations: 11
Number of VD completed: 0
Excluded VDs : None
Exit Code: 0x00
/*** 変更(例として672時間毎(4週間に一回)) ***/
~# MegaCli -AdpCcSched -SetDelay 672 aall
Adapter 0: Scheduled CC execution delay is set to 672 hours.
Exit Code: 0x00
/*** 次回の実行時間を延期する ***/
/*** 今だとNext start time: 02/10/2018, 03:00:00になっているので2/24に変更する ***/
~# MegaCli -AdpCcSched -SetStartTime 20180224 06 -a0
Adapter 0: Scheduled CC start time is set.
Exit Code: 0x00
/*** 確認 ***/
~# MegaCli -AdpCcSched -info aall
Adapter #0
Operation Mode: Concurrent
Execution Delay: 672
Next start time: 02/24/2018, 06:00:00
Current State: Active
Number of iterations: 11
Number of VD completed: 0
Excluded VDs : None
Exit Code: 0x00
/*** CCのモード変更 ***/
/*** CCをConcurrentモードに指定する(デフォルト) ***/
MegaCli AdpCcSched ModeConc aall
Adapter 0: Scheduled CC mode is set to Concurrent.
Exit Code: 0x00
/*** CCをSequentialモードに指定する ***/
MegaCli AdpCcSched ModeSeq aall
Adapter 0: Scheduled CC mode is set to Sequential.
Exit Code: 0x00
/*** 非推奨 ***/
/*** CCを無効にする***/
MegaCli AdpCcSched Dsbl aall
Adapter 0: Scheduled CC mode is set to Disabled.
|
あまり頻繁にやるのも良くないですが、無効にするのもよくありません。CC中に破損が見つかった場合、実際にブロックが破損していたが、今までアクセスされなかったがために誰にも気が付かれなかったというパターンです。CCがディスクを壊したわけではありません。無効にしていると、だいたい他のディスクが壊れてリビルド中に全セクタをなめた結果それが発覚して直すべきパリティーが読み込めずアレイが全損します。
CCのモードにSequentialとConcurrentがありますが、Concurrent(デフォルト)はアレイのメンバーディスクを一斉にチェックするモードで、Sequentialはアレイのディスクを1本ずつ終わったら次へ次へと見ていくモードです。ただ、RAIDは結局一番遅いディスクに律されてしまうので、パフォーマンスインパクトとしては1本ずつやる意味がない気がします…。筐体のLEDが1本だけチカチカするのでどのディスクがいまCCされているかという意味ではわかりやすいかもしれません。あとは15krpmのSASドライブが24本くらいになってくると発熱や消費電力的な面で1本ずつやるメリットが有るのかもしれませんが、正直どういうときに使うのか謎です。
Linuxのmdraidはデフォルトで月イチでディスク総なめをする設定が入っているので、そのくらいの頻度でやっておくのがいいと思います。
情報 |
---|
MegaCLIの使い方についてはMegaCLI -helpを参照。殆どここに書いてあります。 また、ディスク障害発生時に検知したい場合はSNMPかvCenterServerを使う必要があります。 |
...
ラベル別コンテンツ | ||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
ページ プロパティ | ||
---|---|---|
| ||
|