2015/12/08

vSphere 6.0 でのHA機能のエンハンスの要点

まとめ

  1. vSphere 6からは、ストレージパスが死んだ場合でもHAを設定できるようになった。
  2. vCenterは watchdogs によりプロセス落下時には再起動される
  3. vCenterの可用性をさらに高めるにはWindows版を利用し、MSCSクラスタを設定する必要がある

資料

  1. VMware vSphere 6 のドキュメント
  2. http://www.vmware.com/files/pdf/vsphere/VMW-WP-vSPHR-Whats-New-6-0-PLTFRM.pdf
  3. vSphere 5.x および 6.x での永続的なデバイスの損失 (PDL) と全パス ダウン (APD) (2081089)

vSphere 5.5 までの障害あるある(Part 1)

物理ホストのHBAが死んだり経路上の問題で、特定のホスト群のみストレージへのパスが切れた。
vSphere 5.5 までは、ストレージへのパスが死んだ場合、HAによる保護ができない障害パターンで、IOが止まっているが、管理者が別のホストに移してから再起動するまでアプリケーションは死んでいた。

vSphere 6になると…

VMCP(Virtual Machine Component Protection) の機能として、ストレージへのパスが切れた時に検知し、挙動を制御できる。
VMware のドキュメントとしては、APLPDL という2つの用語に分かれていて、設定上も異なる設定が可能。
- APL
- All path down
- 全パスが切れた場合
- PDL
- Permanent device loss
- LUNがぶっ壊れて認識できなくなった場合など
- どういう状態かはKB 208108に例がある

vSphere 5.5 までの障害あるある(Part 2)

vCenterのプロセスが落ちる。
仕方ないので、再起動させるスクリプトを書く。

vSphere 6になると…

WatchdogがvCenterに組み込まれている。
PID WatchdogAPI Watchdogがあって、それぞれプロセス自身を監視するのか、API経由で監視するのかの違いがある。 API Watchdog はデフォルトで起動する。
Watchdog は、vCenterプロセスの再起動してくれる。2回プロセス再起動してもプロセスが上がらない場合には、リブートする。

vSphere 6以降の設計ポイント

(今までもやっていたと思うけど、 )VMCPのおかげで、1クラスタの中でストレージの障害範囲を分けておけば、 HAしてくれるようになった。
そのため、クラスタ内でストレージ機器への接続で、同一のスイッチを使わないようにするなど、検討する必要がある。

ところで、今回はvSphere 6で設計上の大きなポイントになる(と思っている)PSCについて一切触れていない。
PSCの構成については、List of recommended topologies for VMware vSphere 6.0.x (2108548) に詳しく記載されている。
とはいえ、日本語版はアップデートされていないようだし、気が向いたら書こうとは思う。

0 件のコメント:

コメントを投稿