貸そうか？: 12月 2017

2017年12月25日月曜日

コレで大丈夫、vSANクラスタの正しいシャットダウン（オレ流の運用にご注意を!!）

このBlogはvExpert Adventarに参加しています。

〜“ほんのちょっと”な、vSANのお作法を正しく知って欲しい〜

vSANは筐体レベルで停止しても大丈夫な可用性を有していますが、「ビルの法定停電などで完全停止をしなければいけない」という環境で運用しているお客様も少なくありません。

ですが、正しくない手順でvSANシャットダウンすると、最悪データが欠落するリスクもわずかながらあるので、この手順をきちんと知ってほしい！！そう強く願います。

〜〜〜〜〜〜〜いままでは、どうしてた？？〜〜〜〜〜〜〜

（１）メンテナンスモードへ移行
（２）ESXiをシャットダウン
（３）ストレージをシャットダウン

ですが、、これと同じ手順でvSANクラスタを落とすのはおすすめしません。

〜〜〜〜〜〜〜では、、手順の説明に入ります〜〜〜〜〜〜〜

まず、自分のvCenterServerがどこにいるか？でお作法が異なります。

（コース１）vCenterServerはvSANクラスタとは別のESXi上にて動作している

（コース２）vCenterServerはvSANクラスタの上で動作している

では、２つのコースごとに、流れを追っていきます。

2017年12月21日木曜日

vSANの障害試験、小ネタほか

このBlogはvExpert Adventarに参加しています。

https://adventar.org/calendars/2248

前回のところで割愛した小ネタを幾つか

◯SSDの障害試験にご注意

試験でキャッシュデバイスを抜いた場合、そのまま戻すとエラーとなるので、必ずパーティション情報を消してから戻してください。

partedUtilコマンドの詳しい使い方はこちら

https://kb.vmware.com/kb/1036609

キャッシュのSSDにかかれているメタデータをもとに、その配下にDiskGroupメンバーの情報を理解しようとします。

◯メンテナンスモードでの３つのモード

次回のBlogで非常に重要な要素となります。

恒久的にクラスタからESXを外す場合などには、この設定を調節してください。

◯Witnessって何？

Witness（監視）はその他のクラスタリング技術と同じ、多数決を決める役目というレベルです。

◯vSANはSPBMが重要

ポリシードリブンのインフラ（SDDC）を実現する入り口として、HCI powered by vSAN

ということなんです。

◯今後のvSANどうなる？

バックアップ機能を強化するという予告がありました。
2017ラスベガスで最も興奮した瞬間です。
＃まだTechPreviewなので、どのように提供されるかは不透明ですが・・・

管理サーバ不要（Native）で動作するので、
vSAN領域に放り込んでくれれば、VMイメージの世代管理が出来るのはとても良いことですね。

詳細はこちらに。。。
http://www.yellow-bricks.com/2017/08/30/vmworld-sto1770bu-tech-preview-integrated-data-protection-vsan/

このセッションでは遠隔転送のデモンストレーションは時間切れで見せてもらえませんでした。

言いたいことが山盛りなのですが、お時間が来たようなので・・・

ではまた！！

2017年12月11日月曜日

vSANの耐障害性とは？

〜このBlogはvExpert Adventarに参加しています〜
https://adventar.org/calendars/2248

本当によく貰う相談なので、オープンにしちゃいます。vSANの色々…

以前にちょっとだけお話した、耐障害性について

「どうして大丈夫なのか？」をベーシックなMirroring構成で説明したいと思います。

＝＝おさらい＝＝

http://vm-fun.blogspot.jp/2016/07/vsan.html

【１】RAID組まないとは？
　・Raidを組む必要がない
　・ESXサーバ内のHDDどうしでミラーリングではない（Raidではない）
　・仮想マシンの可用性に合わせて、必要なデータは自動で他のESXサーバへ多重コピー

【２】キャッシュのSSDが１本では不安なので、Raid1で構成できる？
　・１本で大丈夫、RAID不要！！
　・キャッシュに書き込まれた内容は、他のESXサーバにもミラーリングしてくれる

＝＝どうしてか？＝＝

それはvSANのデータ保護の考え方が従来のストレージとは全く異なるからです。

まずRAIDを必要としません。そしてパススルー構成が推奨されています。

「RAIDが無いのに、どうして大丈夫なの？？」と非常に沢山の質問をいただくのですが、

それはデータを筐体（ESXサーバ）間で複数持ち合うことをしているからです。

※VMさんの資料から拝借します

２年前と本質は変わっていません。http://vm-fun.blogspot.jp/2015/12/vsan.html

で、「どのデータをどれだけ多重化するの？」という可用性ポリシーを決めているのが「FTT」といいます。

平たく言えば、何台ESXが倒れてもデータアクセスを継続したいですか？ということです。

必要なESXはの台数は「２N＋１」で計算ができます。
　　１台倒れてもOK・・・２＋１＝３台
　　２台倒れてもOK・・・４＋１＝５台

この多重化は、ESXという単位ではなく「VMDKの単位」で指定ができます。

FTTに次いで、重要なのが、このデータ配置の原則です。
この挙動を理解すると「だからVSANはこうなるのね！」とよーくわかります。

同じESXには、多重化したデータを置かない。ということ
異なるESXに必ず配置されるのです。

ポリシで定義された状態を維持するために、自律的にデータを多重化してくれるので、運用が簡単なのです。
SPBM（Storage Policy-based Management）の本質はここにあります。

では、実際に障害を起こした結果をまとめます。

（具体的な画面は、DELLさんに寄稿した内容を参照いただければと思います）