本記事は2020年2月27日にJosh岁氏によって投稿された記事の翻訳版です。
本シリーズではこれまでにNutanixでは重複排除や圧縮はもちろんのこと,イレイジャーコーディング-より高い销量效率,柔软性,回复力,そして性能をより多种の利用可用性ととともに,ごご提供できるできることをんできましまし
更に,Nutanixは遥かに簡単に優れたストレージの拡張性を提供でき,ドライブ障害の影響を劇的に低減できることも学んできました。
そこから我们はギアを変え,混在クラスタクラスタのについてについて上げ,これこれなぜhciプラットフォームプラットフォーム拡张力力,そして完全な置き换えや新闻なサイロ作物
ブログシリーズの今回のパートではそれぞれの製品の書き込み操作についてのI / Oパスについて,ミラーリング(vSANにとってはFTT1,そしてNutanixにとってはRF2)を例に上げて取り上げていきます。
それとは別にソフトウェア定義のストレージを”インカーネル”与“コントローラーVM (CVM)”それぞれに展開する場合の比較の記事を公開する予定です。今回の記事ではトラフィックがどのようにノード間を飛び交うか,クラスタをどのように利用するかにフォーカスを当てたいと思います。
vSANとNutanix ADSFの注册両方で全くの新しい4ノードのクラスタがあり,600 gbのvDiskの仮想マシンが1台あると考えましょう。600 gbという値は2つの理由からこの値を選んでいます。
- 後ほど引用するVMware.の记事でもこの大厦さを利用している
- 600GB.ということはvsan.はディスクを複数のオブジェクトに分割する必要があります,これはvsan.にとってプラス要素です。(<255GB.であれば単一オブジェクトということになります>)
vSANから見てきましょう:
vSANは255 gbというオブジェクトのサイズの上限からvDiskを3つのオブジェクトに分割します。つまり、3のオブジェクトと3つのレプリカ、そしてWitness(ウィットネス)が1つあるということになります。
オブジェクトはVMがホストされているノードともう1台の別のノードに以下に示すとおり配置されることになります。(スクリーンショットは以下のURLから取得されたものです)
ftt1の场合のvsanオブジェクトの配置
vsanの书记パスパスの:
ベストケースのシナリオは,VMが作成されたホスト上から移動していない,もしくは最初のホストへと移動して戻っている状態で,書き込みのうちの一方はローカルのオブジェクト,もう一方はリモートのオブジェクトになります。
シナリオ1: vSAN
vsanにとって最适な书架パス - vmが作物成さたホストホスト上にある
もしも仮想マシンが手动,もしくはDRSで的vMotionして偶然にノード2へと移动した场合,以下に示すように同じ最适な书き込みパスのまま。
シナリオ2:vsan
vsan.にとっての最適な書き込みパス- - - - - -仮想仮想マシンがオブジェクトオブジェクトの配置されているホストへとと移移
上にある场场ないにあるある综合(4ノードクラスタの杂合50%銇銇銇銇銇銇銇銇銇銇銇銇銇銇銇銇銇銇銇銇銇銇銇銇銇銇銇銈尾ます。
シナリオ3:vSAN
vsan.にとってにとって最适とはは言え言えないき込み- - - - - -仮想マシンがオブジェクトの配置されていないホスト上にある
これらのシナリオはもしも我々がvSAN「」」「」アーキテクチャがもっとも最适な(もしくは最短の)IOパスであるということをを受け入れるして,取り上げてべき内容です。我O00
もう少しだけ深く分け入って,仮想マシンがクラスタ内を動き回った(これはよく起こることです)際に何が起こるかを見てみましょう。
メンテナンスや博士によるによるクラスタクラスタクラスタバランシングバランシング动态2つの仮想マシンというななをを利用しましょうこれら仮想マシンが最终最终。のオブジェクトオブジェクトを最终ホストてないノード上游动手さています。仮想マシンのioパスは一体どのようななになるううか
以下の図そのそのを顕しています.2つの仮想マシンマシン书架i / oは100%リモートへと向かうことになり。さらにさらに1とノード3のネットワークトラフィック书籍を2つ送り出している上に,2つの书签を事になっおり,问题をさらにさらにおりさています。
シナリオ4:vsan
vsan.にとってにとって最适とはは言え言えないき込み- 2つの仮想マシンはオブジェクトが配置されていないホスト上にある
以前にも言及したとおり,クラスタが拡張されていくに連れ,仮想マシンがそのオブジェクトが格納されているホスト上に存在する可能性は低下していくため,このシナリオでは環境上で不必要なリソースのオーバーヘッドが発生する可能性が高くなります。
もし环境が2重障害重障害化(FTT2)で构成されているいるにに,このこのマシンのIOが100%リモートで行われるというオーバーヘッドは更に増加します。
シナリオ5: vSAN
vsan.がメンテナンス状態で,仮想マシンがクラスタ全体に渡って移動されている場合には,仮想マシンは1つもしくはそれ以上の仮想マシンのオブジェクトをホストしているノード上に移動され,書き込みI / Oは最適になるかもしれませんが,すでにお伝えしたとおり,これはクラスタのサイズが大きくなるに連れてその可能性が下がっていきます。
「を私は偶然の」と呼んでいます。
vsan.のIOパスのサマリ:
vsan.シナリオ |
1つはローカル,1つはリモート |
2つともリモート |
1.オリジナルオリジナルの(ノード1) |
||
2.オブジェクトのあるノード(ノード2) |
||
3.オブジェクトのないノード(ノード3) |
||
4.2つ仮想マシンがオブジェクトのないノード上にある(ノード3 & 4) |
||
5.メンテナンス |
* |
* |
*偶然に最適なシナリオになる確率はクラスタのサイズが大きくなるに連れて小さくなります。8ノードクラスタでは25%にまで低下し,32ノードノードのクラスタではたったの6.25%です。
結果としてメンテナンスの最中には大部分の書き込みI / Oはネットワーク越しに行われるという事態になり,以前にご説明したように他の仮想マシンとの競合を引き起こします。
注意:メンテナンス時にvsan.の标准の「アクセシビリティを保证(“保证Accesibility”)“設定を利用している際には,以下のvSAN 6.7のドキュメント(vSANクラスタのメンバーをメンテナンスモードにするに記載)に説明されているとおり,データはVM.ストレージポリシーには完全には準拠していません:
大抵の场合,一部のデータのみ退避が必要なります。しかししかし,仮想マシンはこの退避中VM.プライマリレベルプライマリレベルの対障害性が1にセットされていた場合,クラスタ内のデータ丧失が発生する可能性があります。
VMware.のCTO办公室のHCI.ビジネスビジネス部门のチーフテクノロジストの邓肯epping.氏はvsan6.2:なぜftt = 2を新闻标准として利用すべきなのかというというタイトルの记事记事をいてい
私は邓肯氏のvsan.についての推奨事项ににしますし,上部のメンテナンスシナリオでデータ丧失のリスクvsan.でFTT2.を利用する必要性を強調するものです。
注意:Nutanix Adsf.はRF2 (FTT1)で当たり前のように常に書き込みI / Oこれ整合并をしますますはADSFにとって大きな容量,回复力,そして性能上の优位性です。
将来の记事でもっと重要な回复力についての考虑事项を取り上げます。
さぁ,Nutanix Adsf.について確認していきましょう:
ここではvsan.上での仮想マシンと同じ構成の仮想マシン,1つの600GB.の仮想ディスクを保持しています。Nutanix Adsf.には大規模で効率の良くないオブジェクトのコンセプトはありません。vDiskの数がいくつであるかに関係なくすべてのデータは1 mbのエクステントもしくは4 mbのエクステントグループに分割されています。
Nutanix.の仮想マシンが新たなデータを书き込んでいます,1つのレプリカはローカル,そしてもう一つのレプリカはリモートへインテリジェントなレプリカ配置机构で书き込まれます。
すべてのケースで1つのレプリカは仮想マシンが动作しているホストへと书き込まれ,もう一方のレプリカはクラスタ全体へ分散して书き込まれます。
Nutanix.はキャパシティの効率性とパフォーマンスを書き込みパス内で提供します。
続いて,仮想マシンをノード1からノード2へとvMotionしてみましょう。
vMotion後のNutanix.の仮想マシンは新闻データデータ书架,1つのレプリカをローカルへ,もう一方のレプリカをインテリジェントなレプリカ配置机构を用いてリモートへ配置します。
この结合であっても1つのレプリカは仮想マシンが稼働しているホストへと書き込まれ,もう一方のレプリカはクラスタ全体に分散して書き込まれます。
Nutanix.はvMotionの後であっても引き続きキャパシティの効率性とパフォーマンスを提供します。
それそれでは今度今度は仮想をを3.へとvMotionしてみましょう。
Nutanix.の仮想マシンは2回目のvMotionのあと新しいデータを書き込みます,書き込みパスは引き続き一貫して1つのレプリカをローカルへ,もう一つのレプリカはインテリジェントなレプリカ配置机构を用います。
それそれでは仮想仮想マシンをオリジナルのホストvMotionで戻してみましょう。
結果として状況は7つのうち4つのつのデータがローカル,そして3.つのデータがリモートになり,もしもアクセスが必要になればローカライズされます。もしもアクセスされないのであればそのままリモートのまま维持され,仮想マシンの性能には影响を与えません。
ここで重要な点はマシンががに动态たのかにわらず1つのレプリカをローカルに,もう1つをリモートに书き込み,一贯した书き込み性能を提供することです。
书籍パスではインテリジェントな配置配置がががのでので,クラスタは可なな均均になることが保证れれれこのシンプルな例から,ノードが3.つか4つのデータのかけらを保持しており,そしてすべてのノードが分散した作法で書き込みIOに参加するということを見ることができます。
vsan.で取り上げた2つの仮想マシンがそれぞれ作成されたホストから移動されたというシナリオではどうでしょうか?
Nutanix Adsf.のIOパスのサマリ:
以下ではクラスタ内のどこに仮想マシンがあるかに関わらず,書き込みパスは同じに維持されるということを確認できます。1つのつのレプリカは仮想仮想マシンが稼働しているノードノードにき込まき込まき込まき込まき込まき込ま2つ目(rf3.の場合は3.つ目も)のレプリカはインテリジェントにクラスタ全体に分散されます。
Nutanix Adsf.のシナリオ |
1つはローカル,もう一つはリモート |
2つともリモート |
1.オリジナルノード(ノード1) |
||
2.最初のvmotion(ノード2) |
||
3. 2度目のvMotion(ノード3) |
||
4.2つの仮想マシンがオリジナルノード上にない(ノード3 & 4) |
||
5.メンテナンス(《超能のアップグレード) |
一貫性が重要です,そしてこれはNutanix.のユニークなデータローカリティが書き込みIOにもたらしているもの,そのものです。
Nutanix.の书架I / Oが1つはローカル,もう一つはリモート(rf3.ではリモート2つ)では最適でないというシナリオはないのですか?
あります,3.つのシナリオがあります:
- ローカルのノードがフルの場合
- ローカルノードのCVMが様々な理由で利用できない場合
- 上书道(「はは「その场场ででさされ)
最初の2つのの合,すべてすべて书架(と読み込み)はリモートになります。
上書きについては,ランダムI / Oは引き続き,最适なパフォーマンスのためにのOplog.へと書き込まれます。IOがエクステントストアへとドレインされる際に,その状況に応じてローカルもしくはリモートで実際の上書き操作が完了されます。もしも上書きされたデータが読み込まれる場合には将来,適切に上書き操作(そして読み込み作品)を行うためにローカライズが実施されます。
短くまとめるとNutanix Adsf.の最悪のケースのシナリオ(すべてのIOがリモート)はvsan.にとってよくあるシナリオということになります。
CVMは先进的CVMが予期せずにオフラインとなるような好ましくないイベントが発生した場合にも,仮想マシンは継続して稼働し続け,IOはリモートから提供され,重要なインテリジェントなレプリカ配置が引き続き適用されます。CVMがオンラインに復帰すれば最適な書き込みパスが再開されます。
次は,vsan.とNutanix Adsf.の読み込みI / Oパスについて取り上げ。
サマリ
- vsan.の书き込みパスは仮想マシンがクラスタ内のどこにいるのかによって剧的に移り変わります。
- vsan.の静的な,オブジェクトベースの書き込みパスではメンテナンスの最中に大規模なデータ移行(ホストの退避)を行わなければ,新たに書き込まれるI / Oを保護することができません。
- Nutanix Adsf.は常に構成されたストレージポリシー(RF -弹性系数)に基づいて書き込みI / Oの整合性を維持します。
- Nutanix Adsf.はクラスタ内のどこに仮想マシンがあっても,もしくはそれが移動しても関係なく書き込みパスの一貫性を提供します。
- Nutanix Adsf.の最悪のケースのシナリオは2つの書き込みのレプリカがリモートに送信される(メンテナンス時やCVMの障害)ですが,これはvsan.にとっては当たり前のシナリオです。
- Nutanix Adsf.は設計レベルでデータローカリティを実現しており,偶然そうなるのではありません。