本记事は2020年3月11日に乔什·奥格斯(Josh Odgers)氏がしたの翻訳版です。
このシリーズでは,重复排除と圧缩,およびイレイジャーコーディングを使用する际,nutanixがよりの使用容量を提供し,容量效率,,回复力およびパフォーマンスを向上させることを学んできまし。
また,nutanixははるかにかつ优れたストレージスケーラビリティを提供し,ドライブやノードの障害による影响大幅軽减ていることわかりました。
このパートで,nutanixのAOS(雅典卫城操作系统)とVMwareのVSAN(虚拟圣)におけるにおける层アップグレード,,第2天オペレーションでとなるを取り上げます。
双方のどのにアップがが,のアップアップグレードが环境环境にどのような影响影响をを与える与える与えるか
まずは「チェックの比较」始めみみうう。
アップグレード |
nutanix |
VMware VSAN |
停止をないストレージのグレードグレード |
✅ |
✅ |
以前のもしましたがチェックボックススタイルののスライドはは,,制品制品ののににミスリーディングミスリーディングミスリーディング引き起こし引き起こし引き起こしがちがちがち第2天オペレーションについて大いにはまります。
简単なを挙げみましょう。
例1:AOSやVSANの新へのアップグレード
チェックボックス比较见ると,両制品もも“停止をないストレージのグレードグレード“ができることますこの议论ために以下のな定义を使用します。
「停止ストレージのアップ」」マシン停止停止することなく,ソフトウェア定义定义ストレージ层ののアップグレードグレードグレードをを
nutanixとVSANの双方仮想がすることグレードをできるのは事実ですですが,仮想仮想マシンクラスタクラスタクラスタ/パフォーマンスと整合にはどのようがあるのでしょう??
nutanixのクラウド时代ハイパーバイザーであるであるを用いて比较を行っと,vsphereスタックをグレードするな复雑さがnutanixのソリューションは,全く异なったになってしまいます。
しかし,のはこのシリーズのに沿っより公平公平比较比较比较を行う行うために,ストレージ层层だけだけにににに焦点nutanixとVSANは双方とも((訳注:ハイパーバイザーには)VMwareスイートをするもの仮定します。
まずはVSANから见いき::
VMwareのドキュメントによると
VSANクラスタのホスト,シャットダウン,または切断する前メンテナンスメンテナンスモードに必要あります。ホストメンテナンスメンテナンスモードにする,[[アクセシビリティの确保这是给予的や[[全データの移行这是给予的などの退避を选択必要があります。
引用元:https://docs.vmware.com/jp/vmware-vsphere/6.7/com.vmware.vsphere.virtualsan.doc/guid-521ea4bc-e411-411-411-47d4-899a-5e02e026446986666.html
また,データの移行なし」という肢もあり。。
それぞれのをしてみましょ。。
アクセシビリティの确保((デフォルト)
デフォルトのオプション。クラスタでをオフまたは削除する,,VSANによってホストすべてアクセス可能仮想マシンはアクセス可能ななりなりますます。。アップアップアップグレードグレードをインストールするするときときののようようににホストホストをを一时一时的的的的にクラスタ外しててててこのオプションクラスタホストを恒久的削除场合は适切适切ませんん
通常,的データ退避が必要です。ただし,中,仮想マシンがマシンマシンストレージポリシーに対して准拠なる可能があります。つまり,のにできなくなるがあります。ホストがメンテナンスモードになっおり,[[许容されるプライマリレベルの障害数这是给予的が1に设定いる场合にがすると,でデータがが损失するする可能性性が。
注:3台のホストクラスタ,または3つのフォールトドメインがされているVSANクラスタをて场合,これは唯一の退避モード。。
全データの移行:
VSAN,すべてを内内别のホスト退避退避さ影响影响をを受ける受けるコンポーネントコンポーネントコンポーネントのの可用可用ののコンプライアンスコンプライアンスをを维持维持または修正修正しし,,,,クラスタクラスタクラスタクラスタななリソースリソースリソースリソースリソースを恒久にする场合选択します。クラスタのホストデータをさたら,仮想マシンを别のデータストアストアに移行移行ホストホストホストモードにし。
この退避と,のデータされ时间とリソースのの消费が最も多く多くなります。。选択选択选択ローカルストレージ上のは,の别场所にされます。ホストがメンテナンスモードにいる场合すべての仮想はストレージストレージストレージコンポーネントにできこれに割り当てられストレージストレージポリシーに准拠します。
データの移行なし:
VSANはこのデータ退避させませクラスタからをパワーパワーオフまたはまたは削除削除ししたた,,マシンマシンマシンによってによってによってははは
VSANオンディスクフォーマットのアップグレード:
VMwareのドキュメントによると
ディスクグループは一に1つずつアップされるためディスクディスクグループのサイズはディスクフォーマットのグレード时间が场合があり。。各ディスクグループので,各デバイスにのデータが退避,,VSANクラスタからディスクグループがさます。后,新しいオンディスクフォーマットのVSANに,ディスクグループが追加され。。
引用元:
https://docs.vmware.com/jp/vmware-vsphere/6.7/com.vmware.vsphere.virtualsan.doc/guid-08728a9e-88e0-88e0-48e0-4ceb-9764-e828719da927.html
((※訳注:著者がてページが引用元サイトリニューアル削除されれているいるためため,,,同等同等のがが记述记述ささされれれてている)
この仕组み大きな点がます例,へのの影响を考えててみますます。ディスクグループグループ内内(10TB以上とことも珍しくんん)をクラスタ别场所に格纳するでさ必要ががてしまいますます
これこそが,VSANが25〜30%というスラックを必要としいるいる理由のですこのデータ处理の间,写i/oの比较で学んだにVSANでは,が移动されるVMのデータが,新规とデータのどちらも维持さされてていませません,VSAN环境でFTT1(Nutanixで言うところのRF2)を使用しいる,一定,既存データは1つのコピーさていない可能あるということ。。
ある程度回复をするためにな方法は,VSAN无法忍受(FTT)を1から2に増やすこと。これにのオーバーヘッドがあり,言うまでなく性能性能低下も生じ生じます(気にする。。。。。。。
さらに,のデータを行うため「」」はは,VSANホストの中央处理器オーバーヘッドや特にVSANがデータローカリティ机能を持たがネットワークトラフィックの増加もれます。なお,VSANにおいてFTT1と比较してFTT2のためにされる中央处理器オーバーヘッド不合理ものではありん。実际,Nutanix ADSFもRF2と比较してRF3でより多くの中央处理器を利用し。
これらのヘッドがにも关わらず,VSANをFTT2に设定たところで,VSANでは新规书き込み(グレード中や,以前にしたよう障害障害発生中)に対してに対して许容可能状态が维持さ。。。
VSAN((((())に障害中にに我/oの整合性/コンプライアンスをどおり维持し続けるのは,「データデータの移行」オプションオプションををですですです
ここで重要なポイント,,写IOとノード障害の比较でだように,VSANは必ずしも书き込み我/oの整合维持ててわけではなく,问题は「データの移行移行」」をををししないままままをを変更しししたた场合にに
VSANでは,5・10・20TBのホストを完全退避さは,的に数分単位単位ではなく数时间単位単位の时间をを要し要し要し,3ノードクラスタでの「リソース枯渇」问题,クラスタ内ノードやディスク不足不足,そしてお客がメンテナンスモードにし际の遅延が発生した,といったお客から课题がさてています。
これらはすべて,VSANアーキテクチャのについてのな例にませ。。。
アップグレード时间かかればかかる,メンテナンスウィンドウとコスト(OPEX)の枠内作业し完了できるかいう问题までもも,,,障害とと性能への悪影响影响とといういういういうリスク
次にnutanix aosのアップがように动作のかを说明:
AOSのアップは轮番,一度に1つの控制器VM(CVM)で実行さます。CVMがオフラインなる前にホストホスト/ノードのはクラスタの他のに的にリダイレクトされます。
重要::ストレージのはバイザーからしいるためハードウェアの再起动やホストのの退避ははませませませ
CVMがアップさいる间,仮想はそのままのホスト/ノード上动作し続け。。CVMのアップがするとストレージはローカルのCVMへ戻る形リダイレクトされ。。
nutanixでは,AOSのアップグレードは,vmotionは一も必要ません!なぜvmotionを使わことがなのでしょう?
なぜなら,vmotionを実行ため移行元移行先の両方でCPU/RAMやネットワークホストリソースをとするから。,,,vmotionにはが,メンテナンスウィンドウ长くなります。
ノードあたり100〜200个のVDI VMがあるvdi环境をみう。この场合をアップグレードする准备て100〜200回のvmotionを行いアップグレードれたノードにVMを戻すためも100〜200回のvmotionを行うことになり。
もう1つの例,ノードで,そのノードのCPU/RAMの大部分使用なミッションクリティカルなを数个(あるいは1(つ)しかしかしいないとます。场合,大ななVM,特に内の変化高い高いVMは,vmotion中にのを受ける性があるをに置く必要があり。。
ノードがサイジングれれ适切な利用となって场合であればば,,はじめはじめはじめににワークロードををからから退避さささせせ,后后256GB,512GB,あるいは1TB以上のネットワーク経由転送する必要あり。。。
vmotionの际に,VM/アプリケーションの影响はかであること多い,,,VMが静止と影响も存在し。。
nutanixのVMに対する唯一影响,アップ中には読み书き我/oが100%リモート((nutanix特有のデータローカリティの利点がれる)になることが状态はそもそもデータローカリティ概念が存在しないVSANにおける正常と同じなものです。
VSANでは,VMがVSANオブジェクトホストれいるノード稼働しおり正常している场合でで,読み取り読み取り読み取り我/oの少なくとも50%がネットワーク介してされます。VMがディスクのノードホストされいる场合,読み取り我/oの100%がネットワーク横断して。。
nutanixは今まで/今后もドライブファイルシステムのフォーマット変更変更/改善するありが,ドライブ,,からののののようなな,データの一括一括移动ををを必要必要
nutanixは,にわたってデータ构造に多く変更変更/改善をきたこれらの效率的行うための仕组みみを支える主要主要なはははMapReduceフレームですこのワークはを效率にスキャン,メタデータとデータののにおいて,,,1MBのエクステントまたは4MBのエクステント単位での変换をし。。。
自主范围商店(AES)は,AOS 5.10で导入たもの,のメタの保存を根本的にに変えたた。。。このコードは,1つのnutanix vdiskがのメタデータを扱えるよう书かれい。このためため,,新しい新しい新しいデータデータは新しい新しいで书き込まれれますますがが,,古い。后続リリースでは,MapReduceエンジンは,Nutanix Cassandraから各ノードローカルなAES DBへメタのを,上のへのや移行なしに处理处理ます。。。
现时点でGA済みのでは,ののvdisksまたはVM全体を手动でAESに移行が,はデータ移动やまたはクラスタ内のの利用可能な容量容量の损失なしなしににに。この设定点重大にの,継続ランダム书き込み性能の最大最大化化を必要必要5%のワークロードであり,大多数ははAESなしでもになパフォーマンス発挥します。
现在のGA済みリリースはすべて新しいコンテナとは自动的にAESが有效されて。。
例:4MBのエクステントとそのメタははAES形式にさます。オーバーヘッドは,VSANのディスクの场合のににVM全体とサイズにはならず,4MBとなり。そして,ははnutanixのキュレータによっての低いバックグラウンドとして行われます。
Nutanix ADSFのもう大きな利点は変换クラスタ全体にしたやりやりかたたで处理处理できる。メタデータやのデータ変换は分散さ,,,VSANのよう単一ディスクグループ速度速度/可用性制限受けることありません。
また,nutanixは,AOSソフトウェアがVM内でれ,バイザーから抽象さてているため,((※訳注:aosソフトウェアの更新同时に)ハイパーバイザーグレード必要が无いから互换性,,,信頼性の问题问题ががますますます
运用のリスクを最小限抑える抑える,バイザーバイザーとストレージ层の间のの抽象化をを确実ににに行う行う
VSANとnutanixはどちらも「停止をないアップグレード」ができるとしてているいるにもかかわらずにもかかわらずにもかかわらず,,より详细详细に比较比较ししててみるとと,アップアップグレードグレードグレードがようようようよういることわかりました。
アップグレード |
nutanix |
VMware VSAN |
停止をないストレージのグレードグレード |
✅ |
✅ |
书き込みの完全を维持 |
✅ |
⚠️ |
vmotion/ライブライブ要要 |
✅ |
❌ |
ハイパーバイザーバージョンに依存ないない |
✅ |
❌ |
ディスクフォーマット変更ためデータの一括移动不要不要 |
✅ |
❌ |
ディスクフォーマット変更の大幅容量损失がない |
✅ |
❌ |
まとめ
- vsanではお様「全データの移行」オプションをないない限り限り限り,,アップアップ书き込み书き込み书き込み书き込み书き込み书き込みグレードグレードグレードグレードののの整合性が维持维持维持このオプション。。オプションオプションオプションオプションオプションははははアップグレード时间,影响が大きく原因となります。
- nutanix adsf i/o/oのの性维持しアップをを(vsanのの全全データデータ
- vsanではストレージのグレードを実行ににににををから退避させる必要が
- nutanixではストレージアップグレードを実行ににににを退避させるはありありん。
- nutanixでは/データデータフォーマット変更する,大量データ移动ささせたりたり,,空き空きを大量大量にに失った状态状态状态に
- vsanでは一部ディスクフォーマット変更のデータを一括てする必要があります。。
- nutanix aosのグレードで,ハイパーバイザー抽象化化化化ををを行う必要がため,より迅速迅速ににに実行実行でき,
- nutanix adsfではいずれノードがオフラインもももややvm vmややににアクセス不可ににははならならないないことことことをを常に常に常に保证ててててててて