Nutanixの回复力 - パート10-ディスクスクラビング/チェックサム

  • 2021年10月20日
  • 0回复
  • 56意见

UserLevel 3.

本记事は2018年年度11.月份22.日に.乔希多久氏が投稿した记事のの版本です。

原文はこちら。本シリーズの索引はこちら

このシリーズでは,Nutanix.�〖图库以来“

このような情icalishingががある,竞合ベンダーは,「2つのコピーが失われてしまえば,リビルド時間は問題の本質ではない”といった主張で,Nutanix.が提供するデータインテグリティ(データ整合性・一貫性の担保の仕組み)の信用を貶めようとしています。現実的には,データの両方のコピーが同時に失われる可能性は低く,これは安易な主張です。しかし,もちろんNutanix.-3.つのデータのコピーを保存可能なrf3.もサポートしています。

それそれで,パート10.ににましょう。ここここで,ディスクスクラビングとチェックサムという2つの重要なトピックについて説明します。この2つの重要なトピックは,RF2.rf3.の构成が非常に高い回复力を持ち,データが失われる可能性が极めて低いことを保证するものです。

まず,チェックサムチェックサムについてです,チェックサムとは何でしょうか?チェックサムは,书记作业中间作物作物された闻のデータ,后で(チェックサムチェックサムデータを)読み込んで,実际のデータ完全ななであるどうか(つまり,破损していないどうどうかかかできます。

次に,ディスクスクラビングですが,データデータ结合性を定にチェックチェックするグラウンドタスク,エラーが検出された合,ディスクスクラビングディスクスクラビングエラー修プロセスを始して,修正可以なのをを正し。

Nutanix.は,すべての书记(RF2.またはrf3.)に対してチェックサムを実行し,すべての読み取り操作用に対してを検证します。これは,データのの性検证検证がIO.管理の一般であり,スキップスキップしたりオフにしたりすることができないことを意味しし

データの整合性は,あらゆるストレージプラットフォームの最優先事項であり,これが故にNutanix.はチェックサムをオフにするオプションを提供していません。

Nutanix.は読み込みので,アクセスされることになりますまた,Nutanix AOS.は自动的にRF.コピーからデータを取得してIO.をサービスし,同时にエラー/。

またNutanix.がノード/ディスクドライブまたはエクステント(Nutanix.において1MB.単位で管理されるデータブロック)の障害からデータをリビルドする速度は,データの整合性を维持し続ける上でも非常に重要です。

しかし,コールドコールドデータについてははでしょう?

多くの環境には大量のコールドデータがあり,これらのデータは頻繁にアクセスされていないことを意味します。したがって,データがアクセスされていない場合,読み取り操作のチェックサム機構では,そのデータはこまめにチェックされることはありません。このようなデータを保護するにはどうすればよいでしょうか。

答えは简です,ディスクスクラビングです。

フロントエンドの読み取り(例:VM /アプリからの読み取り)操作でアクセスされていないデータに対しては,Nutanix.のディスクスクラビング機構によって,11回コールドデータがチェックさますます。

スクラビングのタスクはクラスター内のすべてのディスクドライブで同时に実行されています。そのため(常にデータの整合性を担保していることから),RF2.(データの2つのコピー)をを用しいるいるで,単独ドライブの障害と,エクステントデータの1MB.のブロック的)が破损し,同じデータを保持した2台のディスクドライブが同时に故障したりするような,复数の同时障害が発生する可能性は,限りなく低くなります。

このこのような障害,过去24.时间以内にそのエクステントで読み取り作用2つのつのデータのコピーにおいてにおいてバックでのディスクスクラビングディスクスクラビングも実実れておらず,さらにNutanix AOS.。

仮にこのシナリオを発生させようとすると,例えば,ディスクドライブに障害が発生し,かつ故障したディスクドライブと同一のデータを格纳しているエクステントのデータブロックが破损している必要があります。NX3460のような小規模な4.ノードクラスタであっても,24.も高度化し。

それでもリスクに対する强い悬念や,これらのイベントがすべて完璧に可口性强く想定するするにrf3.を导入し,3.つの同时障害に加えてすべてのイベントが揃わなければデータ损失が生じ得ないようなリスクに备えます。

vsan.を导入されてて环境环境场合,ディスクスクラビングは年に1回しか行われません。さらにVMware.たSAP HANAのドキュメントも含まれてますます。

#dellemc.#vmware.#vsan.上で#sap hanaを动作させることを検讨する际に,チェックサムを无效にしなければパフォーマンス要件を満たすことができず,结果的にデータ破损のリスクが高くなります。

vSANをを用しないでください-これは冗谈では済まさませんません。

ソース:https://www.emc.com/collat​​eral/technicaldocument/dell-emc-vxrail-hyper-converged-infrastructure-validation-guide.pdf.


※乔什の指摘当時,vxRAIL / VSAN.のドキュメントでは,単纯な记载ミスではなく,明显的にSAP HANA乔什のの指摘后にチェックサムチェックサムの设定をを推奨するようドキュメントがが更更ててて

Nutanix.には,バックグラウンドのディスクスクラビングアクティビティを監視する機能もあります。以下のスクリーンショットは,ディスク#126.のスキャン統計を示しています。この環境では,2TB.萨塔ドライブが约75%のの用率率使使使いいます。

先进的は,ディスクのサイズに关联,ディスク全体のがが24.时间ごとごとに终了することを保证する速度でディスクのを実実しますスクリーンショットでははショットではははででははははで48158724.ミリ秒(谷歌によると約13.3.时间)にわたって実行さてて,完了までの残り时间は556459ミリ秒(约0.15時間)となっています。

データが销量と性能基因て动的に均等に均等分享卫城分布式储存面料ADSF.)の分类型の特价と,ノードごとに复のドライブが同同故障故障し故障し故障に故障のの能の能能の能能実さチェックサム操のでさされる,毎日実行されるディスクスクラビングれるディスクスクラビングれる,さらにHDD固态硬盘をプロアクティブに监视し,これらディスクドライブが故障する前にデータの再保护(データのリビルド)を行います。

さらにADSF.がが故障后ににデータをリビルドするスピードも速いこと,レジリエンシーファクター2RF2.)をを使用しても优れたがが得られるられるがににられるできできが容易に容易容易。

それでもそれでもまだ満足できできないない场,レジリエンシーファクターレジリエンシーファクター3.rf3.)にに変更する,さらに,もう1段高い保护のレイヤーががられ,rf3.を有効化したワークロードに対する保護がさらに強化されることになります。

レジリエンシーファクター(vSANの用水で无法容忍的失败)を検討する際に,Nutanix.vSAN上の2つのデータのコピーが同等であると考えてはいけません。Nutanix.RF2.vSAN上のFTT1.2つのコピー)よりもはるかに回复回复高高,VMware.は频繁にFTT2.3.つのつの推奨していますににこれははてのこれはしていいいてい

  1. vSANは分享型ストレージファブリックではない
  2. vSANのリビルドパフォーマンスは遅く,影响が大厦
  3. vSANのディスクスクラビングは年に1回しか行われない
  4. VMware.ははチェックサムをオフオフにすることを频繁に推奨して(!!!)
  5. 1台のキャッシュドライブが故障すると,ディスクグループ全体がオフラインになる
  6. オールフラッシュのvSAN环境で圧缩や重复排除排除をしている场合,1台のドライブ故障でディスク全グループががする

アーキテクチャは重要です。HCI.やストレージ制品のマーケティングスライドを超え超えててててをすれば,特色スケーラビリティ,回复力,データインテグリティに关键词,Nutanix ADSFが明らかにリーダーであることがわかります。

他の企业やや品は,市场调查ではリーダーとていますが(率直率直言って,10:1デデュープデデュープだとか,(废话)でたらめで),Nutanix.は,実際のビジネス成果をもたらす強固なアーキテクチャで,重要な点でリードしています。


此主题已关闭征询意见
Baidu