2020年6月22日josh odgers氏氏氏し
Nutanix AOSこのシリーズの前半ででの読み取りパスおよび书き込みパスの利点と,nutanix独自のデータローカリティの実装どのよう恩恵をもたらすについてししたた。
また,データローカリティに新たな比较シリーズを开始し,データローカリティがのストレージ性能ではなくではなく,とクラスタすべてのマシンのと机能もハイライトしててます。。。
それでは,i/oパスのなやかについて见ていき。。。
先日,vmware社は「如何处理VSAN群集中的主机上丢失的I/O(VSAN群集におけるホスト上の我/o(((((についてについて),)」」KB71207を公开した。
この记事はストレージコントローラ物理ドライブなど,我/oパスのどこで我/oが「」「ロストした场合のVSANの対応说明して。。
この症状について,vmware社はのに说明して:
ストレージコントローラストレージディスクでi/oがスタックたり失わたりすると,ESXIストレージコンポーネント,タスク要求を通じて,これら我/oを中止よう,以下のコンソールを表示します。
如果I/O在存储控制器或存储磁盘上被卡住或丢失,则ESXI存储堆栈将尝试使用显示这些控制台消息的任务管理请求来中止它们:
记事は続けて::
このようなロスト我/oがホストで见つかった,,VSANはホストを的にpsodさせ上他のホストに与えないようにし。
如果在主机上发现了这样的I/O,则VSAN将迫使主机到PSOD,以确保它不会影响群集上的其他主机。
この记事はその影响リスクについてもしてて:
「丢失或楔形的I/O」とは,ESXIの外部(コントローラ/(ファームウェア)でで动かなったた我/oのことで(我/o(()完完ずアボート(异常了终了了要求要求要求も反応せず,または完了できできません。。このよう我/oは,ディスクが応答しなくとなり,その,,主持人がハングアップたり応答しなくなっ,,vCenter服务器から切断れたりし。。
丢失或楔入的I/O是一个I/O,它被困在ESXI(设备控制器/固件)之外,该I/O未完成,并且不会响应中止和/或流产从未完成。这样的I/OS会导致磁盘或磁盘组无反应,这可能会导致Hostd悬挂或不反应并与vCenter Server断开连接。i/oはESXIの外止まっている,,ESXI(((((())を异常了ををを送信することだけです/コントローラが120秒(タイム値値)以内以内に応答VSANはホストクラッシュさせてVSANクラスタ全体を与えように,をからからますます。
由于I/O被卡在ESXI之外,因此ESXI唯一的选择是发送中止。如果设备/控制器在120秒内未响应中止(默认的TIEMOUT),则VSAN将使主机失业,以避免通过撞击主机来影响整个VSAN群集。
要约すると,vmware社は「」またはロスト」した我/oに対して,结果てpsod(紫色屏幕:ESXサーバのvmkernelで重大エラーし机能が完全停止((哈イベントによって内生き残った上で再さ(仮想マシンが生きままままvmotionさない)ことこと意味。。。
VMwareはpsodの处理クラスタ上他のを与えようにするするため」と正当化してておりおり,,
nutanix aosが,が同じ陥っ场合にどのよう対处対处するかを见见うううう
最初の大きなは,nutanix aosが仮想マシン「コントローラVM()内内されること,ハイパーから抽象されていること。。
これはハイパーに影响与えることなく,CVMがハングアップした我/oなどの处理というで「インカーネルであることに比べてて大きな大きな利点とと
それで,を少し详しくごしましょう。
- ディスクにio要求がされると,CVMのカーネルデバイスに关连たたSCSIタイムアウト持ち,それははSCSI中止任务管理コマンドを使ってioを中止ようとし。。
- 先のでのに加えて,星际之门(データ我/oマネージャー,のデータ管理と我/o处理を,ハイパーからの主な我/o(インターフェイス)ではではディスクにに我/oが発行たびにを开始し。はは的的に2重のとなります。
- カーネルが1。のアボートの,我/oエラーやを返し,その我/oが小组(nutanixのストレージデータ管理のグループグループ1(つ)ファイルファイル关连られている,,nutanixは単にメタデータで小组の破损マーク,别健全なレプリカからその4MB単位で修缮オペレーション起动しこのよう,デバイス上のの不良ブロックは,,そのブロックににマッピングマッピングマッピングた1つの小组ファイルにを,それ以外はに机能し続け。。
- 场合によってディスクのエラーがより深刻,ディスクがもはやもはや稼働ししてていいいないないケースありありますます。。。このこのこのようような2。でしが作动しますこのイベントでは,そののディスクディスクををオフラインオフラインオフラインににしますます。このこのようようににしてて,そのそのホストホストホスト上他他他他馆长(MapReduceクラスタのとアップを行うサービス,,馆长は,のディスクバランシング,事前事前多くの管理ととと行う行う)小组のレプリカ,レプリケーション要求起动を行います。このように,1台の不良がCVMやホスト影响与えることありません一方一方VSANでディスクが発生し,,重复排除と圧缩を使用ている场合,,キャッシュドライブが故障しては,グループ全体がれ。。。
- 稀なケースがカーネルやドライバーのででCVMがダウンてしまった,クラスタ上の哈モニターは,そのCVMが动作にリダイレクトを追加し。によりにより仮想マシンの我/oは,に别のななCVMにリダイレクトれホスト上の仮想ははvmotionや哈イベントをせに通常通り稼働続け。机能はは计画的的CVMのアップのも使用され。ローリングアップグレードとCVMの再実行するで,ホスト关连仮想仮想はは,nutanixクラスタによる基本な哈再ルーティング移行するなく実行さ続け。。。
このようのは,ストレージコントローラ全体ををををににににパススルーパススルーパススルーているから。
そのため,我/oコントローラになやハングアップ発生しても,CVMを再するで済み最悪の场合はCVMを停止せおくと选択も可能です。
ホストはコントローラ管理しておら,,我/oリクエストをてないため,ようなののを受けることははありませんん。。:CVM((((())ややグレードグレード,,CVMがオフラインなった场合,aosはすべてマシンマシンします。
一方,VSANがホストをpsodする必要のはホストプロセスがのににに我/oを発行いるから。したがって実际はははESXカーネル/ホストの中断ないスリープ陥っおり,のリセットが唯一の手段手段になり,,仮想仮想仮想哈でリカバリ必要あるということになり。。
まとめ
この単纯なにおいて,VSAN/VXRAIL环境で,最低で((我/o(((())ホストホストによって仮想マシンが哈イベントにするのに対して,nutanix上のマシン引き続き动作し続け最悪のケースでも我/oがクラスタ内别CVMにリダイレクト间,のローカリティが的失われるのみで済みます。
nutanix aosの优位は次::
- 我/oのハングアップスタック生じても仮想のの哈イベントは必要ません
- ストレージコントローラ问题生じてもハイへの影响はありん
- ドライブがてもホストがオンライン状态,(クラスタクラスタ全体全体)
- データの破损原因で我/oのハングアップスタックがした场合,AOSはそのとしてマークし残り残り読み込み行う行う一方で,破损したたレプリカの自己自己修复机能机能机能がが
- 最悪のシナリオも,我/oがクラスタされるで,アップグレードための通常のの动作と同様でありであり,仮想マシンマシンはははます
- 问题を解决ためにCVMを再必要ある场合でもホスト仮想にははがなくなくAOSはマシン动作ため,起动はに迅速行われ,クラスタははの状态状态状态/回复力ある状态にますます
- プラットフォームがして力ある状态戻るの管理者の介入介入は最小限最小限ですですです
- AOSソフトウェア,マシンで実行れること,ハイパーから抽象化されれいますますます!!
この记事贡献して,,nutanixの多く素晴らしいプリンシパルの一人であり,星际之门チームのリーダーであるTabrez Memon氏にな感谢を。。