问题

集群利用率达到95%,导致Windows Server崩溃

  • 2021年2月3
  • 3回复
  • 54岁的观点

徽章
  • 冒险家
  • 3回复

存储使用率达到95%,部分windows虚拟机(2016 - 2019)下降。

AHV程序20170830.395

磁盘空间释放后,需要大量的虚拟机进行修复。

问题:

  1. AHV容量达到95%时会关闭虚拟机?
  2. 95%时重启虚拟机,是否会导致虚拟机数据磁盘崩溃?

3回复

Userlevel 6
徽章 +5

@dzeng

在此场景下,AHV不关闭虚拟机。发生的情况是,新的IO不是写的,而是读的,因此客户操作系统崩溃。磁盘会损坏吗?但随着“星门”(存储服务)进入只读模式,这种可能性不大。所以数据被保存了下来。但是,内存中的内容不能写入磁盘,这反过来会导致应用程序崩溃。

如果这有助于理解,请告诉我。

徽章

@Alona

谢谢您的回复。我们这周遇到了这个问题,很多虚拟机崩溃了,我们花了48小时来修复。据我所知,当ESXI集群存储使用率达到95%时,会关闭虚拟机以保护操作系统。AHV有可能关闭ESXI中的虚拟机吗?或者对这种情况有更好的主意。

先谢谢你

Userlevel 6
徽章 +5

@dzeng

AHV不暂停虚拟机。如果环境得到良好的规划、监控和照顾,达到95%的存储利用率是不应该发生的。

我在评估环境时会考虑以下几个问题:

  • 工作量是多少?VDI,关键任务数据库和应用程序,文件服务器?每一个都有一个增长模式。例如,脑深部脑区可以迅速增大。而VDIs可能会在一天或一周中的某些时间出现峰值。
  • 存储利用率的“正常”水平是多少?这不是一个统计平均值,因为它不会给你一个有意义的数字。当它不是95%的时候,这个数字在哪里?
    它是低于50%,突然快速增长的数据(然后发现源,找到经济增长的原因,消除或管理问题的根源,隔离源从其余的工作负载可能,确保有足够的空间扩大,如果增长是不可避免的)?
    通常是80%吗?因此,在数据增长期间,存储利用率达到关键数字,您将面临一项艰巨而富有挑战性的紧急清理和恢复任务,这就不足为奇了。
  • 存储的大小是否适合工作负载?正常的存储利用率可能是50%,但是因为总可用存储空间不够大,所以正常和预期的工作负载增长将系统带到临界状态。你会从存储扩展中获益吗?
  • 看看后台的任务。快照太多吗?改变快照的保留和/或时间表是否值得?

以上只是几点。你更了解你的系统。预防是最好的策略,真的。

回复


Baidu