解决了

如何拆卸节点上的DIMM

  • 2021年3月12
  • 7回复
  • 226的浏览量

徽章 +1

嗨,社区,

版本和型号- NX-1065-G6

我有一个节点的DIMM故障。

Memory | Uncorrectable ECC (@DIMMC1(CPU2)) | Asserted

我想从节点中删除它并重新启动它。也就是说,不要用新的内存模块来替换它。

  • 这是可能的吗?
  • 风险吗?
  • 我应该如何配置缺少DIMM的节点,或者这是Nutanix自动处理的事情吗?
  • 还有其他的建议吗?建议吗?

我找到了这份文件。这条是正确的吗?

干杯!

图标

最佳答案JacksonWrath16072021年3月14日05:01

Hey @Sammy777<\/user-mention><\/p>

Yea, you can do this. The \u201csymmetrical\u201d thing is for performance reasons; you want to make sure that all channels are \u201cbalanced\u201d and have the same number of DIMMs. It\u2019ll work if it\u2019s not balanced, but will likely be slower. This doc shows the supported balanced configurations of memory on that model:
https:\/\/portal.nutanix.com\/page\/documents\/details?targetId=System-Specs-G6-Multinode:har-dimm-config-overview-g6-c.html<\/a><\/p>

As far as getting Nutanix\u00a0to recognize that the DIMM is removed permanently and stop sending alerts, there\u2019s a way to do it, but it\u2019s not public and I don\u2019t remember what it is. Hit up Nutanix Support for that.<\/p>","className":"post__content__best_answer"}">

查看原始

本主题已关闭供评论

7回复

Userlevel 6
徽章 +5

嗨Sammy777,


这是正确的指南(假设你运行的是ESXi hypervisor)。

按照指导,你将会是OK的内存更换。

请记录旧内存和新内存的序列号,并在IPMI中进行比较。

运行NCC检查,查看更换后的IMPI SEL日志和硬件状态。

只有在一切正常时,才将节点退出维护模式。

要拆卸DIMM,你必须从两个通道拆卸DIMM,以便通道的容量保持对称。

此外,请检查同一指南中支持的内存配置。

徽章 +1

@Alona

谢谢你的回复。

我不想更换DIMM,直接从节点中取出即可。

我运行AHV版本NUTANIX 20170830.171

你是什么意思:

要拆卸DIMM,你必须从两个通道拆卸DIMM,以便通道的容量保持对称。

你能详细说明一下吗?

干杯!

Userlevel 6
徽章 + 16

也许这篇文章能帮到你:https://systemx.lenovofiles.com/help/index.jsp?topic=%2Fcom.lenovo.conv.8695.doc%2FReplacingAMemoryDIMM.html

Userlevel 1
徽章 +1

@Sammy777

是的,你能做到。“对称”是出于性能原因;你要确保所有通道都是“平衡的”,并且有相同数量的内存。如果不平衡,它会起作用,但可能会变慢。本文档展示了该模型支持的内存平衡配置:
https://portal.nutanix.com/page/documents/details?targetId=System-Specs-G6-Multinode:har-dimm-config-overview-g6-c.html

至于让Nutanix认识到内存被永久移除并停止发送警报,有一种方法可以做到,但它不是公开的,我不记得它是什么了。点击Nutanix Support。

徽章 +1

@JacksonWrath1607

谢谢,这很有帮助。

Userlevel 6
徽章 + 16

因为你解决了这个问题,我想请你做个标记 @JacksonWrath1607这样,有类似问题的人就可以更快地找到解决方案。

徽章 +1

更新

但这并没有奏效。

拆卸故障内存后,主机还剩下5条内存条。

我无法启动主机。它抛出错误并进入引导循环。

我去掉了并行内存,以创建一个对称的配置,但这也没有帮助。

看起来nutanix不支持对称配置的内存。

谢谢!

Baidu