解决了

IOError [Error 28]设备上没有剩余空间

  • 2021年7月13日
  • 4回复
  • 250的浏览量

大家好!

集群中的一个节点突然断开。我最初无法ping通,但在重新启动节点并检查维护模式是否启用后。网络连接恢复,所有ip都能ping通。

即便如此,即使所有的ping都正常,集群也无法识别之前断开的节点。尝试重新启动集群和本地CVM,但出现以下错误:

nutanix@NTNX-A-CVM: 192.168.50.182: ~ $集群状态
2019-07-13 07:34:46,652Z WARNING genesis_utils.py:1304无法到达Genesis节点。重试…(按Ctrl-C终止
回溯(最近的电话last):
文件"/usr/lib64/python2.7/logging/__init__.py",第875行,在emit
self.flush ()
文件"/usr/lib64/python2.7/logging/__init__.py",第835行,齐平
self.stream.flush ()
IOError: [Errno 28]设备上没有剩余空间
从log.py文件中记录,第191行
2019-07-13 07:34:47 7654z WARNING genesis_utils.py:1304无法到达Genesis节点。重试…(按Ctrl-C终止
回溯(最近的电话last):
文件"/usr/lib64/python2.7/logging/__init__.py",第875行,在emit
self.flush ()
文件"/usr/lib64/python2.7/logging/__init__.py",第835行,齐平
self.stream.flush ()
IOError: [Errno 28]设备上没有剩余空间
从log.py文件中记录,第191行
2019-07-13 07:34:48,656Z WARNING genesis_utils.py:1304无法到达Genesis节点。重试…(按Ctrl-C终止
回溯(最近的电话last):
文件"/usr/lib64/python2.7/logging/__init__.py",第875行,在emit
self.flush ()
文件"/usr/lib64/python2.7/logging/__init__.py",第835行,齐平
self.stream.flush ()
IOError: [Errno 28]设备上没有剩余空间
从log.py文件中记录,第191行
2019-07-13 07:34:49 659z WARNING genesis_utils.py:1304无法到达Genesis节点。重试…(按Ctrl-C终止
回溯(最近的电话last):
文件"/usr/lib64/python2.7/logging/__init__.py",第875行,在emit
self.flush ()
文件"/usr/lib64/python2.7/logging/__init__.py",第835行,齐平
self.stream.flush ()
IOError: [Errno 28]设备上没有剩余空间
从log.py文件中记录,第191行

有人遇到过吗?不幸的是,支持期限几个月前就结束了。

图标

最佳答案raaji2021年7月22日21:54

Hi John,<\/p>

Let me respond to your query.<\/p>

If \/home is full, we will need to carefully check and clean files from approved directories on the CVM<\/p>

Could you please ssh into CVM (192.168.50.182) and execute the following command?<\/p>

du -h ~\/data\/logs<\/span><\/p>

This shows the space utilized by the logs in the CVM\u00a0<\/p>

And then please refer to this KB to clean up space: [AOS Only] What to do when \/home partition or \/home\/nutanix directory on a Controller VM (CVM) is full<\/a><\/p>

查看原始

本主题已关闭供评论

4回复

徽章 +3

你好 @John还建议请核实:

  1. 从IPMI检查任何硬件问题
  2. 从PE,你看到任何关于CVM/主机的警报吗?从PE的硬件图中,您看到主机上有未挂载的磁盘/坏磁盘/错误吗?
  3. 请查看portal.nutanix.com/kb/8086是否匹配问题。

感谢和最好的

@Haritha安达

棱镜城有一个警告:

操作失败。原因:Prechecks failed: 192.168.50.182访问lcm失败。请检查KB 7781发现远程版本无,而2.4.2.25804预期节点192.168.50.182。这可能是缓存问题。请确保所有本地缓存都已清除,并等待几分钟,等待远程缓存失效后再重试。请查阅KB 7784

我试过KB 7784和7781,但没有用。

我试过你给我的KB,我看到/家是100%

================== 192.168.50.182 =================
Filesystem Size Used Avail Use% Mounted on
devtmpfs 9.8G 0 9.8G 0% /dev
tmpfs 512M 0 512M 0% /dev/shm
tmpfs 9.9G 624K 9.9G 1% /运行
/sys/fs/cgroup . tmpfs 9.9G 0 9.9G 0%
/dev/sda2 9.8G 4.0G 5.8G 41% /
/dev/loop0 240M 2.1M 222M 1% /tmp
/dev/sda3 40G 39G 0 100% /home
tmpfs 2.0G 0 2.0G 0% /run/user/1000
/dev/sdb1 3.6T 1.3G 3.6T 1% /home/nutanix/data/stargate-storage/disks/ZC1B0WKY
/dev/sdc1 3.6T 1.4G 3.6T 1% /home/nutanix/data/stargate-storage/disks/ZC1ARFYN
/dev/sda4 1.7T 269G 1.4T 16% /home/nutanix/data/stargate-storage/disks/S47PNE0M400683

试图删除它的内容,但它说:


nutanix@NTNX-19FM6J260111-A-CVM: 192.168.50.182: $ rm / iso / * ~ /基础
/usr/bin/rm: cannot remove ' /isos/* ':没有这样的文件或目录

我的语法有问题吗?

Userlevel 2
徽章 +4

嗨,约翰,

让我来回答你的问题。

如果/home是满的,我们需要仔细检查和清理CVM上批准的目录中的文件

您可以ssh到CVM(192.168.50.182)并执行以下命令吗?

du - h ~ /数据/日志

显示CVM中日志所占用的空间

然后请参考此KB来清理空间:[AOS Only] Controller VM (CVM)的/home分区或/home/nutanix目录已满时的处理方法

  • 不要使用rm射频在任何情况下,除非另有说明。会导致数据丢失的场景。

如果您仍然需要这方面的帮助,请使用Nutanix打开支持票来解决该问题

@raaji

谢谢!

我昨天就试过了。方法2似乎是最有效的。

我刚删除了一些文件/home/nutanix/data/如知识库所示

刚好能把利用率从100%降低到97%。启动集群后,利用率下降到30%左右。

Baidu