监视第3/4部分指标和Prometheus和Grafana


UserLevel 2
徽章 +12

除了使用SNMP或基于代理的版本的“经典”监控之外,我们还在谈论指标和OpenSource Project的Livedata的Monitorng普罗米修斯。虚拟化是用强大的工具进行的格拉法纳

对数据的访问将使用所谓的“ node-exporter”进行,我们可以在github下找到。一个出现nutanix

Homelab中的我的测试柜是由以下项目构建的:

nutanixcluster <-prometheus <-grafana

192.168.10.80 192.168.10.123 192.168.10.100

Nutanix CE Ubuntu 18.04 Lts Ubuntu 18.04 LTS

Prometheus 2.2.1 Grafana 7.0.4

走1.10

要求

  1. 在Nutanix Prism Central中创建新用户,并具有观众权利

2.在Ubuntu 18.04 LTS上安装Prometheus,并使用运行GO!

良好的源这里或者这里

3.在第二个Ubuntun 18.04 LTS上安装von Grafana 7.x

找到好的来源这里

开始与Nutanix的联系

  1. 我们下载去二进制对于GO/bin文件夹中Prometheus VM的Nutanix出口商

我们将测试与-help命令的GO/BIN共享:

应该这样。不,我们尝试检查我们的新创建的Viewer用户是否能够从Nutanix群集中获得一些指标。如果我们描述没有单独的端口Prometheus使用端口9405。如果您连接到更多,则必须为每个群集描述一个单独的端口!

您可以通过IP连接或为其创建DNS条目。如果需要,可以用变量掩盖用户名/密码!

端口上的结果:9494在我们的Prometheus服务器上的结果如下:

答对了。单击度量,您可以获得所有可用的指标...

这是马努尔的方式。

现在,我们构建一个小的shell脚本,该脚本正在自动进行这些调用。我们还在Prometheus服务器上创建服务,以重新启动!

我们在/etc/systemd/system中创建shell脚本作为新服务!

  1. bash-script将在份额中创建/go/bin(示例代码)
我们可以在GitHub存储库中找到其他示例!

2.创建新服务/etc/systemd/system

在我的Homelab中,我使用了根用户!不要在生产环境中这样做!为这些任务创建特定用户!

使用“ SystemCtl启用Prometheus_nutanix.Service”启用服务

我们重新启动VM并检查一切是否正常,现在自动运行:

SystemCtl状态Prometheus_nutanix.Service

现在,我们将在Prometheus上的“给予:港口”上找到指标。但是,对于与格拉法纳的合作,出口商需要被宣布为目标

modify/etc/prometheus/prometheus.yml并放入以下部分!重新启动Prometheus服务!

如果存在新创建的目标,请在端口上控制默认的Prometheus:9090。

美好的!现在我们切换到Grafana

  1. 我们将Prometheus宣布为Grafana的新数据源
只需将Prometheusip与默认端口9090使用!

现在,我们在Prometheus/Nutanix下创建了一个新的仪表板,并选择了选择指标。

注意力呢它使在Prometheus配置中使用有效名称声明每个群集!

我仅创建了一个简单的示例仪表板,其中包括VM帐户,内存等。

如果您想从此开始,只需从我的github存储库下载json文件这里并将其作为新的仪表板导入。

处理技巧:

将所有指标从Prometheus指标站点导出到记事本++ / sublime,以方便搜索!

帮助和类型背后的价值是无关紧要的。但是Metrik的名称是关键!将其从这里复制并粘贴到Grafana的选择!

传说默认显示了度量的名称。但是你可以

a)手工覆盖它

b)使用{{cluster}}或{{node}}的变量

  1. 通过/1024/1024/1024等转换字节,以MB/GB/TB为

玩仪表板玩得开心……。


3个答复

徽章

感谢您的文档。我们是否有解释这些指标的文档?理想情况应该为他们设置什么阈值?

UserLevel 2
徽章 +12

如果您看指标,则最多的声明是明确的。这也是Nutanix圣经中缺少的元素...但是我希望它会尽快参加……这是我的Homelab 3节点群的一个例子…

nutanix_cluster_num_random_io {cluster =“ admincafe”} -1.0
nutanix_cluster_num_read_iops {cluster =“ admincafe”} 3.0
nutanix_cluster_num_read_io {cluster =“ admincafe”} 93.0
nutanix_cluster_num_seq_io {cluster =“ admincafe”} -1.0
nutanix_cluster_num_write_iops {cluster =“ admincafe”} 7.0
nutanix_cluster_num_write_io {cluster =“ admincafe”} 212.0
nutanix_cluster_random_io_ppm {cluster =“ admincafe”} -1.0
nutanix_cluster_read_io_bandwidth_kbps {cluster =“ admincafe”} 29.0
nutanix_cluster_read_io_ppm {cluster =“ admincafe”} 304918.0
nutanix_cluster_seq_io_ppm {cluster =“ admincafe”} -1.0
nutanix_cluster_storage_capacity_bytes {cluster =“ admincafe”} 1.2839315724E+12
nutanix_cluster_storage_disk_physical_usage_bytes {cluster =“ admincafe”} 0.0
nutanix_cluster_storage_free_bytes {cluster =“ admincafe”} 1.145171744971e+12
nutanix_cluster_storage_logical_usage_bytes {cluster =“ admincafe”} 1.4583942348E+11
nutanix_cluster_storage_resveres_capacity_bytes {cluster =“ admincafe”} 0.0
nutanix_cluster_storage_resvere_free_bytes {cluster =“ admincafe”} 0.0
nutanix_cluster_storage_reseved_usage_bytes {cluster =“ admincafe”} 0.0
nutanix_cluster_storage_tier_das_sata_usage_bytes {cluster =“ admincafe”} 0.0
nutanix_cluster_storage_tier_ssd_usage_bytes {cluster =“ admincafe”} 1.39058477856E+11
nutanix_cluster_storage_unresveres_capacity_bytes {cluster =“ admincafe”} 0.0
nutanix_cluster_storage_unresveres_free_bytes {cluster =“ admincafe”} 0.0
nutanix_cluster_storage_unresverve_own_usage_bytes {cluster =“ admincafe”} 0.0
nutanix_cluster_storage_unresverve_usage_bytes {cluster =“ admincafe”} 0.0
nutanix_cluster_storage_usage_bytes {cluster =“ admincafe”} 1.38759827456E+11
nutanix_cluster_storage_user_capacity_bytes {cluster =“ admincafe”} 0.0
nutanix_cluster_storage_user_container_own_ousage_bytes {cluster =“ admincafe”} 0.0
nutanix_cluster_storage_user_disk_physical_usage_bytes {cluster =“ admincafe”} 0.0
nutanix_cluster_storage_user_free_bytes {cluster =“ admincafe”} 0.0
nutanix_cluster_storage_user_other_containers_reseved_capacity_bytes {cluster =“ admincafe”} 0.0
nutanix_cluster_storage_user_resver_capacity_bytes {cluster =“ admincafe”} 0.0
nutanix_cluster_storage_user_resver_free_bytes {cluster =“ admincafe”} 0.0
nutanix_cluster_storage_user_resverd_usage_bytes {cluster =“ admincafe”} 0.0
nutanix_cluster_storage_user_storage_pool_capacity_bytes {cluster =“ admincafe”} 0.0
nutanix_cluster_storage_user_unreseved_capacity_bytes {cluster =“ admincafe”} 0.0
nutanix_cluster_storage_user_unresvere_free_bytes {cluster =“ admincafe”} 0.0
nutanix_cluster_storage_user_unresverd_own_usage_bytes {cluster =“ admincafe”} 0.0
nutanix_cluster_storage_user_unresverd_shared_usage_bytes {cluster =“ admincafe”} 0.0
nutanix_cluster_storage_user_unresverd_usage_bytes {cluster =“ admincafe”} 0.0
nutanix_cluster_storage_user_usage_bytes {cluster =“ admincafe”} 0.0
nutanix_cluster_timespan_usecs {cluster =“ admincafe”} 3E+07
nutanix_cluster_total_io_size_kbytes {cluster =“ admincafe”} 4013.0
nutanix_cluster_total_io_time_usecs {cluster =“ admincafe”} 62667.0
nutanix_cluster_total_read_io_size_kbytes {cluster =“ admincafe”} 889.0
nutanix_cluster_total_read_io_time_usecs {cluster =“ admincafe”} -1.0
nutanix_cluster_total_transformed_usage_bytes {cluster =“ admincafe”} -1.0
nutanix_cluster_total_untransformed_usage_bytes {cluster =“ admincafe”} -1.0
nutanix_cluster_write_io_io_bandwidth_kbps {cluster =“ admincafe”} 104.0
nutanix_cluster_write_io_ppm {cluster =“ admincafe”} 695081.0
nutanix_host_avg_io_latency_usecs {hostName =“ ntnx-739347ed-a”} 309.0
nutanix_host_avg_io_latency_usecs {hostName =“ ntnx-d5104c7d-a”} 153.0
nutanix_host_avg_io_latency_usecs {hostName =“ ntnx-ee409937-a”} 206.0

你好,

在对Nutanix身份验证后,我将面临一个问题。它显示“ 401未经授权”

我通过了URL,用户名和密码。它工作了几个小时,然后开始显示401个未经授权

你能帮忙吗

回复


Baidu