Amazon-Web-Services

CWAgent 磁碟空間警報

  • June 10, 2020

我正在嘗試使用來自 Cloudwatch 代理的指標為可用磁碟空間實現警報(在 Cloudformation 中),但我遇到了設備改組 DeviceID 的問題。

我之前在使用 fstab 時遇到過這種情況,EC2 實例以看似隨機的順序附加 EBS 卷。如果我有兩個 EBS 卷,一個用於作業系統,一個用於數據,它們可以在 nvme0n1/nvme1n1 之間隨機交換。我能夠使用分區 UUID 解決這個問題。

但是,在創建警報時,我認為沒有辦法解決這個問題。必須使用指定 DeviceID(nvme0n1) 和掛載點 (/var/data) 的指標來創建警報。這些可以在任何給定的引導時交換。請參閱https://imgur.com/a/XJ62zN8您可以看到當伺服器重新啟動時設備發生變化時,有四個數據點有效地表示兩個資訊點。

有什麼方法可以在沒有設備的情況下使 Cloudwatch 代理報告或編寫警報以應用於任何設備指標?

在文件中進行一些探勘之後,解決方案是通過在配置 json 文件中使用布爾值來刪除設備。

https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Agent-Configuration-File-Details.html

生成的塊將如下所示。

           "disk": {
           "measurement": [
               "used_percent"
           ],
           "metrics_collection_interval": 60,
           "resources": [
               "/",
               "/var/data"
           ],
           "drop_device": true
       },

引用自:https://serverfault.com/questions/1020755