Monitoring

check_mk IPMI PCM 感測器隨機讀取失敗

  • October 2, 2019

我使用 check_mk_agent 來監控安裝了 IPMI 和 freeipmi-tools 的伺服器。據我所見,監控隨機檢測到 IPMI 感測器“Temperature_PCH_Temp”沒有返回任何值。

這是一個問題,因為它會導致 CRITICAL 狀態觸發通知。中斷只持續一次檢查,以下總是可以的。溫度不在邊緣區域,故障前和故障後的讀數均未顯示溫度趨於超過門檻值。

有人知道這種行為的原因可能是什麼以及如何防止它?

我的 X9DRD-iF 的 Supermicro IPMI 01.78 版。您可以在http://www.supermicro.com/about/policies/disclaimer.cfm?url=/support/resources/getfile.aspx?ID=1940下載它

聽起來像是硬體故障(IPMI 板片狀、感測器損壞)——您應該聯繫您的硬體供應商並報告問題,看看是否可以更換。

引用自:https://serverfault.com/questions/449426