Windows

監控硬碟健康狀況的最佳策略是什麼?

  • February 26, 2011

您使用什麼策略來監控伺服器硬碟的執行狀況?您是否安排了帶有報告的自動 chkdsk?您如何收到故障警報?

磁碟子系統中實際上有很多需要監控的內容:

  • 文件系統健康:chkdisk 或 fsdisk(文件系統與物理陣列的健康不同——當然,物理問題通常會導致 FS 損壞)。
  • RAID 健康:包括任何 RAID 配置的狀態和 RAID 控制器上的電池。例如,有一個磁碟從陣列中退出,它是否正在重建?
  • 每個磁碟的預測性磁碟故障:請參閱SMART
  • 工作溫度(不是特定於磁碟,但很重要)。
  • 最新的韌體/驅動程序

您可能還想監控磁碟子系統的性能:

  • 讀/寫操作的平均時間
  • 讀/寫數量
  • 磁碟操作隊列

像 Nagios 這樣的系統有各種外掛,可以根據這些故障發出警報。通常您需要像 Dell openmanage 或 MegaCLI 這樣的實用程序來通過 SNMP 監控 RAID 的狀態。這些工具通常也可以提醒您自己,但這不是集中的。

引用自:https://serverfault.com/questions/240634