Windows
監控硬碟健康狀況的最佳策略是什麼?
您使用什麼策略來監控伺服器硬碟的執行狀況?您是否安排了帶有報告的自動 chkdsk?您如何收到故障警報?
磁碟子系統中實際上有很多需要監控的內容:
- 文件系統健康:chkdisk 或 fsdisk(文件系統與物理陣列的健康不同——當然,物理問題通常會導致 FS 損壞)。
- RAID 健康:包括任何 RAID 配置的狀態和 RAID 控制器上的電池。例如,有一個磁碟從陣列中退出,它是否正在重建?
- 每個磁碟的預測性磁碟故障:請參閱SMART
- 工作溫度(不是特定於磁碟,但很重要)。
- 最新的韌體/驅動程序
您可能還想監控磁碟子系統的性能:
- 讀/寫操作的平均時間
- 讀/寫數量
- 磁碟操作隊列
像 Nagios 這樣的系統有各種外掛,可以根據這些故障發出警報。通常您需要像 Dell openmanage 或 MegaCLI 這樣的實用程序來通過 SNMP 監控 RAID 的狀態。這些工具通常也可以提醒您自己,但這不是集中的。