如何監控網路共享連接的可靠性?
我可以使用任何 Windows Pro 或 Server Standard 或 CentOS 來執行此監控(我猜)。AWS Deadline 工作似乎存在一些我不希望任何人知道的複雜問題。工作失敗了很多。
吸煙槍(我認為)是監控軟體有時無法啟動的工作,因為它無法訪問特定共享。共享是 ZFS,硬體完全能夠跟上 IO。這個問題主要發生在密集的集群中,在其他時間出現稀疏的“一次性”事件。“重新啟動修復它”但不是在密集的故障集群期間。
我有強烈的動機去密切監視網路共享的可靠性,因為有時這些共享會突然而神秘地在其他時間對 Windows 10 客戶端不可用!然後他們要麼在片刻或幾分鐘後再次出現……要麼重新啟動修復它。
遇到此問題的所有客戶端都在執行 Windows 10,但這並不一定意味著這是 Windows 10 問題。
網路擁塞不是太高。
我可以使用事件查看器進行這種監控嗎?有沒有一種無痛的 python 方法來做這個監視器。我想在一周內盡可能多地收集數據……一天 24 小時……如果有道理的話。
將腳本作為計劃任務執行,以定期和頻繁的時間間隔讀取和寫入一個小但不斷變化的值到共享上的文本文件,並將這些記錄到監視伺服器。
如果可能的話,我建議讓它每隔幾秒執行一次,所以如果你要將它託管在 Windows 機器上,你可能希望使用 cmd 而不是 PowerShell。
要寫入的值將是時間/日期,精確到幾分之一秒,在下一次迭代中,腳本將查找文件,如果找到,將讀取該文件中的值,然後將其附加到監控記錄,並將新值寫入檢查文件。如果未找到該文件,您將在日誌中寫入相應的錯誤消息。
您將能夠驗證對共享的訪問(包括讀取和寫入),直至您希望或系統可以處理的任何粒度,並且您將獲得對該共享的成功或失敗讀取和寫入的日誌。