Hard-Drive

HGST Helium Ultrastar 8TB 7200 RPM SAS 12Gb/s 企業級硬碟的最高正常 SMART 溫度是多少?

  • April 26, 2016

我剛剛收到新的戴爾 R730xd 2U 伺服器,帶有面板 12 * 3.5" 驅動器托架 + 4 * 3.5" 中部托盤,位於 RAM 模組和 CPU 上方。我已插入 16 * HGST Helium 8Tb 7200 RPM SAS 12Gb/s 驅動器並啟動 2 * 8 * 8Tb RAID6 卷後台初始化。

我用 smartctl 查詢驅動器溫度。雖然前驅動器在 33C 到 37C 的範圍內預計會很冷,但中部驅動器 #14..17 是 45C、46C、51C、54C - 我最擔心的是後者過熱。Init 只進行了幾個小時。

iDRAC 報告入口空氣為 22C,出口為 44C。風扇以 ~4.3k RPM 旋轉。如果蓋子關閉,它們會以約 15k 的速度旋轉。

熱成像顯示#17 是最熱的,外殼溫度為 47°C。

我還不確定特定驅動器是否有任何東西,或者是否與驅動器位置有關 - 將通過刪除 VD 並交換兩個驅動器位置來驗證 - 將通過觀察更新這篇文章。

製造規範說正常工作環境溫度高達 60C(連結

在我看來,溫度升高會影響驅動器的使用壽命。

但是,我的舊 R720xd 上的兩個 flex 托架後驅動器是 15kRPM,並且始終保持在 55C 左右,3 年多後仍然可以使用。

此外,我已請求 HGST 支持他們的立場。

另一個關於 serverfault 的話題指向Google的研究,指出 T 是幾年後的一個因素。(連結

UPD1 (20151102):製造商迅速回复:“該驅動器可以在 5 - 60 攝氏度之間執行。該驅動器通常應在 50 攝氏度以下執行。如果它在 55 攝氏度的穩定溫度下執行,那麼它的執行溫度會比正常溫度高一點,但仍在安全範圍內。”

UPD2:我交換了 #14 和 #17 的位置 - 過熱是特定於位置的,右側(從前到後看)比左側暖和,前 #17 座位的 #14 顯示頂部 56C 和前 #17 14 座在 40-45C 時很涼爽。將 iDRAC->Hardware->Fans->Setup->Fan Speed Offset 調整為“Low Fan Speed Offset (+23%)”(6.8kRPM 空閒與 4.4kRPM 預設值,進行 RAID 初始化)為 #14 和 #17 帶來最高溫度從 49C 和 54C 到 40C 和 47C。將風扇設置為 15kRPM(通過設置對第 3 方 PCI 卡的預設反應——我有一個)以額外的 +120W 功耗(340W 與 230W)為代價將溫度提高到 34C 和 39C。

當然,我沒有使用戴爾認可的磁碟。戴爾現在沒有為此伺服器提供 8Tb 驅動器,而 6Tb SAS $ 830 a piece. I’ve got 8Tb Helium SAS for $ 498 帶來預 RAID TB 成本 $ 138 to $ 62. 後來我意識到戴爾韌體(並受 Lifecycle Controller 支持)可能與冷卻有更好的通信,並且還通過 LC 獲取韌體更新。

對我來說另一個驚喜 - 交換 #14 和 #17 並沒有導致 RAID 重建 - 控制器只是在新位置拾取磁碟而沒有在日誌中說一個字。

UPD 20160426:現在部署了多個 R730xd 和 12+4 配備 HGST 8T 12G SAS 或 Seagate 8Tb 12G SAS,我觀察到所有的 #14 比 #17 低約 10C,部分補救措施使其溫度達到 40-47C範圍是將 iDRAC 中的風扇速度設置提高到 +30%。

任何低於 55-60 C 的溫度都可以。無論如何,對於機械驅動器來說真正危險的是反复的熱偏移,驅動器會變熱並迅速冷卻。同樣危險的是重複的分拆/分拆循環。

如 EEAA 所述,如果它是 DELL 支持的設置,您不必擔心。

我將此添加為指向一些更相關研究的指針,這些研究比 Google 的工作更新,並且似乎對其方法有一定的嚴謹性。

儲存艙人 Backblaze對驅動器型號的故障率與溫度進行了分析,發現大多數情況下沒有相關性。對於三個模型(兩個 Seagate Barracudas 和一個 Hitachi Deskstar),相關性具有統計學意義(他們沒有說明顯著性的門檻值是多少,但我從數字猜測醫學標準的 95%),在其中一種情況下,它非常強大。

他們的結論,我完整複製,是

總體而言,工作溫度和故障率之間沒有相關性。一個例外是 Seagate Barracuda 1.5TB 驅動器,當它們執行溫度更高時,它的故障會稍微多一些。

只要您在允許的工作溫度範圍內很好地執行驅動器,讓它們保持涼爽並不重要。

所以在你的情況下,我會說你沒有任何真正的問題。(免責聲明:我與 Backblaze 沒有任何關係。)

引用自:https://serverfault.com/questions/733080