Datastax-Enterprise

Datastax 維修服務問題

  • November 13, 2014

所以我們在兩晚前有一個節點出現故障,並且花了一天的大部分時間將其恢復。我還在學習,所以我不熟悉修復選項,但基於這裡的文章:http ://www.datastax.com/dev/blog/repair-service-opsc4

我可以只啟用維修服務嗎?這是否消除了手動執行 nodetool repair 的需要,這很痛苦,因為它是手動的,而且顯然 I/O 非常密集,這讓我很擔心。

此外,假設此服務在本文中描述的真實世界中工作,我是否可以確信以建議的時間間隔啟動服務不會導致性能問題?

定期維修

建議您經常每週執行修復作為反熵機制。如果您執行修復的頻率不高於 gc 寬限秒設置並且有很多墓碑,則可能會遇到問題(殭屍數據)。

在現實生活中執行維修服務

簡短的回答是肯定的。維修服務通過自動化此操作使您的生活更輕鬆,它還將維修分成小部分,以減輕工作量並防止您在維修過程中遇到資源爭用和性能問題。對於大多數集群來說,它應該是開箱即用的,在某些情況下,您可能需要調整一些預設設置。有用的槓桿包括——max_parallel_repairs、min_repair_time、snapshot_override

恢復一個宕機的節點

對於您知道一個節點大約一天左右不同步的這種特殊情況,我預計您的集群在修復期間會承受壓力。創建默克爾樹是 CPU 密集型和 io 密集型的。維修服務計算的較小切片應該有助於簡化此過程。

引用自:https://serverfault.com/questions/644161