Cassandra

Cassandra - 硬體規劃

  • June 20, 2015

簡而言之:如果我有 5 Tb 的數據並想在 5 台 cassandra 伺服器上部署它 - 每台機器是否需要 5 Tb 的數據磁碟空間(不包括日誌空間)?從文件看來,cassandra 有時需要 2 倍的數據大小 - 所以 10Tb / 伺服器或陣列中總共 10Tb?

每台機器應該有多少記憶體?假設 5Tb 都在同一個列空間中。我一直計劃最大化每台機器上的 RAM,但我不確定這是否足夠。我是否需要一組總記憶體為 5Tb 的伺服器?

如果您將 5 TB 數據平均分佈在 5 台伺服器上,則每台伺服器將託管 1 TB 數據。由於壓縮需要,每台伺服器將需要 2 TB 的磁碟空間(在最壞的情況下,壓縮需要的磁碟空間是數據的兩倍),這意味著集群中總共需要 10 TB。

上述情況是您僅在集群中儲存數據的單個副本。在這種情況下,如果伺服器出現故障,五分之一的數據將無法訪問。如果您想在集群中儲存 2 個數據副本,每個節點將需要 4 TB 的磁碟空間,這意味著集群中總共需要 20 TB。

引用自:https://serverfault.com/questions/460450