Linux

tar 檔案的重複數據刪除

  • February 12, 2013

現在我正在嘗試在我的 linux 備份伺服器上配置具有重複數據刪除功能的 ZFS 並且有一個問題。例如,我在 backup1.tar 中有 1k 個文件,在 backup2.tar 中有 1k 個相同的文件和 1 個新文件。這個文件是否會被重複數據刪除?正如我所看到的,它不適用於 tar 檔案。也許我做錯了什麼。

焦油中的某些塊可能是相同的,但不太可能。ZFS 在塊級別進行重複數據刪除(在 ZFS 用語中稱為記錄大小),因此各個塊需要相同。tar 基本上可以保證執行完全相同的內容,但是這是否會組成一個完整的塊並塊對齊是極不可能的。

如果您想利用 ZFS 重複數據刪除進行備份,請使用快照和發送/接收功能。這具有使用鬆弛空間的正常缺點(儲存分配給記錄大小塊中的文件,如果文件不使用整個塊,則會浪費剩餘空間)。Tar 避免了這個“問題”,但您必須創建增量 tar 備份來重新創建重複數據刪除效果。

引用自:https://serverfault.com/questions/478025