Virtualization

壓縮大型類似文件

  • October 10, 2011

我們有大量且不斷增長的 Windows 圖像和其他大文件。在那裡,我假設大多數文件在多個文件中是相同的。

是否有壓縮系統甚至文件系統可以檢測到這一點?

是的,您需要一種稱為“重複數據刪除”的技術。它不像壓縮查看單個文件,它尋找塊級重複 - 所以如果你有同一個文件的一百萬個副本,它應該只儲存一個真實副本,然後用一百萬個指針引用它。讓我們知道您正在尋找哪個作業系統,我會嘗試在“伺服器”中為您找到一個程序,它通常是 NAS/SAN 系統(如 NetApp 文件管理器)的功能。

您可以從http://essensolabs.com/嘗試 DZO(仍處於測試階段),它結合了重複數據刪除和無損壓縮。

引用自:https://serverfault.com/questions/25174