Compression

哪種存檔/壓縮格式?

  • May 26, 2011

Zip、Rar、7z、Gzip、BZip2、Tar 等。我聽說 7z 是本月的最佳版本,為什麼?是最適合所有情況還是針對特定情況有更好的選擇。

或者也許實際的文件存檔器,即 WinZip、WinRar、7Zip 等(與格式相反)有更大的影響?

在您的回答中,您能否描述您提到的格式使用哪種速度/壓縮權衡。

請提供任何支持您答案的實證測試的連結。

背景:我需要備份一個自定義搜尋索引,該索引創建大約 3000 個相對較小的文件(小於 10MB),每個文件都包含大量重複數據。

(像往常一樣,維基百科有一篇相關的文章,但關於性能比較的部分很簡短。)

謝謝

Compress、Gzip、Bzip、Bzip2 不適用於歸檔多個文件。他們只壓縮單個文件。對於歸檔,它們通常與 TAR 一起使用。TAR 的問題在於它沒有索引表。僅當您打算恢復整個事物時才好。如果您希望只需要恢復有限數量的選定文件,請忘記 TAR。要從中獲取最後一個文件tar.gztar.bz2存檔,您必須解壓縮並處理所有文件。對於 zip、rar 或 7-zip,它會轉到索引表,跳到存檔的相關位置,只處理相關文件。

好的,TAR 出來了,剩下的就是 ZIP、RAR 和 7-ZIP。在這三個中,ZIP 是最普及的,大多數東西都支持它,許多應用程序都內置了支持。而且速度很快。另一方面,7-ZIP 也是可移植的,庫是 LGPL,壓縮率比其他兩個好得多,但代價是消耗更多 CPU。RAR 在那裡是真正的失敗者,既不是很好的壓縮,也不是真正的便攜,也不是很快。

編輯:似乎最好的選擇是 7-ZIP,但使用 bzip2 壓縮方法。這樣您就沒有 TAR 的缺點,但您仍然可以利用 bzip2 多核支持。見這篇文章。

引用自:https://serverfault.com/questions/5230