Backup

具有許多重複文件的備份文件

  • March 9, 2020

我經常需要備份一組文件,其中許多子文件夾包含幾個相同的大文件。

是否有一種壓縮方案(.zip、.7z 等)可以自動檢測到這種情況並且不會多次儲存相同的文件?

是的,有可能:https ://superuser.com/questions/479074/why-doesnt-gzip-compression-eliminate-duplicate-chunks-of-data

這是我想出的一個例子:

[jay test]$ tree .
.
`-- compressme
   |-- a
   |   `-- largefile (10MB)
   `-- b
       `-- largefile (10MB, identical to ../a/largefile)

3 directories, 2 files
[jay test]$ du -sh compressme/
21M compressme/
[jay test]$ tar -cf compressme.tar compressme/
[jay test]$ du -sh compressme.tar 
21M compressme.tar
[jay test]$ lzma -9 compressme.tar
[jay test]$ du -sh compressme.tar.lzma 
11M compressme.tar.lzma

引用自:https://serverfault.com/questions/483586