Ext4

使用硬連結進行廉價/快速的重複數據刪除?

  • January 8, 2021

我已經安裝了數千個 Wordpress 共享主機,並且多年來我一直希望有一種以明智和安全的方式刪除所有重複文件的好方法。我正在尋找更好的磁碟記憶體命中率和更簡單的備份。

我只是使用標準的 Ext4,而不是像 ZFS 這樣內置的東西(需要付費)。

我熟悉像 rdfind 這樣的工具幾乎是完美的。它可以掃描所有文件,找到重複項並將它們硬連結在一起。我可以在非高峰時間每週執行一次,從而使成本幾乎為零。

問題是我想要一個帳戶更改文件以破壞硬連結並再次提供它自己的文件副本。這樣一個站點更新 Wordpress 或外掛就不會與任何其他站點混淆。這也將消除潛在的安全問題,因為沒有帳戶能夠篡改另一個帳戶的文件。連結的寫時複製排序。

這樣的事情可能嗎?我試過做一些搜尋,但我找不到任何東西。

看起來高效“離線”重複數據刪除的最佳解決方案是 BTRFS reflinks。

如果某些東西試圖更改文件(例如 Wordpress 更新),這會使連結保持“可破壞”,從而保持平台的安全性和易用性。

感謝@bitinerant 指出該選項。我將做進一步的實驗,看看是否值得為我的特定場景遷移。我可以將 EXT4 遷移到 Btrfs 的事實使它比 ZFS 或類似的更可行。

引用自:https://serverfault.com/questions/1048719