查找重複文件的 Linux 工具？

September 17, 2021

我有一個龐大且不斷增長的文本文件集，它們都非常小（小於 100 字節）。我想區分每對可能的文件並註意哪些是重複的。我可以編寫一個 Python 腳本來做到這一點，但我想知道是否有一個現有的 Linux 命令行工具（或者可能是一個簡單的工具組合）可以做到這一點？
更新（響應mfinni評論）：文件都在一個目錄中，所以它們都有不同的文件名。（但它們都有一個共同的文件副檔名，因此可以很容易地用萬用字元選擇它們。）

有fdupes。但我通常使用的組合find . -type f -exec md5sum '{}' \; | sort | uniq -d -w 36

那麼有 FSlint - 我沒有在這種特殊情況下使用它，但我應該能夠處理它： http ://en.flossmanuals.net/FSlint/Introduction

引用自：https://serverfault.com/questions/188729

相關問答

查找文件的所有唯一版本並將其分組

January 9, 2013

diff文件夾並複制結果

June 19, 2009

比較兩個文件夾內容的所有者和權限？

January 28, 2022

在 Linux 上將文件連接到虛擬文件

September 13, 2021

確定2個目錄是否有任何區別的有效方法？

March 4, 2021

最喜歡的 rsync 提示和技巧

February 2, 2021