Filesystems
如何優化龐大的圖像目錄
我接管了一家小公司的技術業務。然而,之前的領導做出了儲存 100 GB 圖像的錯誤決定,儘管我們的網站只使用了大約 5GB 的圖像。基本上,沒有清理腳本。我現在的任務是優化這個爛攤子,但不太確定從哪裡開始。有沒有辦法獲得每個圖像文件最後一次通過網路訪問的列表,所以我可以執行類似“如果在過去 365 天內未打開然後移動到備份驅動器並從主伺服器中刪除”之類的操作?
您忽略了使用您所在的環境(作業系統、Web 伺服器等),所以我假設是 Linux。
如果您沒有使用 將數據目錄安裝在伺服器上
noatime
,則可以使用find
搜尋 365 天內未訪問的文件:find /var/www/images -iname "*.jpg" -atime +365 -type f
如果您使用
noatime
,這將是不可能的(如果您使用relatime
,則atime
可能是 24 小時關閉)。但是,這不是一個好方法,因為您的 HTML 文件中可能會出現死連結,並且有人會在 5 天后需要此資源…
更好的方法:解析您的網路樹,列出其中引用的所有文件(確保關閉您的網路伺服器自動索引…)並存檔其他所有內容。這樣,您可以確保 HTML 文件中列出的所有內容仍然可用。
請注意,您可能會在正常樹中找到未連結到人們通過直接連結訪問的孤立的 HMTL 文件孤島 - 在建構列表時考慮這些文件。當然,圖像文件可能也是如此,但您實際上只能通過日誌文件解析或
find
方法擷取那些文件。