Filesystems

如何優化龐大的圖像目錄

  • February 21, 2016

我接管了一家小公司的技術業務。然而,之前的領導做出了儲存 100 GB 圖像的錯誤決定,儘管我們的網站只使用了大約 5GB 的圖像。基本上,沒有清理腳本。我現在的任務是優化這個爛攤子,但不太確定從哪裡開始。有沒有辦法獲得每個圖像文件最後一次通過網路訪問的列表,所以我可以執行類似“如果在過去 365 天內未打開然後移動到備份驅動器並從主伺服器中刪除”之類的操作?

您忽略了使用您所在的環境(作業系統、Web 伺服器等),所以我假設是 Linux。

如果您沒有使用 將數據目錄安裝在伺服器上noatime,則可以使用find搜尋 365 天內未訪問的文件:

find /var/www/images -iname "*.jpg" -atime +365 -type f

如果您使用noatime,這將是不可能的(如果您使用relatime,則atime可能是 24 小時關閉)。

但是,這不是一個好方法,因為您的 HTML 文件中可能會出現死連結,並且有人會在 5 天后需要此資源…

更好的方法:解析您的網路樹,列出其中引用的所有文件(確保關閉您的網路伺服器自動索引…)並存檔其他所有內容。這樣,您可以確保 HTML 文件中列出的所有內容仍然可用。

請注意,您可能會在正常樹中找到未連結到人們通過直接連結訪問的孤立的 HMTL 文件孤島 - 在建構列表時考慮這些文件。當然,圖像文件可能也是如此,但您實際上只能通過日誌文件解析或find方法擷取那些文件。

引用自:https://serverfault.com/questions/728072