Web-Server
我應該如何將 404 網路流量的影響降到最低?
最近,我工作的一個網站開始看到一些奇怪的 URL 流量,這些流量不存在而且從來沒有。
像這樣的頁面:
- /imprss/123go.php
- /imprss/24cpv.php
- /bnnrs1002/728x90/4b4254ab5edd4.html
- /bnnrs1002/728x90/4b4254ab5f59e.html
- /bnnrs1002/728x90/4b4254ab5e1f8.html
事實上,到目前為止,有超過 300 個不同的 URL……其中沒有一個與網站上曾經出現過的任何東西相似。
所以很自然地,所有這些都被重定向到我們的 404 頁面,這恰好是我們站點地圖的修改版本。問題是我們每天都會看到數千個這樣的 404,而且恐怕這個數字還會增長。更重要的是,我查看了伺服器日誌,並沒有為所有這些流量找到任何公共 IP 地址。
所以我的第一個想法是修剪和簡化404頁面。這是最小化伺服器負載和減少頻寬的第一步。
我也確信這些流量要麼來自機器人、某種惡意軟體,要麼來自完全不感興趣的使用者,因為我已經使用我們使用的幾個工具跟踪了這些會話,但他們在點擊 404 頁面後從未真正使用過該網站。
那麼我還能做些什麼來更好地檢測這些流量模式呢?如果我能深入了解這將是很好的。
通常會看到這種“探測”,其中有人猜測特定目錄是否存在。這是一種分析,其中某些頁面的存在表明伺服器上安裝了某些軟體,或者伺服器上可能存在某些使用者名,並且可能是其他類型黑客攻擊的前兆。
我經營著許多網站,幾乎每天都會看到這種探索。
它們來自不同的 IP 地址這一事實可能表明探測是通過殭屍網路進行的 - 特別是如果跨不同 IP 地址的探測似乎存在模式。
您無能為力。但是,您絕對可以通過提供一個非常簡單的 404 頁面來最大限度地減少對系統的影響。這也可能是一個提醒,以確保您的所有軟體都已修補和最新,並且您在任何面向 Internet 的伺服器上都有強密碼。