Firewall

僅針對某些使用者的網站故障診斷

  • April 1, 2011

我在 VDS 上執行一個正常的 Apache + mod_wsgi + nginx 網站,遇到了一個奇怪的問題。該網站在我的電腦和我們經理的電腦(使用不同的網際網路提供商)上都可以正常工作。但是,我們的一些網站使用者向經理報告,他們無法在瀏覽器中打開它,很長一段時間,而同時它在我的電腦和經理的電腦上工作。

問題是:我應該如何進行診斷(如果這個錯誤甚至是我的錯)以及如果我不可能(即使我想)去有問題的使用者並從那裡進行診斷,我應該尋找什麼錯誤他們的電腦?

更新:謝謝大家的支持!我將通過我們的經理聯繫有缺陷的客戶,與他們一起進行建議的線上測試,然後在必要時提供其他資訊。

更新#2:我設法聯繫了一個有問題的客戶並使用wireshark進行了診斷。事實證明,這個問題是由 Firehol 中臭名昭著的 get-iana.sh 腳本中的一個錯誤引起的。結果,某個 IP 地址範圍被錯誤地標識為 RESERVED。一切正常……直到我們的本地 ISP 開始將這些 IP 地址用於他們的動態 IP 池,並且一些網站使用者被鎖定。作為後果,我似乎一開始就不應該使用 Firehol,因為它不再維護,也不支持 IPv6。再次感謝大家的回答。

我想我會按以下順序檢查:

  1. 確保失敗的使用者確實使用wireshark 或tcpdump 訪問了Web 伺服器。(我敢打賭他們沒有,你可以希望責怪別人:)
  2. 檢查伺服器中的負載峰值或其他奇怪的阻塞,例如在使用者失敗時執行“find / -type f”之類的操作。如果有的話,也許解除安裝任何 NFS 卷。
  3. 通過打開往返時間的日誌記錄(在 Apache 中,這將是 LogFormat %D)或使用 wireshark 來查看伺服器或瀏覽器中是否消耗了時間,來測量 Web 伺服器中的往返。
  4. 在故障機器上的 Firefox 中安裝 Firebug 並查看其網路流量圖以了解需要很長時間的情況(這當然是假設前面的步驟表明瀏覽器實際上與伺服器通信)。

編輯:即使您無法訪問出現故障的瀏覽器的站點,也許有遠端桌面或遠端協助可以幫助您?

引用自:https://serverfault.com/questions/254021