Awstats

awstats 表示移動到新伺服器後頁面失去

  • August 12, 2014

我將 Web 服務移至新伺服器。我發現,在舊伺服器中,以下給出的命中數大致相同awstats(例如,對於給定的一天,以下給出 5537,而awstats表示 5557 命中):

grep -v bot myaccess.log|     # file contains given vhost for given date range \
grep -v rss2email|\
grep -v Slurp|\
grep -v pider|                # Ignore spiders \
egrep 'HTTP/.... (200|304) '| # Catch only 200 and 304 responses \
grep -v Wget|\
grep -v Bot|\
grep -v rawler|               # Ignore crawlers \
grep -v favicon.ico|\
grep -v robots.txt|\
grep -v HTTrack|\
grep -v simplepie|\
grep -v BingPreview|\
wc -l

將以下內容添加到鏈的末尾會產生與(3042)grep大致相同的頁面數(例如,給定日期為 2916 ):awstats

egrep -v '(css)|(js)|(class)|(gif)|(jpg)|(jpeg)|(png)|(bmp)|(ico)|(swf) HTTP'

現在,我移動了伺服器。很多東西都變了:apache變成了nginx;日誌格式改變;配置awstats已被重寫;Debian 擠壓變得喘不過氣來,awstats6.9.5 變成了 7.0。

上面的大管道仍然awstats很好地接近 ’ 的命中(例如 5521 與 5541),但添加egrep排除NotPageList不:對於給定的一天,我得到 2948,而awstats給出 1580。(排除列表是否包含rss並且xml不顯著差異。)事實上,自從服務被移動之日起,點擊量大致保持不變,而頁面和訪問量大約減少了一半。我不知道為什麼。

主要區別似乎是awstats7.0 中的一個新功能:下載。它假定某些文件副檔名(pdfziptxtmp3docppt等)是“下載”。舊awstats版本認為這些是“頁面”。

我也理解每個新版本awstats都有一個更完整的過濾列表(例如更完整的 bot 列表),導致每個新版本報告的頁面更少(高估總是存在並且可能無法完全消除);但這一定會產生較小的影響。

引用自:https://serverfault.com/questions/617439