當郵件已經被交易所處理時,重新學習貝氏自動學習垃圾郵件
我正在使用帶有 amavis 和 spamassassin 的 postfix 在將所有內容中繼到交換伺服器之前過濾掉垃圾郵件。我經常收到沒有被 spamassassin 擷取的郵件,更糟糕的是,它們被自動學習為火腿。
所以我開始收集它們並以明文形式導出它們,並希望重新訓練這些郵件,將它們標記為垃圾郵件。
從我目前閱讀的內容來看,您不必指定任何要“重新”訓練郵件的內容。你應該只是執行
--spam
它應該忘記郵件作為火腿並將其訓練為垃圾郵件。但觀察
sa-learn --dump magic
表明,它保留了自動學習的火腿條目並將其添加到垃圾郵件中。我的想法是,Exchange 以某種方式編輯了郵件,以便在將其導出並放回後綴伺服器時,它與以前的郵件不同。會是這樣嗎?如果是這樣,有沒有辦法做我計劃做的事情,例如刪除一些標題?
當您重新了解 SpamAssassin 郵件應該是垃圾郵件時,它應該將郵件從普通郵件翻轉為垃圾郵件或將垃圾郵件翻轉為普通郵件。問題是 SpamAssassin 了解您中繼主機上的郵件,但是當它被轉發到您的 Exchange 伺服器時,由於添加了附加的 Received 行,因此標題發生了變化。您可以通過在 SpamAssassin 配置中添加以下內容來嘗試一下:
bayes_ignore_header Received
這將使 SpamAssassin 在使用貝氏過濾時忽略 Received 標頭。就我個人而言,我並不真正贊成這一點,因為它限制了您的貝氏過濾器所看到的內容以及我可以用來確定某些內容是火腿還是垃圾郵件。
關於開啟自動學習是您可能需要重新考慮的事情。在大多數情況下,它會污染您的數據庫,因為更多的垃圾郵件和垃圾郵件會被錯誤標記。如果您想使用最新的垃圾郵件和垃圾郵件訓練您的數據庫,明智的做法是設置一個垃圾郵件帳戶來接收可標記為垃圾郵件或垃圾郵件的可信賴郵件,並每隔 X 小時/分鐘學習一次。但這是一個更困難的設置,需要一些時間才能正常工作。