Coremail XT Anti-spam GT 技術白皮書
,本文檔是COREMAIL 的系列技術文檔之一。未經許可,任何公司和個人不得將此文檔公開、轉載或以其他方式散發(fā),否則必將追究其法律責任。? 聯系方式網址:http://w



本文檔是COREMAIL 的系列技術文檔之一。未經許可,任何公司和個人不得將此文檔公開、轉載或以其他方式散發(fā),否則必將追究其法律責任。
? 聯系方式
網址:http://www.mailtech.cn
廣州
地址:廣州市中山大道科韻路16號廣州信息港網易大廈3樓
聯系電話: 86(20)85106566
? 北京
地址:北京市西城區(qū)西外大街1號院西環(huán)廣場T3座7層B7-B8 郵編:100044 聯系電話: 86(10)58301930
? 上海
地址:上海市靜安區(qū)長樂路672弄33號B 幢3樓
聯系電話: 86(21)61103951
? 成都
地址:成都市高新區(qū)永豐路47號玉林商務港5樓518室 郵編:610041 聯系電話: 86(28)66252331
? 版本信息
軟件版本:GT 104 文檔版本:1.0 發(fā)布日期:2009年10月 傳真: 86(28)66252332 郵編:200040 傳真: 86(21)61107756 傳真: 86(10)58302888 傳真: 86(20)85106595 郵編:510665
,

盈世信息科技(北京)有限公司
目錄
1
2 產品功能概述............................................................................................................ 1 Anti-spam GT反垃圾效果 ........................................................................................ 2
? 高過濾率低誤判率.............................................................................................. 2
? 適應郵件系統(tǒng)運營商大規(guī)模運行......................................................................... 4
3 Anti-spam GT智能管理 . ........................................................................................... 5
? 采用過濾規(guī)則數據庫,智能化管理 ..................................................................... 6
? 郵件日志跟蹤..................................................................................................... 6
? 智能統(tǒng)計,提升工作效率 ................................................................................... 7
? 實時更新過濾信息庫(Live Update) ................................................................ 9
4 Anti-spam GT反垃圾技術 ...................................................................................... 10
? 質詢-響應機制 ................................................................................................. 10
? 自動白名單 ...................................................................................................... 10
? Spam URL Realtime BlackList . ........................................................................... 10
? 郵件評分技術................................................................................................... 10
? Bayes 算法 ........................................................................................................11
? IP 聲譽評估系統(tǒng)................................................................................................11
? 指紋算法(Fingerprinting ) ..............................................................................11
? 靈活的反垃圾郵件策略設計.............................................................................. 12
? 流技術+多線程+優(yōu)化網絡訪問架構................................................................ 12 5
附錄........................................................................................................................ 13 ? 系統(tǒng)運行環(huán)境說明............................................................................................ 13
I 共 16 頁
,

盈世信息科技(北京)有限公司
1 產品功能概述
電子郵件是最常用的網絡應用之一,已經成為人們信息化交流的重要途徑。由于網絡的開放性,垃圾郵件也給許多人帶來了不少的煩惱。據近來的最新研究統(tǒng)計,有超過94的網民對收到大量垃圾郵件而不滿,垃圾郵件的危害不僅表現在內容的上,而且浪費了大量的郵件下載時間、占據了帶寬,還嚴重影響了企業(yè)正常的業(yè)務應用,影響了電子郵件服務供應商的服務質量。
據中國互聯網協會反垃圾郵件中心最新發(fā)布的2008年第一季度反垃圾郵件狀況調查報告中調查顯示,有高達93.83的企業(yè)用戶都收到過垃圾郵件,只有6.17的用戶表示沒有收到過垃圾郵件。而中國網民每周收到垃圾郵件的比例為高達56.70。
面對來勢洶洶的垃圾郵件,用戶最期待的目的就是能夠有效地解決垃圾郵件,以提高在工作中的效率。Anti-spam GT 為用戶提供目前市場上技術最為成熟的反垃圾郵件功能,力求解決郵件系統(tǒng)面對的垃圾郵件問題。
Anti-spam GT 使用多項反垃圾郵件的新技術,包括智能生成垃圾郵件規(guī)則、自動定期更新、實時郵件指紋檢查、自動過濾 人工控制的雙層機制、探針郵箱等。經過多層次優(yōu)化,提升系統(tǒng)的垃圾郵件處理性能。
嚴格的實際運行測試數據表明:Anti-spam GT 除了擁有世界級的智能化管理外,對于垃圾郵件的判斷與過濾擁有更高的正確率和更低的誤判率,獲得更快的郵件處理速度。
1 共 16 頁




盈世信息科技(北京)有限公司
2 Anti-spam GT反垃圾效果
Anti-spam GT 垃圾郵件過濾系統(tǒng)提供了詳盡的過濾規(guī)則,包括IP 過濾、信頭過濾、信體內容過濾三大類,最有效地覆蓋了識別垃圾郵件所需的全體特征。
高過濾率低誤判率
經過統(tǒng)計,使用Anti-spam GT 垃圾郵件處理系統(tǒng)的多個客戶系統(tǒng)(包括大型免費電子郵件運營商、企業(yè)郵件系統(tǒng)應用等),合理配置的Anti-spam GT可以達到非常高的垃圾郵件正確識別率,并且將正常郵件判斷為垃圾郵件的誤判比率也很低。
【注意】下面給出的數據截取自Coremail 的兩個客戶,他們在實際運行Anti-spam GT 中曾經獲得這些數據,但對于不同的客戶情況及不同的運行環(huán)境,該類數據會有一定差別。
在沒有使用任何防垃圾郵件系統(tǒng)時,客戶系統(tǒng)的電子郵件用戶必須從大量垃圾郵件中查找有用的信件,系統(tǒng)接收的垃圾郵件比率非常高。下圖是我們客戶甲的匯總統(tǒng)計圖表。從統(tǒng)計圖表我們可以看到,應用Anti-spam GT 防垃圾郵件系統(tǒng)后,該客戶過濾了97.8%的垃圾郵件,大大減少了用戶處理垃圾郵件的時間。
2 共 16 頁
,

盈世信息科技(北京)有限公司
客戶甲 - 郵件過濾匯總統(tǒng)計
從圖表我們可以清楚地看到,僅僅在2008年5月一個月內,該客戶的Anti-spam GT系統(tǒng)接收到總郵件總數為5,546,866封,其中正常郵件數為122,472封,僅占系統(tǒng)處理郵件總數的2.2,而垃圾郵件卻多達5,424,392封,占系統(tǒng)接收郵件總數97.8。圖表表明,如果沒有采用Anti-spam GT 反垃圾過濾處理系統(tǒng),用戶平均每天需要在100封電子郵件里面才能查找到2封真正有價值的電子郵件!
3 共 16 頁



盈世信息科技(北京)有限公司
客戶乙 - 郵件過濾匯總統(tǒng)計
上圖是我們另一個客戶乙的匯總統(tǒng)計圖表:在2008年7月整一個月的時間里,該客戶的Anti-spam GT 系統(tǒng)處理的總郵件數為3,342,322封,正常郵件有58,874封,占系統(tǒng)處理信件的1.8,而垃圾郵件達到3,283,448封,占系統(tǒng)總郵件數的98.2。這些數據表明,Anti-spam GT 系統(tǒng)使該電子郵件系統(tǒng)的用戶從大量垃圾郵件中解脫出來,每天減少至少95%的郵件處理時間。
配合系統(tǒng)為終端用戶提供的個性化設置方案,終端用戶還可以選擇垃圾郵件的處理策略,如直接刪除或者轉發(fā)到指定郵箱等。Anti-spam GT 的出色表現,極大地減輕了電子郵件用戶每天用于處理垃圾郵件的時間,用戶的使用滿意度遠遠超越同類郵件系統(tǒng)產品。 適應郵件系統(tǒng)運營商大規(guī)模運行
經過Coremail 客戶實際運行的結果表明,Anti-spam GT可以準確判斷各類型垃圾郵件,甚至在兩天內為我們的客戶甲成功處理了1,109,115封郵件,并以94.3的高處理效果過濾 4 共 16 頁



盈世信息科技(北京)有限公司
了1,045,351封垃圾郵件。
源于研發(fā)中心在超大規(guī)模郵件系統(tǒng)應用的豐富經驗,Anti-spam GT 在系統(tǒng)架構實現上采用了多項設計,包括多進程/多線程、流程優(yōu)化、多級緩存Cache 等,使得系統(tǒng)在超大規(guī)模郵件系統(tǒng)應用上依然表現優(yōu)異。
下圖為系統(tǒng)詳細統(tǒng)計的曲線圖,顯示某客戶在一天內(以小時為單位)郵件系統(tǒng)所處理的正常郵件數、垃圾郵件總數。該圖可以看出Anti-spam GT 在郵件系統(tǒng)每個小時處理的電子郵件達到超過50,000封以上時仍然運行穩(wěn)定。
普通統(tǒng)計曲線圖
某客戶郵件過濾的統(tǒng)計曲線
3 Anti-spam GT智能管理
Anti-spam GT 改變傳統(tǒng)的規(guī)則設置方式,將自動化管理的理念帶入反垃圾郵件系統(tǒng),改變了傳統(tǒng)的依靠管理員手工輸入過濾規(guī)則的方法。通過客戶系統(tǒng)管理人員的反饋結果表明,Anti-spam GT 的系統(tǒng)管理十分簡便,極大地節(jié)省了郵件系統(tǒng)在系統(tǒng)管理方面的人力資源開銷。
郵件過濾統(tǒng)計對Anti-spam GT 的各項運行數據進行統(tǒng)計。通過查看統(tǒng)計數據,不但可以了解系統(tǒng)的運作狀態(tài),還可以為系統(tǒng)管理員更新系統(tǒng)設置、調整過濾規(guī)則等提供重要的信息,從而提高系統(tǒng)的運行的效率。同時,通過系統(tǒng)提供的郵件處理日志管理,管理員可以回溯查找到具體的郵件處理過程,從而準確地判斷郵件無法接收或者投遞的原因。

5 共 16 頁
,

盈世信息科技(北京)有限公司
? 采用過濾規(guī)則數據庫,智能化管理
Anti-spam GT對郵件采用發(fā)信IP 、郵件格式、郵件內容三個部分進行判分處理,從而生成系統(tǒng)的過濾規(guī)則。同時由技術人員采用自行設計的陷阱郵箱,對采樣所得到超大批量的郵件數據通過研究分析,保證系統(tǒng)生成的規(guī)則具有普遍適用性。應用規(guī)則數據庫過濾郵件,可達到判斷垃圾郵件正確率高而誤判率低的處理效果,從根本上解決如洪水般涌入的垃圾郵件。


? 郵件日志跟蹤
系統(tǒng)保留垃圾郵件過濾的處理信息,即系統(tǒng)的日志。郵件日志跟蹤的時候可以點擊進去看更詳細的投遞信息。管理員可以根據系統(tǒng)的日志信息,回溯查找到具體的郵件處理過程,從而準確地判斷郵件無法接收或者投遞的原因。
6 共 16 頁
,

盈世信息科技(北京)有限公司
智能統(tǒng)計,提升工作效率
匯總統(tǒng)計
系統(tǒng)管理員需要統(tǒng)計某一個時間段內的郵件過濾情況,需要在查詢面板中按提示輸入開始日期以及結束日期,查看該時間段內系統(tǒng)處理的垃圾郵件比率,統(tǒng)計結果以清晰直觀的圖表顯示如下圖。

統(tǒng)計報表
統(tǒng)計報表頁面功能以小時為單位顯示系統(tǒng)的郵件過濾情況。每個圖表頁面配備相應的報表生成功能,管理員可以直接將統(tǒng)計結果輸出。

域郵件接受情況統(tǒng)計
域統(tǒng)計是Anti-spam GT 按系統(tǒng)接收或者發(fā)送的郵件所屬的域名進行分類統(tǒng)計,可以分 7 共 16 頁