[1]张丽 黄东.基于Winnow算法的反垃圾邮件引擎的设计与实现[J].计算机技术与发展,2006,(04):170-172.
 ZHANG Li,HUANG Dong.Design and Implementation of One Prototype of Anti - Spam Engine Based on Winnow Algorithm[J].,2006,(04):170-172.
点击复制

基于Winnow算法的反垃圾邮件引擎的设计与实现()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2006年04期
页码:
170-172
栏目:
应用开发研究
出版日期:
1900-01-01

文章信息/Info

Title:
Design and Implementation of One Prototype of Anti - Spam Engine Based on Winnow Algorithm
文章编号:
1005-3751(2006)04-0170-03
作者:
张丽 黄东
东南大学自动控制系
Author(s):
ZHANG Li HUANG Dong
Automation and Control Department of Southeast University
关键词:
垃圾邮件文本分类特征选择特征提取Winnow算法反馈
Keywords:
sparetext categorization feature selectionfeature extractionWinnow algorithmfeedback
分类号:
TP393.098
文献标志码:
A
摘要:
电子邮件(e-mail)是人们日常生活中不可缺少的通信手段之一,但是垃圾邮件却给人们带来了很大的危害。文中主要是针对中文垃圾邮件,给出了一种基于Winnow算法的基于邮件内容的反垃圾邮件引擎原型的设计,对于未知邮件可以达到较好的区分效果。首先对邮件的内容进行解码、分词,采用信息增益选取特征项;然后采用Winnow算法构造分类器;最后采用部分邮件样本进行测试,测试结果可以进行反馈学习。最后的测试数据分析表明系统达到了比较好的效果
Abstract:
Email is one of indispensable communication ways in daily life, but spam has done serious harm to people. In this paper present the design of an anti - spare engine based on Winnow algorithm and focus on Chinese sparn,and the result of distinguishing from unknown mail is good. Firstly it decodes content of the mail, segments, and chooses terms with information gain. Then it constructs the classification. Finally it tests the result with partly maila, and the wrong will result in feedback study. The test data analysis shows that the system outcome is good

相似文献/References:

[1]田昕辉 李成基.带有短语切分的中文文本分类方法[J].计算机技术与发展,2010,(01):5.
 TIAN Xin-hui,LEE Sung-kee.Phrase Segmentation for Chinese Text Classification[J].,2010,(04):5.
[2]姜鹤 陈丽亚.SVM文本分类中一种新的特征提取方法[J].计算机技术与发展,2010,(03):17.
 JIANG He,CHEN Li-ya.A New Feature Selection Method in SVM Text Categorization[J].,2010,(04):17.
[3]周瑛 张铃.有限混合模型在文本分类中的应用研究[J].计算机技术与发展,2010,(06):18.
 ZHOU Ying,ZHANG Ling.Study of Application of Finite Mixture Model in Text Classification[J].,2010,(04):18.
[4]许幸 张启蕊.基于KNN算法的医药信息文本分类系统的研究[J].计算机技术与发展,2009,(04):206.
 XU Xing,ZHANG Qi-rui.Research of Medical Information Text Categorization Based on KNN Algorithm[J].,2009,(04):206.
[5]陈锦禾 范新 沈闻 沈洁.基于情感词识别的BBS情感分类研究[J].计算机技术与发展,2009,(07):120.
 CHEN Jin-he,FAN Xin,SHEN Wen,et al.Research on Sentiment Classification of BBS Reviews Based on Identifying Words with Polarity[J].,2009,(04):120.
[6]刘锋 唐佳 仲红.一种基于RBF神经网络的XML文本分类方法[J].计算机技术与发展,2009,(08):34.
 LIU Feng,TANG Jia,ZHONG Hong.A Text Categorization Method Based on RBF Neural Network[J].,2009,(04):34.
[7]鲁晓南 接标.一种基于个性化邮件特征的反垃圾邮件系统[J].计算机技术与发展,2009,(08):155.
 LU Xiao-nan,JIE Biao.An Individual Anti- Spam Technology[J].,2009,(04):155.
[8]晋幼丽 周明全 王学松.SVM和K-means结合的文本分类方法研究[J].计算机技术与发展,2009,(11):35.
 JIN You-li,ZHOU Ming-quan,WANG Xue-song.Research on Text Classification Method of SVM and K - means[J].,2009,(04):35.
[9]张燕平 徐庆鹏 苏守宝 邢猛.一种基于贪婪覆盖的文本分类方法[J].计算机技术与发展,2009,(01):74.
 ZHANG Yan-ping,XU Qing-peng,SU Shou-bao,et al.A Text Categorization Method Based on Greedy Cover[J].,2009,(04):74.
[10]陈素萍 谢丽聪.一种文本特征选择方法的研究[J].计算机技术与发展,2009,(02):112.
 CHEN Su-ping,XIE Li-cong.Research on Document Feature Selection[J].,2009,(04):112.
[11]顾辉 李翔 薛质 李建华.邻近类别分类在电子邮件过滤系统中的运用[J].计算机技术与发展,2008,(04):202.
 GU Hui,LI Xiang,XUE Zhi,et al.Vicinity Category Classification in Email Filtering System[J].,2008,(04):202.
[12]汤伟 程家兴 纪霞.一种基于概率推理的邮件过滤系统的研究与设计[J].计算机技术与发展,2008,(08):76.
 TANG Wei,CHENG Jia-xing,JI Xia.Research and Design of a Spam Filtering System Based on Probability Inference[J].,2008,(04):76.
[13]汤伟 程家兴 纪霞.统计学理论在邮件分类中的应用研究[J].计算机技术与发展,2008,(12):231.
 TANG Wei,CHENG Jia-xing,JI Xia.Research and Design of a Spam Filtering System Based on Statistical Learning Theory[J].,2008,(04):231.

备注/Memo

备注/Memo:
张丽(1980-).女,山东莱芜人,硕士研究生,研究方向为计算机信息控制;黄东,副教授,硕士生导师,研究方向为计算机信息控制、管理信息系统设计与开发
更新日期/Last Update: 1900-01-01