[1]林伟 柳荣其 徐熙.邮件过滤中一种改进的特征选择方法研究[J].计算机技术与发展,2009,(01):84-87.
 LIN Wei,LIU Rong-qi,XU Xi.Improvement of Feature Selection Algorithm in Spam Filtering[J].,2009,(01):84-87.
点击复制

邮件过滤中一种改进的特征选择方法研究()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2009年01期
页码:
84-87
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Improvement of Feature Selection Algorithm in Spam Filtering
文章编号:
1673-629X(2009)01-0084-04
作者:
林伟 柳荣其 徐熙
西华大学数学与计算机学院
Author(s):
LIN Wei LIU Rong-qi XU Xi
School of Mathematics & Computer Science, Xihua University
关键词:
邮件过滤特征选择信息增益CHI统计聚类
Keywords:
spain filtering feature selection information gain CHI static cluster
分类号:
TP18
文献标志码:
A
摘要:
特征选择是基于内容的垃圾邮件过滤的重要过程,它有效地改善过滤效率和精度。文中分析了IG和CHI应用到垃圾邮件过滤中存在的不足,设计了一种改进的评价函数。而由于这种评价函数的特征选择方法只度量了特征与类的关系,忽略了特征之间依赖的关系,因此进一步用基于互信息的聚类方法来消除特征间冗余。实验结果表明该特征选择方法有效地提高了邮件过滤的性能。
Abstract:
Feature selection which is a very important process for content- based spam filtering. It is very efficient to improve the efficiency and precision of filtration. In this paper analyzed and improved disadvantage of IG and CHI which is applied to spam filt

相似文献/References:

[1]刘利 何先平 袁文亮.股票趋势预测中Wrapper方法的研究与应用[J].计算机技术与发展,2010,(01):209.
 LIU Li,HE Xian-ping,YUAN Wen-liang.Research and Application of Wrapper Approach to Stock Trend Prediction[J].,2010,(01):209.
[2]黄炜 黄志华.一种基于遗传算法和SVM的特征选择[J].计算机技术与发展,2010,(06):21.
 HUANG Wei,HUANG Zhi-hua.Feature Selection Based on Genetic Algorithm and SVM[J].,2010,(01):21.
[3]张家柏 王小玲.基于聚类和二进制PSO的特征选择[J].计算机技术与发展,2010,(06):25.
 ZHANG Jia-bai,WANG Xiao-ling.A Novel Algorithm Based on K-Means Clustering and Binary Particle Swarm Optimization[J].,2010,(01):25.
[4]冯甲策 叶明 王惠文.基于Gram—Schmidt过程的支持向量机降维方法[J].计算机技术与发展,2009,(11):7.
 FENG Jia-ce,YE Ming,WANG Hui-wen.Dimension Reduction Method of Support Vector Machine Based on Gram- Schmidt Process[J].,2009,(01):7.
[5]刘毅 张月琳.基于Agent的邮件过滤与个性化分类系统设计[J].计算机技术与发展,2009,(02):66.
 LIU Yi,ZHANG Yue-lin.Design of a Mail Filter and Personalized Classification System Based on Agent[J].,2009,(01):66.
[6]陈素萍 谢丽聪.一种文本特征选择方法的研究[J].计算机技术与发展,2009,(02):112.
 CHEN Su-ping,XIE Li-cong.Research on Document Feature Selection[J].,2009,(01):112.
[7]段震 王倩倩 张燕平 张铃.覆盖算法下文本分类特征选择的研究[J].计算机技术与发展,2008,(11):29.
 DUAN Zhen,WANG Qian-qian,ZHANG Yan-ping,et al.Study on Feature Selection of Text Classification in Cross Cover Algorithm[J].,2008,(01):29.
[8]王希雷.基于Rough集理论的车牌汉字特征提取[J].计算机技术与发展,2007,(06):26.
 WANG Xi-lei.Car Plate Chinese Character Feature Extraction Based on Rough Set Theory[J].,2007,(01):26.
[9]董梅 胡学钢.基于多特征选择的中文文本分类[J].计算机技术与发展,2007,(07):117.
 DONG Mei,HU Xue-gang.Text Categorization Based on Multiple Features Selection[J].,2007,(01):117.
[10]万忠 张燕平 张铃 陈洁 张晨希 张迎春.基于覆盖算法决策界的特征选择算法[J].计算机技术与发展,2006,(04):84.
 WAN Zhong,ZHANG Yan-ping,ZHANG Ling,et al.Feature Selection Algorithm Based on Decision Boundary of Covering Algorithm[J].,2006,(01):84.

备注/Memo

备注/Memo:
四川省青年软件创新工程基金(2007AA42);西华大学科技创新基金(07226161)林伟(1983-),男,硕士研究生,研究方向为数据挖掘与机器学习;柳荣其,副教授,硕士生导师,研究方向为计算机网络与大型数据库。
更新日期/Last Update: 1900-01-01