[1]汤伟 程家兴 纪霞.统计学理论在邮件分类中的应用研究[J].计算机技术与发展,2008,(12):231-234.
 TANG Wei,CHENG Jia-xing,JI Xia.Research and Design of a Spam Filtering System Based on Statistical Learning Theory[J].,2008,(12):231-234.
点击复制

统计学理论在邮件分类中的应用研究()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2008年12期
页码:
231-234
栏目:
应用开发研究
出版日期:
1900-01-01

文章信息/Info

Title:
Research and Design of a Spam Filtering System Based on Statistical Learning Theory
文章编号:
1673-629X(2008)12-0231-04
作者:
汤伟 程家兴 纪霞
安徽大学计算智能与信号处理教育部重点实验室
Author(s):
TANG Wei CHENG Jia-xingJI Xia
Ministry of Education Key Lab. of Intelligent Computing & Signal Processing, Anhui University
关键词:
机器学习文本分类垃圾邮件
Keywords:
machine learning text classification spare
分类号:
TP31
文献标志码:
A
摘要:
分类问题,尤其是文本自动分类一直是机器学习与数据挖掘研究中的研究热点与核心技术,其中如朴素贝叶斯、KNN等近年来得到了广泛的关注和快速的发展。文中在统计学理论的基础上给出了一种基于支持向量机方法的文本分类算法,并设计出了相应的垃圾邮件过滤系统。实验证明与朴素贝叶斯方法相比,该算法极大地提高了分类准确率和查全率,具有应用推广的价值
Abstract:
Classification is one of the most important research fields in data mining and machine learning. In recent years, there have been extensive studies and rapid progresses in automatic text categorization. Proposes a SVM text categorization on the basis of s

相似文献/References:

[1]田昕辉 李成基.带有短语切分的中文文本分类方法[J].计算机技术与发展,2010,(01):5.
 TIAN Xin-hui,LEE Sung-kee.Phrase Segmentation for Chinese Text Classification[J].,2010,(12):5.
[2]陈全 赵文辉 李洁 江雨燕.选择性集成学习算法的研究[J].计算机技术与发展,2010,(02):87.
 CHEN Quan,ZHAO Wen-hui,LI Jie,et al.Research of Selective Ensemble Learning Algorithm[J].,2010,(12):87.
[3]姜鹤 陈丽亚.SVM文本分类中一种新的特征提取方法[J].计算机技术与发展,2010,(03):17.
 JIANG He,CHEN Li-ya.A New Feature Selection Method in SVM Text Categorization[J].,2010,(12):17.
[4]周瑛 张铃.有限混合模型在文本分类中的应用研究[J].计算机技术与发展,2010,(06):18.
 ZHOU Ying,ZHANG Ling.Study of Application of Finite Mixture Model in Text Classification[J].,2010,(12):18.
[5]许幸 张启蕊.基于KNN算法的医药信息文本分类系统的研究[J].计算机技术与发展,2009,(04):206.
 XU Xing,ZHANG Qi-rui.Research of Medical Information Text Categorization Based on KNN Algorithm[J].,2009,(12):206.
[6]黄秀丽 王蔚.SVM在非平衡数据集中的应用[J].计算机技术与发展,2009,(06):190.
 HUANG Xiu-li,WANG Wei.Application of SVM in Imbalances Dataset[J].,2009,(12):190.
[7]陈锦禾 范新 沈闻 沈洁.基于情感词识别的BBS情感分类研究[J].计算机技术与发展,2009,(07):120.
 CHEN Jin-he,FAN Xin,SHEN Wen,et al.Research on Sentiment Classification of BBS Reviews Based on Identifying Words with Polarity[J].,2009,(12):120.
[8]刘锋 唐佳 仲红.一种基于RBF神经网络的XML文本分类方法[J].计算机技术与发展,2009,(08):34.
 LIU Feng,TANG Jia,ZHONG Hong.A Text Categorization Method Based on RBF Neural Network[J].,2009,(12):34.
[9]鲁晓南 接标.一种基于个性化邮件特征的反垃圾邮件系统[J].计算机技术与发展,2009,(08):155.
 LU Xiao-nan,JIE Biao.An Individual Anti- Spam Technology[J].,2009,(12):155.
[10]晋幼丽 周明全 王学松.SVM和K-means结合的文本分类方法研究[J].计算机技术与发展,2009,(11):35.
 JIN You-li,ZHOU Ming-quan,WANG Xue-song.Research on Text Classification Method of SVM and K - means[J].,2009,(12):35.
[11]张苗 张德贤.多类支持向量机文本分类方法[J].计算机技术与发展,2008,(03):139.
 ZHANG Miao,ZHANG De-xian.Research on Text Categorization Based on. M- SVMs[J].,2008,(12):139.
[12]汤伟 程家兴 纪霞.一种基于概率推理的邮件过滤系统的研究与设计[J].计算机技术与发展,2008,(08):76.
 TANG Wei,CHENG Jia-xing,JI Xia.Research and Design of a Spam Filtering System Based on Probability Inference[J].,2008,(12):76.
[13]于卫红.多类别文本分类方法比较研究[J].计算机技术与发展,2022,32(01):54.[doi:10. 3969 / j. issn. 1673-629X. 2022. 01. 010]
 YU Wei-hong.Study on Comparison of Multi-class Text Classification Methods[J].,2022,32(12):54.[doi:10. 3969 / j. issn. 1673-629X. 2022. 01. 010]
[14]黎洁仪,梁之彦,范绍佳,等.线上降雨灾情检测系统设计与应用[J].计算机技术与发展,2022,32(08):191.[doi:10. 3969 / j. issn. 1673-629X. 2022. 08. 031]
 LI Jie-yi,LIANG Zhi-yan,FAN Shao-jia,et al.Design and Application of Online Rainfall Disaster Detection System[J].,2022,32(12):191.[doi:10. 3969 / j. issn. 1673-629X. 2022. 08. 031]

备注/Memo

备注/Memo:
国家自然科学基金(60273043);安徽大学研究生创新基金(20073053)汤伟(1982-),男,安徽肥西人,硕士研究生,研究方向为机器学习、智能计算;程家兴,教授,博士生导师,研究方向为智能计算、算法分析及设计及最优化方法
更新日期/Last Update: 1900-01-01