[1]姜鹤 陈丽亚.SVM文本分类中一种新的特征提取方法[J].计算机技术与发展,2010,(03):17-19.
 JIANG He,CHEN Li-ya.A New Feature Selection Method in SVM Text Categorization[J].,2010,(03):17-19.
点击复制

SVM文本分类中一种新的特征提取方法()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2010年03期
页码:
17-19
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
A New Feature Selection Method in SVM Text Categorization
文章编号:
1673-629X(2010)03-0017-03
作者:
姜鹤 陈丽亚
上海交通大学电子信息与电气工程学院
Author(s):
JIANG He CHEN Li-ya
School of Information and Communication Engineering, Shanghai Jiaotong University
关键词:
文本分类特征提取支持向量机资源受限
Keywords:
text categorization feature selectionsupport vector machine resource constraint
分类号:
TP181
文献标志码:
A
摘要:
随着互联网的迅速发展,面向重要网络媒体海量发布信息实现智能分类,对于网络信息监管、舆论引导工作有着深远的意义。文中针对在文本分类中的特征选取问题,描述了一种基于法矢量权重的特征评价和选取方法。将此方法与SVM学习算法进行结合,在路透社标准文本测试集上进行了对比评估。实验结果显示,此特征选取方法相对于传统的特征选取方法可以产生更优的分类性能。此特征提取方法提供一种有效的途径,在基本保持分类器性能的前提下显著地减少特征空间的维数,进而提升系统的资源利用效率。
Abstract:
With the rapid development of Intemet, it has momentous significance for the task of the surveillance and management of network and leading the public to carry out the intelligence classification of the massive amount of information that released by the i

相似文献/References:

[1]何小娜 逄焕利.基于二维直方图和改进蚁群聚类的图像分割[J].计算机技术与发展,2010,(03):128.
 HE Xiao-na,PANG Huan-li.Image Segmentation Based on Improved Ant Colony Clustering and Two- Dimensional Histogram[J].,2010,(03):128.
[2]罗林波 陈绮.氨基酸序列特征提取方法研究[J].计算机技术与发展,2010,(02):206.
 LUO Lin-bo,CHEN Qi.Research of Feature Extraction Methods of Amino Acid Sequence[J].,2010,(03):206.
[3]周瑛 张铃.有限混合模型在文本分类中的应用研究[J].计算机技术与发展,2010,(06):18.
 ZHOU Ying,ZHANG Ling.Study of Application of Finite Mixture Model in Text Classification[J].,2010,(03):18.
[4]许幸 张启蕊.基于KNN算法的医药信息文本分类系统的研究[J].计算机技术与发展,2009,(04):206.
 XU Xing,ZHANG Qi-rui.Research of Medical Information Text Categorization Based on KNN Algorithm[J].,2009,(03):206.
[5]毛雁明 兰美辉 王运琼 冯乔生.一种改进的基于Harris的角点检测方法[J].计算机技术与发展,2009,(05):130.
 MAO Yan-ming,LAN Mei-hui,WANG Yun-qiong,et al.An Improved Corner Detection Method Based on Harris[J].,2009,(03):130.
[6]陈锦禾 范新 沈闻 沈洁.基于情感词识别的BBS情感分类研究[J].计算机技术与发展,2009,(07):120.
 CHEN Jin-he,FAN Xin,SHEN Wen,et al.Research on Sentiment Classification of BBS Reviews Based on Identifying Words with Polarity[J].,2009,(03):120.
[7]刘锋 唐佳 仲红.一种基于RBF神经网络的XML文本分类方法[J].计算机技术与发展,2009,(08):34.
 LIU Feng,TANG Jia,ZHONG Hong.A Text Categorization Method Based on RBF Neural Network[J].,2009,(03):34.
[8]赵辉 张鹏.网络异常的主动检测与特征分析[J].计算机技术与发展,2009,(08):159.
 ZHAO Hui,ZHANG Peng.Active Detection and Feature Analysis About Network Anomaly[J].,2009,(03):159.
[9]晋幼丽 周明全 王学松.SVM和K-means结合的文本分类方法研究[J].计算机技术与发展,2009,(11):35.
 JIN You-li,ZHOU Ming-quan,WANG Xue-song.Research on Text Classification Method of SVM and K - means[J].,2009,(03):35.
[10]张燕平 徐庆鹏 苏守宝 邢猛.一种基于贪婪覆盖的文本分类方法[J].计算机技术与发展,2009,(01):74.
 ZHANG Yan-ping,XU Qing-peng,SU Shou-bao,et al.A Text Categorization Method Based on Greedy Cover[J].,2009,(03):74.
[11]田昕辉 李成基.带有短语切分的中文文本分类方法[J].计算机技术与发展,2010,(01):5.
 TIAN Xin-hui,LEE Sung-kee.Phrase Segmentation for Chinese Text Classification[J].,2010,(03):5.
[12]张丽 黄东.基于Winnow算法的反垃圾邮件引擎的设计与实现[J].计算机技术与发展,2006,(04):170.
 ZHANG Li,HUANG Dong.Design and Implementation of One Prototype of Anti - Spam Engine Based on Winnow Algorithm[J].,2006,(03):170.

备注/Memo

备注/Memo:
上海科委项目(08511501902);国家自然科学基金项目(60672068)姜鹤(1985-),女,陕西西安人,硕士研究生,研究方向为网络内容安全;陈丽亚,副教授,研究方向为网络内容安全。
更新日期/Last Update: 1900-01-01