[1]陈素萍 谢丽聪.一种文本特征选择方法的研究[J].计算机技术与发展,2009,(02):112-115.
 CHEN Su-ping,XIE Li-cong.Research on Document Feature Selection[J].,2009,(02):112-115.
点击复制

一种文本特征选择方法的研究()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2009年02期
页码:
112-115
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Research on Document Feature Selection
文章编号:
1673-629X(2009)02-0112-04
作者:
陈素萍12 谢丽聪1
[1]福州大学数学与计算机科学学院[2]福建师范大学协和学院
Author(s):
CHEN Su-ping12 XIE Li-cong1
[1]College of Mathematics and Computer Science, Fuzhou University[2]Concord University College, Fujian Normal University
关键词:
文本特征文本分类特征选择
Keywords:
document feature text classification feature selection
分类号:
TP311
文献标志码:
A
摘要:
在文本分类中,对高维的特征集进行降维是非常重要的,不但可以提高分类精度和效率,也可以找出富含信息的特征子集。而特征选择是有效降低特征向量维数的一种方法。目前常用的一些特征选择算法仅仅考虑了特征词与类别间的相关性,而忽略了特征词与特征词之间的相关性,从而存在特征冗余,影响了分类效果。为此,在分析了常用的一些特征选择算法之后,提出了一种基于mRMR模型的特征选择方法。实验表明,该特征选择方法有助于提高分类性能。
Abstract:
In text classification, it is very important to reduce the high- dimension of the feature vectors. It not only can improve the accuracy and effieieney of classification,but also can discover imformative feature subset. Feature seleetion is a valid method

相似文献/References:

[1]田昕辉 李成基.带有短语切分的中文文本分类方法[J].计算机技术与发展,2010,(01):5.
 TIAN Xin-hui,LEE Sung-kee.Phrase Segmentation for Chinese Text Classification[J].,2010,(02):5.
[2]姜鹤 陈丽亚.SVM文本分类中一种新的特征提取方法[J].计算机技术与发展,2010,(03):17.
 JIANG He,CHEN Li-ya.A New Feature Selection Method in SVM Text Categorization[J].,2010,(02):17.
[3]周瑛 张铃.有限混合模型在文本分类中的应用研究[J].计算机技术与发展,2010,(06):18.
 ZHOU Ying,ZHANG Ling.Study of Application of Finite Mixture Model in Text Classification[J].,2010,(02):18.
[4]许幸 张启蕊.基于KNN算法的医药信息文本分类系统的研究[J].计算机技术与发展,2009,(04):206.
 XU Xing,ZHANG Qi-rui.Research of Medical Information Text Categorization Based on KNN Algorithm[J].,2009,(02):206.
[5]陈锦禾 范新 沈闻 沈洁.基于情感词识别的BBS情感分类研究[J].计算机技术与发展,2009,(07):120.
 CHEN Jin-he,FAN Xin,SHEN Wen,et al.Research on Sentiment Classification of BBS Reviews Based on Identifying Words with Polarity[J].,2009,(02):120.
[6]刘锋 唐佳 仲红.一种基于RBF神经网络的XML文本分类方法[J].计算机技术与发展,2009,(08):34.
 LIU Feng,TANG Jia,ZHONG Hong.A Text Categorization Method Based on RBF Neural Network[J].,2009,(02):34.
[7]晋幼丽 周明全 王学松.SVM和K-means结合的文本分类方法研究[J].计算机技术与发展,2009,(11):35.
 JIN You-li,ZHOU Ming-quan,WANG Xue-song.Research on Text Classification Method of SVM and K - means[J].,2009,(02):35.
[8]张燕平 徐庆鹏 苏守宝 邢猛.一种基于贪婪覆盖的文本分类方法[J].计算机技术与发展,2009,(01):74.
 ZHANG Yan-ping,XU Qing-peng,SU Shou-bao,et al.A Text Categorization Method Based on Greedy Cover[J].,2009,(02):74.
[9]于水英 丁华福 付志超.基于遗传算法和模糊聚类的文本分类研究[J].计算机技术与发展,2009,(04):131.
 YU Shui-ying,DING Hua-fu,FU Zhi-chao.Study on Text Categorization Based on Genetic Algorithm and Fuzzy Clustering[J].,2009,(02):131.
[10]张苗 张德贤.多类支持向量机文本分类方法[J].计算机技术与发展,2008,(03):139.
 ZHANG Miao,ZHANG De-xian.Research on Text Categorization Based on. M- SVMs[J].,2008,(02):139.

备注/Memo

备注/Memo:
福建省B类科技发展基金(JB06023);中科院软件所开放课题基金(SYSKF701);福州大学科技发展基金(2005-XQ-13,XRC-0511)陈素萍(1983-),女,福建福州人,硕士研究生,研究方向为特征选取、文本挖掘;谢丽聪,副教授,研究方向为数据挖掘、数据集成。
更新日期/Last Update: 1900-01-01