[1]张燕平 徐庆鹏 苏守宝 邢猛.一种基于贪婪覆盖的文本分类方法[J].计算机技术与发展,2009,(01):74-76.
 ZHANG Yan-ping,XU Qing-peng,SU Shou-bao,et al.A Text Categorization Method Based on Greedy Cover[J].,2009,(01):74-76.
点击复制

一种基于贪婪覆盖的文本分类方法()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2009年01期
页码:
74-76
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
A Text Categorization Method Based on Greedy Cover
文章编号:
1673-629X(2009)01-0074-03
作者:
张燕平 徐庆鹏 苏守宝 邢猛
安徽大学计算智能与信号处理教育部重点实验室
Author(s):
ZHANG Yan-ping XU Qing-peng SU Shou-bao XING Meng
Ministry of Education Key Lab. of Intelligent Computing & Signal Processing, Anhui University
关键词:
文本分类CHI统计量TF—IDF-ICSD贪婪覆盖算法
Keywords:
text classificationCHI statistieTF- IDF- ICSDgreedy cover algorithm
分类号:
TP311.5
文献标志码:
A
摘要:
文本分类是信息检索和数据挖掘中的重要主题之一。文中提出了一种基于贪婪覆盖算法的文本分类方法,首先对文本进行分词,分词的结果用CHI统计量的方法提取特征,使用TF—IDF-ICSD进行特征权重计算。对贪婪覆盖算法采用另一种选取初始点的方法来构建分类器,用复旦大学语料库作为测试数据集,并与BP算法相比较。实验结果表明文本提出的方法是有效的。
Abstract:
Text classification is one of the key topics in information retrieval and data mining. A new text categorization technique based on greedy cover algorithm (GCA) was presented in this paper. The method can be conducted as following, text segmentation, feat

相似文献/References:

[1]田昕辉 李成基.带有短语切分的中文文本分类方法[J].计算机技术与发展,2010,(01):5.
 TIAN Xin-hui,LEE Sung-kee.Phrase Segmentation for Chinese Text Classification[J].,2010,(01):5.
[2]姜鹤 陈丽亚.SVM文本分类中一种新的特征提取方法[J].计算机技术与发展,2010,(03):17.
 JIANG He,CHEN Li-ya.A New Feature Selection Method in SVM Text Categorization[J].,2010,(01):17.
[3]周瑛 张铃.有限混合模型在文本分类中的应用研究[J].计算机技术与发展,2010,(06):18.
 ZHOU Ying,ZHANG Ling.Study of Application of Finite Mixture Model in Text Classification[J].,2010,(01):18.
[4]许幸 张启蕊.基于KNN算法的医药信息文本分类系统的研究[J].计算机技术与发展,2009,(04):206.
 XU Xing,ZHANG Qi-rui.Research of Medical Information Text Categorization Based on KNN Algorithm[J].,2009,(01):206.
[5]陈锦禾 范新 沈闻 沈洁.基于情感词识别的BBS情感分类研究[J].计算机技术与发展,2009,(07):120.
 CHEN Jin-he,FAN Xin,SHEN Wen,et al.Research on Sentiment Classification of BBS Reviews Based on Identifying Words with Polarity[J].,2009,(01):120.
[6]晋幼丽 周明全 王学松.SVM和K-means结合的文本分类方法研究[J].计算机技术与发展,2009,(11):35.
 JIN You-li,ZHOU Ming-quan,WANG Xue-song.Research on Text Classification Method of SVM and K - means[J].,2009,(01):35.
[7]陈素萍 谢丽聪.一种文本特征选择方法的研究[J].计算机技术与发展,2009,(02):112.
 CHEN Su-ping,XIE Li-cong.Research on Document Feature Selection[J].,2009,(01):112.
[8]于水英 丁华福 付志超.基于遗传算法和模糊聚类的文本分类研究[J].计算机技术与发展,2009,(04):131.
 YU Shui-ying,DING Hua-fu,FU Zhi-chao.Study on Text Categorization Based on Genetic Algorithm and Fuzzy Clustering[J].,2009,(01):131.
[9]张苗 张德贤.多类支持向量机文本分类方法[J].计算机技术与发展,2008,(03):139.
 ZHANG Miao,ZHANG De-xian.Research on Text Categorization Based on. M- SVMs[J].,2008,(01):139.
[10]顾辉 李翔 薛质 李建华.邻近类别分类在电子邮件过滤系统中的运用[J].计算机技术与发展,2008,(04):202.
 GU Hui,LI Xiang,XUE Zhi,et al.Vicinity Category Classification in Email Filtering System[J].,2008,(01):202.
[11]刘锋 唐佳 仲红.一种基于RBF神经网络的XML文本分类方法[J].计算机技术与发展,2009,(08):34.
 LIU Feng,TANG Jia,ZHONG Hong.A Text Categorization Method Based on RBF Neural Network[J].,2009,(01):34.

备注/Memo

备注/Memo:
国家重点基础研究973计划资助项目(2004CB318108,2007CB311003);国家自然科学基金资助项目(60675031)张燕平(1962-),女,教授,硕士生导师,研究方向为人工神经网络、机器学习及应用;苏守泉,博士,副教授.研究方向为群智能与模式识别。
更新日期/Last Update: 1900-01-01