[1]张培颖,王雷全.基于语义距离的文本分类方法[J].计算机技术与发展,2013,(01):128-130.
 ZHANG Peo-ying,WANG Lei-quan.Text Classification Method Based on Semantic Distance[J].,2013,(01):128-130.
点击复制

基于语义距离的文本分类方法()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2013年01期
页码:
128-130
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Text Classification Method Based on Semantic Distance
文章编号:
1673-629X(2013)01-0128-03
作者:
张培颖王雷全
中国石油大学华东 计算机与通信工程学院
Author(s):
ZHANG Peo-yingWANG Lei-quan
关键词:
文本分类语义距离特征选择特征向量
Keywords:
text classificationsemantic distancefeatures selectionfeature vector
文献标志码:
A
摘要:
文本分类是解决网络信息过载的关键技术之一.传统的文本分类方法大多只考虑文本中词语的统计词频等特征,忽略了文本的语义信息,导致文本分类精度不高.针对这种问题,提出了一种基于语义距离的文本分类方法,该方法首先根据 CHI 方法进行文本特征选择,然后利用语义距离计算代表类别的特征向量集合,最后通过计算文本特征向量和类别特征向量之间的语义距离来确定文本类别.实验结果表明,该方法与其他方法相比,把文本的语义信息考虑在内,在进行文本分类方面具有较高的准确率
Abstract:
Text classification is one of the key technologier solving network information overload. The traditional text classification meth-ods only consider mostly the statistical word frequency in the text,ignoring the text semantic information,leading to text classification ac-curacy is not high. Aiming to this problem,propose a text classification method based on semantic distance,this method first take the text feature selection according to CHI method,and then by using semantic distance calculate feature vector set on behalf of the category,final-ly through the calculation of the distance between text feature vector and category feature vector determine the text category. The experi-mental results show that this method,compared with the existing methods,take the semantic information of the text into consideration,has higher accuracy in the text classification

相似文献/References:

[1]田昕辉 李成基.带有短语切分的中文文本分类方法[J].计算机技术与发展,2010,(01):5.
 TIAN Xin-hui,LEE Sung-kee.Phrase Segmentation for Chinese Text Classification[J].,2010,(01):5.
[2]姜鹤 陈丽亚.SVM文本分类中一种新的特征提取方法[J].计算机技术与发展,2010,(03):17.
 JIANG He,CHEN Li-ya.A New Feature Selection Method in SVM Text Categorization[J].,2010,(01):17.
[3]周瑛 张铃.有限混合模型在文本分类中的应用研究[J].计算机技术与发展,2010,(06):18.
 ZHOU Ying,ZHANG Ling.Study of Application of Finite Mixture Model in Text Classification[J].,2010,(01):18.
[4]许幸 张启蕊.基于KNN算法的医药信息文本分类系统的研究[J].计算机技术与发展,2009,(04):206.
 XU Xing,ZHANG Qi-rui.Research of Medical Information Text Categorization Based on KNN Algorithm[J].,2009,(01):206.
[5]陈锦禾 范新 沈闻 沈洁.基于情感词识别的BBS情感分类研究[J].计算机技术与发展,2009,(07):120.
 CHEN Jin-he,FAN Xin,SHEN Wen,et al.Research on Sentiment Classification of BBS Reviews Based on Identifying Words with Polarity[J].,2009,(01):120.
[6]刘锋 唐佳 仲红.一种基于RBF神经网络的XML文本分类方法[J].计算机技术与发展,2009,(08):34.
 LIU Feng,TANG Jia,ZHONG Hong.A Text Categorization Method Based on RBF Neural Network[J].,2009,(01):34.
[7]晋幼丽 周明全 王学松.SVM和K-means结合的文本分类方法研究[J].计算机技术与发展,2009,(11):35.
 JIN You-li,ZHOU Ming-quan,WANG Xue-song.Research on Text Classification Method of SVM and K - means[J].,2009,(01):35.
[8]张燕平 徐庆鹏 苏守宝 邢猛.一种基于贪婪覆盖的文本分类方法[J].计算机技术与发展,2009,(01):74.
 ZHANG Yan-ping,XU Qing-peng,SU Shou-bao,et al.A Text Categorization Method Based on Greedy Cover[J].,2009,(01):74.
[9]陈素萍 谢丽聪.一种文本特征选择方法的研究[J].计算机技术与发展,2009,(02):112.
 CHEN Su-ping,XIE Li-cong.Research on Document Feature Selection[J].,2009,(01):112.
[10]于水英 丁华福 付志超.基于遗传算法和模糊聚类的文本分类研究[J].计算机技术与发展,2009,(04):131.
 YU Shui-ying,DING Hua-fu,FU Zhi-chao.Study on Text Categorization Based on Genetic Algorithm and Fuzzy Clustering[J].,2009,(01):131.

更新日期/Last Update: 1900-01-01