[1]李琼,陈利. 一种改进的支持向量机文本分类方法[J].计算机技术与发展,2015,25(05):78-82.
 LI Qiong CHEN Li. An Improved Text Classification Method for Support Vector Machine[J].,2015,25(05):78-82.
点击复制

 一种改进的支持向量机文本分类方法()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
25
期数:
2015年05期
页码:
78-82
栏目:
智能、算法、系统工程
出版日期:
2015-05-10

文章信息/Info

Title:
 An Improved Text Classification Method for Support Vector Machine
文章编号:
1673-629X(2015)05-0078-05
作者:
 李琼陈利
 汉口学院 计算机科学与技术学院
Author(s):
 LI Qiong CHEN Li
关键词:
 文本分类支持向量机二叉树Mercer核
Keywords:
 text classificationSVMbinary treeMercer kernel
分类号:
TP391
文献标志码:
A
摘要:
 为了解决传统的支持向量机( SVM)多类分类方法中普遍存在的训练和测试时间过长、实际样本输入空间非线性可分等问题,提出了一种改进的支持向量机多类分类方法。首先,利用Mercer核函数把实际输入样本向量空间中呈非线性可分分布的样本向量映射到一个高维的特征向量空间,以实现线性可分;然后,采用二叉树来创建高维特征空间中的SVM多类分类器,实现分类识别;最后,将该方法应用到网络文本分类中。实验结果表明,该方法较好地解决了多类文本分类中实际输入文本向量呈非线性可分的问题,降低了训练和测试过程中的时间消耗,且在一定程度上提高了多类文本分类的识别准确率。
Abstract:
 In order to solve the problem of long time for training and testing,input space nonlinear classification in traditional SVM meth-ods,propose an improved text classification method for SVM. First,the Mercer kernel is used to sample vector with nonlinear distribution in input space,which is mapped into a high dimensional feature vector space to realize the linear separable. Then it constructs the SVM multi-class classifiers in high dimensional space using binary tree,implementing the classification recognition. Finally,use this method in-to the network text classification. The experimental results show that the method can effectively solve the nonlinear separable problem in input text space,saving the training and testing time,and improving the precision of multi-text classification.

相似文献/References:

[1]田昕辉 李成基.带有短语切分的中文文本分类方法[J].计算机技术与发展,2010,(01):5.
 TIAN Xin-hui,LEE Sung-kee.Phrase Segmentation for Chinese Text Classification[J].,2010,(05):5.
[2]姜鹤 陈丽亚.SVM文本分类中一种新的特征提取方法[J].计算机技术与发展,2010,(03):17.
 JIANG He,CHEN Li-ya.A New Feature Selection Method in SVM Text Categorization[J].,2010,(05):17.
[3]周瑛 张铃.有限混合模型在文本分类中的应用研究[J].计算机技术与发展,2010,(06):18.
 ZHOU Ying,ZHANG Ling.Study of Application of Finite Mixture Model in Text Classification[J].,2010,(05):18.
[4]许幸 张启蕊.基于KNN算法的医药信息文本分类系统的研究[J].计算机技术与发展,2009,(04):206.
 XU Xing,ZHANG Qi-rui.Research of Medical Information Text Categorization Based on KNN Algorithm[J].,2009,(05):206.
[5]陈锦禾 范新 沈闻 沈洁.基于情感词识别的BBS情感分类研究[J].计算机技术与发展,2009,(07):120.
 CHEN Jin-he,FAN Xin,SHEN Wen,et al.Research on Sentiment Classification of BBS Reviews Based on Identifying Words with Polarity[J].,2009,(05):120.
[6]刘锋 唐佳 仲红.一种基于RBF神经网络的XML文本分类方法[J].计算机技术与发展,2009,(08):34.
 LIU Feng,TANG Jia,ZHONG Hong.A Text Categorization Method Based on RBF Neural Network[J].,2009,(05):34.
[7]晋幼丽 周明全 王学松.SVM和K-means结合的文本分类方法研究[J].计算机技术与发展,2009,(11):35.
 JIN You-li,ZHOU Ming-quan,WANG Xue-song.Research on Text Classification Method of SVM and K - means[J].,2009,(05):35.
[8]张燕平 徐庆鹏 苏守宝 邢猛.一种基于贪婪覆盖的文本分类方法[J].计算机技术与发展,2009,(01):74.
 ZHANG Yan-ping,XU Qing-peng,SU Shou-bao,et al.A Text Categorization Method Based on Greedy Cover[J].,2009,(05):74.
[9]陈素萍 谢丽聪.一种文本特征选择方法的研究[J].计算机技术与发展,2009,(02):112.
 CHEN Su-ping,XIE Li-cong.Research on Document Feature Selection[J].,2009,(05):112.
[10]于水英 丁华福 付志超.基于遗传算法和模糊聚类的文本分类研究[J].计算机技术与发展,2009,(04):131.
 YU Shui-ying,DING Hua-fu,FU Zhi-chao.Study on Text Categorization Based on Genetic Algorithm and Fuzzy Clustering[J].,2009,(05):131.
[11]李妍坊,许歆艺,刘功申. 面向情感倾向性识别的特征分析研究[J].计算机技术与发展,2014,24(09):33.
 LI Yan-fang,XU Xin-yi,LIU Gong-shen. Research on Feature Analysis Oriented Text Sentiment Identification[J].,2014,24(05):33.
[12]龚静,胡平霞,胡灿. 用于文本分类的特征项权重算法改进[J].计算机技术与发展,2014,24(09):128.
 GONG Jing,HU Ping-xia,HU Can. Improvement of Algorithm for Weight of Characteristic Item in Text Classification [J].,2014,24(05):128.
[13]裴向杰,唐红昇,陈鹏. 一种改进的贝叶斯算法在短信过滤中的研究[J].计算机技术与发展,2015,25(09):89.
 PEI Xiang-jie,TANG Hong-sheng,CHEN Peng. Research on Optimized Naive Bayesian Algorithm in SMS Spam Filtering[J].,2015,25(05):89.
[14]卫华,韩立新,夏建华. 基于Word2 fea模型的文本建模方法[J].计算机技术与发展,2016,26(02):165.
 WEI Hua,HAN Li-xin,XIA Jian-hua. Text Modeling Method Based on Word2 fea Model[J].,2016,26(05):165.
[15]戚后林,顾磊. 概率潜在语义分析的KNN文本分类算法[J].计算机技术与发展,2017,27(07):57.
 QI Hou-lin,GU Lei. KNN Text Classification Algorithm with Probabilistic Latent Semantic Analysis[J].,2017,27(05):57.

更新日期/Last Update: 2015-07-03