[1]苏小英,胡彦鹏[],杨竣辉,等.一种新的用于文本分类的概率分类器设计[J].计算机技术与发展,2014,24(03):46-49.
 SU Xiao-ying[],HU Yan-peng[],YANG Jun-hui[],et al.A New Probabilistic Classifier Design for Text Categorization[J].,2014,24(03):46-49.
点击复制

一种新的用于文本分类的概率分类器设计()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
24
期数:
2014年03期
页码:
46-49
栏目:
智能、算法、系统工程
出版日期:
2014-03-31

文章信息/Info

Title:
A New Probabilistic Classifier Design for Text Categorization
文章编号:
1673-629X(2014)03-0046-04
作者:
苏小英12胡彦鹏[3]杨竣辉2李明1
1.上海中医药大学 图书信息中心;2.上海大学 计算机工程与科学学院;3.上海金融期货信息技术有限公司
Author(s):
SU Xiao-ying[1]HU Yan-peng[2]YANG Jun-hui[3]LI Ming[4]
关键词:
文本分类文本挖掘概率分类器
Keywords:
text categorizationtext miningprobabilityclassifier
分类号:
TP302
文献标志码:
A
摘要:
为了进一步提高文本分类的准确率,文中介绍了一种新的用于文本分类的概率分类器。该分类器首先通过自然语言处理技术对文本进行预处理,然后从训练集中读取文本信息从而产生正、负规则,并计算正负权重系数,最后计算正、负概率。文中给出了计算正负权重系数的算法,并根据计算出来的权重系数及正、负概率值对文本进行分类。将文中提出的概率分类器与SVM分类器进行对比实验,实验结果表明,文中设计的概率分类器对于文本分类效果较好。
Abstract:
In order to further improve the accuracy of text categorization,a new probabilistic classifier for text categorization is intro-duced. Firstly,it preprocesses the text using natural language processing technology. Then,read the documents from the training set and generate positive and negative rules,calculate the positive and negative weighted coefficient. Finally,compute the positive and negative probability. The algorithm of calculating the positive and negative weighted coefficient is presented,and categorize the text in accordance with the coefficient and the probability value. Take the experiment compared with SVM classifier,the experiments results show this classi-fier has better performance in text categorization.

相似文献/References:

[1]田昕辉 李成基.带有短语切分的中文文本分类方法[J].计算机技术与发展,2010,(01):5.
 TIAN Xin-hui,LEE Sung-kee.Phrase Segmentation for Chinese Text Classification[J].,2010,(03):5.
[2]姜鹤 陈丽亚.SVM文本分类中一种新的特征提取方法[J].计算机技术与发展,2010,(03):17.
 JIANG He,CHEN Li-ya.A New Feature Selection Method in SVM Text Categorization[J].,2010,(03):17.
[3]周瑛 张铃.有限混合模型在文本分类中的应用研究[J].计算机技术与发展,2010,(06):18.
 ZHOU Ying,ZHANG Ling.Study of Application of Finite Mixture Model in Text Classification[J].,2010,(03):18.
[4]许幸 张启蕊.基于KNN算法的医药信息文本分类系统的研究[J].计算机技术与发展,2009,(04):206.
 XU Xing,ZHANG Qi-rui.Research of Medical Information Text Categorization Based on KNN Algorithm[J].,2009,(03):206.
[5]沈亚田 沈夏炯 张磊.基于图划分的谱聚类算法在文本挖掘中应用[J].计算机技术与发展,2009,(05):96.
 SHEN Ya-tian,SHEN Xia-jiong,ZHANG Lei.Application of Spectral Cluster Algorithm Based on Graph Partition in Text Mining[J].,2009,(03):96.
[6]陈锦禾 范新 沈闻 沈洁.基于情感词识别的BBS情感分类研究[J].计算机技术与发展,2009,(07):120.
 CHEN Jin-he,FAN Xin,SHEN Wen,et al.Research on Sentiment Classification of BBS Reviews Based on Identifying Words with Polarity[J].,2009,(03):120.
[7]刘锋 唐佳 仲红.一种基于RBF神经网络的XML文本分类方法[J].计算机技术与发展,2009,(08):34.
 LIU Feng,TANG Jia,ZHONG Hong.A Text Categorization Method Based on RBF Neural Network[J].,2009,(03):34.
[8]晋幼丽 周明全 王学松.SVM和K-means结合的文本分类方法研究[J].计算机技术与发展,2009,(11):35.
 JIN You-li,ZHOU Ming-quan,WANG Xue-song.Research on Text Classification Method of SVM and K - means[J].,2009,(03):35.
[9]张燕平 徐庆鹏 苏守宝 邢猛.一种基于贪婪覆盖的文本分类方法[J].计算机技术与发展,2009,(01):74.
 ZHANG Yan-ping,XU Qing-peng,SU Shou-bao,et al.A Text Categorization Method Based on Greedy Cover[J].,2009,(03):74.
[10]陈素萍 谢丽聪.一种文本特征选择方法的研究[J].计算机技术与发展,2009,(02):112.
 CHEN Su-ping,XIE Li-cong.Research on Document Feature Selection[J].,2009,(03):112.
[11]许高建.基于Web的文本挖掘技术研究[J].计算机技术与发展,2007,(06):187.
 XU Gao-jian.Research on Text Mining Techniques Web- Based[J].,2007,(03):187.

更新日期/Last Update: 1900-01-01