[1]田昕辉 李成基.带有短语切分的中文文本分类方法[J].计算机技术与发展,2010,(01):5-9.
 TIAN Xin-hui,LEE Sung-kee.Phrase Segmentation for Chinese Text Classification[J].,2010,(01):5-9.
点击复制

带有短语切分的中文文本分类方法()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2010年01期
页码:
5-9
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Phrase Segmentation for Chinese Text Classification
文章编号:
1673-629X(2010)01-0009-05
作者:
田昕辉 李成基
国立庆北大学计算机工学系
Author(s):
TIAN Xin-hui LEE Sung-kee
Department of Computer Engineering, Kyungpook National University
关键词:
特征提取文本分类短语切分权值调整
Keywords:
feature extraction text classification phrase segmentation weight coordination
分类号:
TP391.1
文献标志码:
A
摘要:
Internet文本信息量极速增加,在组织和处理这些文本数据时,文本分类技术显得尤为重要。利用统计学理论,特征提取和权重计算常常忽略了特征项之间的语法关系。文中提出了一种将短语切分与文本分类相结合的新方法。在经过TFIDF计算之后,在同一个短语中,特征项之间的关系被计算出来,然后调整权值向量,最后可以得到文本分类的正确率。同一般地文本分类方法相比,加入短语切分的文本分类方法的正确率平均提高了1.5%以上。
Abstract:
With the rapid growth of textual information on Internet,text classification has become a more important key technology in organizing and processing large amount of document data.General statistics method of feature extraction and weight calculation ignor

相似文献/References:

[1]何小娜 逄焕利.基于二维直方图和改进蚁群聚类的图像分割[J].计算机技术与发展,2010,(03):128.
 HE Xiao-na,PANG Huan-li.Image Segmentation Based on Improved Ant Colony Clustering and Two- Dimensional Histogram[J].,2010,(01):128.
[2]罗林波 陈绮.氨基酸序列特征提取方法研究[J].计算机技术与发展,2010,(02):206.
 LUO Lin-bo,CHEN Qi.Research of Feature Extraction Methods of Amino Acid Sequence[J].,2010,(01):206.
[3]周瑛 张铃.有限混合模型在文本分类中的应用研究[J].计算机技术与发展,2010,(06):18.
 ZHOU Ying,ZHANG Ling.Study of Application of Finite Mixture Model in Text Classification[J].,2010,(01):18.
[4]许幸 张启蕊.基于KNN算法的医药信息文本分类系统的研究[J].计算机技术与发展,2009,(04):206.
 XU Xing,ZHANG Qi-rui.Research of Medical Information Text Categorization Based on KNN Algorithm[J].,2009,(01):206.
[5]毛雁明 兰美辉 王运琼 冯乔生.一种改进的基于Harris的角点检测方法[J].计算机技术与发展,2009,(05):130.
 MAO Yan-ming,LAN Mei-hui,WANG Yun-qiong,et al.An Improved Corner Detection Method Based on Harris[J].,2009,(01):130.
[6]陈锦禾 范新 沈闻 沈洁.基于情感词识别的BBS情感分类研究[J].计算机技术与发展,2009,(07):120.
 CHEN Jin-he,FAN Xin,SHEN Wen,et al.Research on Sentiment Classification of BBS Reviews Based on Identifying Words with Polarity[J].,2009,(01):120.
[7]刘锋 唐佳 仲红.一种基于RBF神经网络的XML文本分类方法[J].计算机技术与发展,2009,(08):34.
 LIU Feng,TANG Jia,ZHONG Hong.A Text Categorization Method Based on RBF Neural Network[J].,2009,(01):34.
[8]赵辉 张鹏.网络异常的主动检测与特征分析[J].计算机技术与发展,2009,(08):159.
 ZHAO Hui,ZHANG Peng.Active Detection and Feature Analysis About Network Anomaly[J].,2009,(01):159.
[9]晋幼丽 周明全 王学松.SVM和K-means结合的文本分类方法研究[J].计算机技术与发展,2009,(11):35.
 JIN You-li,ZHOU Ming-quan,WANG Xue-song.Research on Text Classification Method of SVM and K - means[J].,2009,(01):35.
[10]张燕平 徐庆鹏 苏守宝 邢猛.一种基于贪婪覆盖的文本分类方法[J].计算机技术与发展,2009,(01):74.
 ZHANG Yan-ping,XU Qing-peng,SU Shou-bao,et al.A Text Categorization Method Based on Greedy Cover[J].,2009,(01):74.
[11]姜鹤 陈丽亚.SVM文本分类中一种新的特征提取方法[J].计算机技术与发展,2010,(03):17.
 JIANG He,CHEN Li-ya.A New Feature Selection Method in SVM Text Categorization[J].,2010,(01):17.
[12]张丽 黄东.基于Winnow算法的反垃圾邮件引擎的设计与实现[J].计算机技术与发展,2006,(04):170.
 ZHANG Li,HUANG Dong.Design and Implementation of One Prototype of Anti - Spam Engine Based on Winnow Algorithm[J].,2006,(01):170.

备注/Memo

备注/Memo:
田昕辉(1983-),男,硕士,研究方向为自然语言处理;李成基,教授,研究方向为计算机视觉和个人医疗设备。
更新日期/Last Update: 1900-01-01