[1]张春元.基于条件随机场的文本分类模型[J].计算机技术与发展,2011,(07):77-80.
 ZHANG Chun-yuan.Text Categorization Model Based on Conditional Random Fields[J].,2011,(07):77-80.
点击复制

基于条件随机场的文本分类模型()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2011年07期
页码:
77-80
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Text Categorization Model Based on Conditional Random Fields
文章编号:
1673-629X(2011)07-0077-04
作者:
张春元
海南大学信息科学技术学院
Author(s):
ZHANG Chun-yuan
Institute of Information Science and Technology,Hainan University
关键词:
文本分类条件随机场序列模型
Keywords:
text categorization conditional random fields sequence model
分类号:
TP391.1
文献标志码:
A
摘要:
条件随机场(CRFs)是一种十分优秀的统计学习模型,文中尝试将其引入到文本分类之中,提出了一种基于CRFs的文本分类模型。首先通过特征选择将待分类文档和文档类别分别表示成为CRFs的观察序列和状态序列,然后使用文本分类相关领域知识定义特征函数来提取序列之间的关联特征,再采用前向或后向算法评估出给定观察序列条件下各状态序列的概率,据此实现待分类文档的分类。分析表明,这种新模型语义清晰,计算直观,易于融合各种文本分类领域知识,分类效率较高
Abstract:
Conditional random fields(CRFs) is an excellent statistical learning model.Importing it into text categorization,it proposes a text categorization model based on CRFs.Firstly,by choosing feature words,it describes a document as an observation sequence and each category as a state sequence.Then,using domain knowledges related to text categorization,it defines feature functions to extract association features between the sequences.Finally,it uses the forward or backward algorithm to find the probability of each state sequence in a given observation sequence,and uses these probabilities to categorize the document.The analysis shows that this new model has a good semantic interpretation,a strong ability to merge domain knowledge of text categorization,and a high efficiency to categorize documents

相似文献/References:

[1]田昕辉 李成基.带有短语切分的中文文本分类方法[J].计算机技术与发展,2010,(01):5.
 TIAN Xin-hui,LEE Sung-kee.Phrase Segmentation for Chinese Text Classification[J].,2010,(07):5.
[2]姜鹤 陈丽亚.SVM文本分类中一种新的特征提取方法[J].计算机技术与发展,2010,(03):17.
 JIANG He,CHEN Li-ya.A New Feature Selection Method in SVM Text Categorization[J].,2010,(07):17.
[3]闵华清 黄欣欣 罗荣华.基于激光和视觉信息的机器人目标跟踪方法[J].计算机技术与发展,2010,(04):113.
 MIN Hua-qing,HUANG Xin-xin,LUO Rong-hua.Robot Target Tracking Approach Based on Laser and Vision Information[J].,2010,(07):113.
[4]周瑛 张铃.有限混合模型在文本分类中的应用研究[J].计算机技术与发展,2010,(06):18.
 ZHOU Ying,ZHANG Ling.Study of Application of Finite Mixture Model in Text Classification[J].,2010,(07):18.
[5]许幸 张启蕊.基于KNN算法的医药信息文本分类系统的研究[J].计算机技术与发展,2009,(04):206.
 XU Xing,ZHANG Qi-rui.Research of Medical Information Text Categorization Based on KNN Algorithm[J].,2009,(07):206.
[6]陈锦禾 范新 沈闻 沈洁.基于情感词识别的BBS情感分类研究[J].计算机技术与发展,2009,(07):120.
 CHEN Jin-he,FAN Xin,SHEN Wen,et al.Research on Sentiment Classification of BBS Reviews Based on Identifying Words with Polarity[J].,2009,(07):120.
[7]刘锋 唐佳 仲红.一种基于RBF神经网络的XML文本分类方法[J].计算机技术与发展,2009,(08):34.
 LIU Feng,TANG Jia,ZHONG Hong.A Text Categorization Method Based on RBF Neural Network[J].,2009,(07):34.
[8]晋幼丽 周明全 王学松.SVM和K-means结合的文本分类方法研究[J].计算机技术与发展,2009,(11):35.
 JIN You-li,ZHOU Ming-quan,WANG Xue-song.Research on Text Classification Method of SVM and K - means[J].,2009,(07):35.
[9]张燕平 徐庆鹏 苏守宝 邢猛.一种基于贪婪覆盖的文本分类方法[J].计算机技术与发展,2009,(01):74.
 ZHANG Yan-ping,XU Qing-peng,SU Shou-bao,et al.A Text Categorization Method Based on Greedy Cover[J].,2009,(07):74.
[10]陈素萍 谢丽聪.一种文本特征选择方法的研究[J].计算机技术与发展,2009,(02):112.
 CHEN Su-ping,XIE Li-cong.Research on Document Feature Selection[J].,2009,(07):112.

备注/Memo

备注/Memo:
国家自然科学基金资助项目(60863001)张春元(1973-),男,湖北武汉人,硕士,讲师,研究方向为Web信息检索、Web数据挖掘
更新日期/Last Update: 1900-01-01