[1]杨金柱 刘金岭.基于词语上下文的文本分类研究[J].计算机技术与发展,2011,(08):145-148.
 YANG Jin-zhu,LIU Jin-ling.Study of Text Classification Using Context[J].,2011,(08):145-148.
点击复制

基于词语上下文的文本分类研究()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2011年08期
页码:
145-148
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Study of Text Classification Using Context
文章编号:
1673-629X(2011)08-0145-04
作者:
杨金柱1 刘金岭2
[1]江南大学物联网工程学院[2]淮阴工学院计算机工程学院
Author(s):
YANG Jin-zhuLIU Jin-ling
[1]School of Internet of Things Engineering,Jiangnan University[2]School of Computer Engineering,Huaiyin Institute of Technology
关键词:
词语共现上下文词语相似度文本分类
Keywords:
word co-occurrence context word similarity text classification
分类号:
TP391.1
文献标志码:
A
摘要:
文本自动分类系统无法直接理解其语义并进行分类,需要对文本进行预处理,提取能表达文本主题内容的关键词,将这些关键词用结构化的形式保存起来,形成文本的表示。针对文本数据中存在大量词语共现的特点,提出了一种基于上下文的文本分类方法。该方法利用词语的上下文关系定义了词语相似度和词语权值,更科学地表达了词语在该类别中的语义表示,从而更能提高文本分类的质量。实验结果表明,该方法的分类效果比传统的简单向量距离分类法有明显的改善
Abstract:
Automatic text categorization system cannot directly understand its semantic and classification,need text pretreatment,extraction can express text topics content keywords,,these keywords using structured stored together to form the text representation.According to the common characteristics presented by a large number of words,a context-based text classification method is put forward.This method defines the similarity and weights of words using the context relations between them,which expressed more scientific terms in this category in the semantic representation,thus improve the quality of text categorization better.Experimental results show that the method of classification context-based performance has significantly improved compared with the traditional simple vector distance classification

相似文献/References:

[1]严娜 黄映辉.基于模板和上下文的语义Web服务动态组合[J].计算机技术与发展,2009,(12):89.
 YAN Na,HUANG Ying-hui.Semantic Web Services Dynamic Composition Based on Templet and Context[J].,2009,(08):89.
[2]刘天钊 黄鑫 阔永红.在低速和中速链路上的IP包头压缩技术[J].计算机技术与发展,2007,(11):103.
 LIU Tian-zhao,HUANG Xin,KUO Yong-hong.IP Packet Compression over Low or Medium Speed Link[J].,2007,(08):103.
[3]杨晶 张永胜 孙翠翠 王莹.基于时间约束和上下文的访问控制模型研究[J].计算机技术与发展,2011,(01):143.
 YANG Jing,ZHANG Yong-sheng,SUN Cui-cui,et al.Access Control Model Based on Time-constraint and Context[J].,2011,(08):143.
[4]宋立森 王汝传 叶宁 马守明 黄海平 蔡晓磊.基于Agent和XML的普适计算上下文集成框架[J].计算机技术与发展,2011,(02):73.
 SONG Li-sen,WANG Ru-chuan,YE Ning,et al.A Context Integration Framework in Pervasive Computing Based on XML and Agent[J].,2011,(08):73.
[5]刘莉 黄海平[] 王汝传[] 蔡启旺.普适计算中一种上下文集成方法[J].计算机技术与发展,2012,(06):130.
 LIU Li,HUANG Hai-ping,WANG Ru-chuan,et al.Context Integration Scheme in Pervasive Computing[J].,2012,(08):130.

备注/Memo

备注/Memo:
江苏省淮安市科技计划项目(HAG09061); 淮阴工学院重点基金项目(HGA0907)杨金柱(1980-),男,硕士研究生,研究方向为文本数据挖掘;刘金岭,教授,研究方向为数据仓库及文本数据挖掘
更新日期/Last Update: 1900-01-01