[1]苏小虎.基于改进VSM的句子相似度研究[J].计算机技术与发展,2009,(08):113-116.
 SU Xiao-hu.Research of Sentence Similarity Based on Improved VSM[J].,2009,(08):113-116.
点击复制

基于改进VSM的句子相似度研究()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2009年08期
页码:
113-116
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Research of Sentence Similarity Based on Improved VSM
文章编号:
1673-629X(2009)08-0113-04
作者:
苏小虎
安徽工业大学计算机学院
Author(s):
SU Xiao-hu
School of Computer, Anhui University of Technology
关键词:
向量空间模型领域权重频率权重
Keywords:
VSM domain - weight frequence - weight
分类号:
TP312
文献标志码:
A
摘要:
向量空间模型是以特征项权重为核心的算法,特征项权重对文本分类、检索等的效果起着至关重要的作用。文中提出了一个新的权重概念——领域权重,并利用它改进传统向量空间模型。改进后的模型综合考虑原有特征项权重和文档中特征项自身的领域权重。在特定领域FAQ的检索中作测试实验,结果表明,改进的方法提高了检索的查准率、查全率和F测试值
Abstract:
The characteristic terms weight is the core of VSM , it plays the very important role in text classification, text retrieval,and so on. A new concept namely terms'domain weight is put forward,so as to improve the weight formula of VSM. Further more, origi

相似文献/References:

[1]许幸 张启蕊.基于KNN算法的医药信息文本分类系统的研究[J].计算机技术与发展,2009,(04):206.
 XU Xing,ZHANG Qi-rui.Research of Medical Information Text Categorization Based on KNN Algorithm[J].,2009,(08):206.
[2]曹毅 贺卫红.基于内容过滤的电子商务推荐系统研究[J].计算机技术与发展,2009,(06):182.
 CAO Yi,HE Wei-hong.Research on E- Commerce Recommender System Based on Content - Based Filtering[J].,2009,(08):182.
[3]赵治军 陈立潮 谢斌红 王秀慧.基于VSM的OAI—PMH元数据相似度计算研究[J].计算机技术与发展,2009,(09):119.
 ZHAO Zhi-jun,CHEN Li-chao,XIE Bin-hong,et al.Research of Calculating Metadata Similarity in OAI Framework Based on VSM[J].,2009,(08):119.
[4]张成伟 郑诚.基于改进VSM的文本信息检索研究[J].计算机技术与发展,2009,(01):71.
 ZHANG Cheng-wei,ZHENG Cheng.Research of Text Information Retrieval Based on Improved VSM[J].,2009,(08):71.
[5]李想 吴国新 郭晶.基于分布式倒排索引和VSM算法的P2P复杂搜索[J].计算机技术与发展,2009,(04):25.
 LI Xiang,WU Guo-xin,GUO Jing.Distributed Inverted Index and VSM Algorithm Based Complex Peer- to- Peer Search[J].,2009,(08):25.
[6]乌庆敏 杨思春.基于潜在语义分析的智能答疑系统研究与实现[J].计算机技术与发展,2008,(09):251.
 WU Qing-min,YANG Si-chun.Research on Intelligent Question Answering System Based on Latent Semantic Analysis[J].,2008,(08):251.
[7]饶文碧 柯慧燕.Web文本分类技术研究及其实现[J].计算机技术与发展,2006,(03):116.
 RAO Wen-bi,KE Hui-yan.Research and Implementation of Web Text Classification[J].,2006,(08):116.
[8]宋丹 王卫东 陈英.基于改进向量空间模型的话题识别与跟踪[J].计算机技术与发展,2006,(09):62.
 SONG Dan,WANG Wei-dong,CHEN Ying.Topic Detection and Tracking with a Developed Vector Space Model[J].,2006,(08):62.
[9]侯亚南 黄映辉.用于形式背景提取的中文文本表示[J].计算机技术与发展,2010,(09):36.
 HOU Ya-nan,HUANG Ying-hui.Chinese Document Representation for Extracting Formal Context[J].,2010,(08):36.
[10]郭志伟 李玮 张涛 王攀峰.基于兴趣域的P2P气象资料搜索机制研究[J].计算机技术与发展,2012,(08):192.
 GUO Zhi-wei,LI Wei,ZHANG Tao,et al.Research on Searching Meteorological Data Mechanism Based on Interest in P2P Network[J].,2012,(08):192.

备注/Memo

备注/Memo:
安徽省自然科学基金项目(KJ2007B245)苏小虎(1974-),男,安徽无为人,硕士。研究方向为信息检索、自然语言处理
更新日期/Last Update: 1900-01-01