[1]张冉 卡米力·毛依丁.基于XML和N层VSM的Web信息检索[J].计算机技术与发展,2006,(05):56-58.
 ZHANG Ran,Kamil · Moydin.Web Information Retrieval Based on XML and N- level VSM[J].,2006,(05):56-58.
点击复制

基于XML和N层VSM的Web信息检索()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2006年05期
页码:
56-58
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Web Information Retrieval Based on XML and N- level VSM
文章编号:
1673-629X(2006)05-0056-03
作者:
张冉 卡米力·毛依丁
新疆大学信息工程学院计算机系
Author(s):
ZHANG Ran Kamil · Moydin
Computer Dept., College of Infor. Sci. and Eng., Xinjiang Univ
关键词:
XMLXHTMLN层向量空间模型查全率查准率
Keywords:
XML XHTML N - level VSM recall precision
分类号:
TP301.6
文献标志码:
A
摘要:
基于XML文档格式良好、层次清晰,可以方便地操纵、分析其结构的特点。文中在将Web上的HTML文档转化为XML文档的基础上,通过Java中的DOM树,分析文档的层次结构。把文档分为层次化的文本段,对传统的VSM算法进行改进,把每个文本段转换为空间向量,实现了N层VSM算法,通过试验证明,改进后算法的查全率和查准率都要优于传统的VSM算法
Abstract:
XML documents have well form, clear levels and analyses the structure easily. Convert HTML documents on Web into XML document, so can use DOM tree in Java to analyse the hierarchy of the documents. The documents can be divided into N level text paragraphs' content,which are represented by index term vectors, Using this method improve traditional vector space model, the N level VSM is achieved. And proved by the experiment, both recall and precision of the N level VSM are performing well than the traditional VSM

相似文献/References:

[1]况旭 刘波.XML的面向对象语言特性[J].计算机技术与发展,2010,(01):50.
 KUANG Xu,LIU Bo.XML Object-Oriented Language Characteristic[J].,2010,(05):50.
[2]秦振海 谭守标 徐超.基于Web的表格信息抽取研究[J].计算机技术与发展,2010,(02):217.
 QIN Zhen-hai,TAN Shou-biao,XU Chao.Study on ,Tables Information Extraction Based on Web[J].,2010,(05):217.
[3]方杰 朱京红.日志挖掘中的数据预处理[J].计算机技术与发展,2010,(04):17.
 FANG Jie,ZHU Jing-hong.Data Pretreatment of Log Mining[J].,2010,(05):17.
[4]邱鑫 林颖 王保保.基于XML的嵌入式系统日志解决方案[J].计算机技术与发展,2009,(05):52.
 QIU Xin,LIN Ying,WANG Bao-bao.An XML- Based Log Solution in Embedded System[J].,2009,(05):52.
[5]刘威 杨丹.基于虚拟视图的异构数据库集成平台的研究[J].计算机技术与发展,2009,(06):91.
 LIU Wei,YANG Dan.Research of Heterogeneous Database Integration Platform Based on Virtual View[J].,2009,(05):91.
[6]范金花 梁正和.报表系统中ETL通用框架的设计与研究[J].计算机技术与发展,2009,(06):202.
 FAN Jin-hua,LIANG Zheng-he.Design and Research of Universal ETL Framework in Report System[J].,2009,(05):202.
[7]蓝萌 徐汀荣 黄斐.基于JMS的制造型企业ERP-MES集成方法实现[J].计算机技术与发展,2009,(06):246.
 LAN Meng,XU Ting-rong,HUANG Fei.Implementation of an Integrated Method Between ERP and MES of Manufacture Enterprise Based on JMS[J].,2009,(05):246.
[8]王伟卿 孙莉.基于Java消息服务的消息中间件的应用研究[J].计算机技术与发展,2009,(07):220.
 WANG Wei-qing,SUN Li.Application and Research of Message- Oriented Middleware Based on JMS[J].,2009,(05):220.
[9]郭小明 雷电.基于XML的业务指令分解技术研究[J].计算机技术与发展,2009,(07):234.
 GUO Xiao-ming,LEI Dian.Instruction Decomposition Technology Based on XML[J].,2009,(05):234.
[10]刘锋 唐佳 仲红.一种基于RBF神经网络的XML文本分类方法[J].计算机技术与发展,2009,(08):34.
 LIU Feng,TANG Jia,ZHONG Hong.A Text Categorization Method Based on RBF Neural Network[J].,2009,(05):34.

备注/Memo

备注/Memo:
张冉(1981-),女,新疆乌鲁木齐人,硕士研究生,研究方向为网络信息检索;卡米力·毛依丁,硕士生导师,副教授,主要研究方向为网络信息安全
更新日期/Last Update: 1900-01-01