[1]仲华 崔志明.基于XML的信息抽取和多层向量空间技术研究[J].计算机技术与发展,2007,(07):49-52.
 ZHONG Hua,CUI Zhi-ming.Research on Information Extraction and Multilayer Vector Space Based on XML Technology[J].,2007,(07):49-52.
点击复制

基于XML的信息抽取和多层向量空间技术研究()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2007年07期
页码:
49-52
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Research on Information Extraction and Multilayer Vector Space Based on XML Technology
文章编号:
1673-629X(2007)07-0049-04
作者:
仲华 崔志明
苏州大学计算机科学与技术学院
Author(s):
ZHONG Hua CUI Zhi-ming
School of Computer Sci. & Tech. , Suzhou University
关键词:
XML架构信息抽取N层向量空间模型
Keywords:
XML information extraction N layer vector space model
分类号:
TP311
文献标志码:
A
摘要:
在分析了传统索引技术的缺陷的基础上,提出了一种基于XML架构信息抽取的多层向量空间的模型,重点阐述了如何建立一个基于XML的Web信息抽取平台,从构造知识库、网页优化和信息抽取这三方面进行研究,并阐述了基于XML的多层向量空间模型及其形成。通过这种技术不仅使网页内容得到了清晰的剖析和抽取,更能大大提高对Web网页文档检索效率和准确率。目的在于寻求一种更为高效简洁的检索方法
Abstract:
By analyzing the limitations of traditional searching technolcgy, proposes a platform of Web information extraction based on XML and a model of searching technology based on XML construction and multilayer vector space, both of which greatly improve the efficiency of indexing documents. This model not only anatomizes and extracts the documents clearly, but also promotes the efficiency of Web documents searching. The main purpose of it is to find a more efficient and compact searching method

相似文献/References:

[1]秦振海 谭守标 徐超.基于Web的表格信息抽取研究[J].计算机技术与发展,2010,(02):217.
 QIN Zhen-hai,TAN Shou-biao,XU Chao.Study on ,Tables Information Extraction Based on Web[J].,2010,(07):217.
[2]韩普 姜杰.HMM在自然语言处理领域中的应用研究[J].计算机技术与发展,2010,(02):245.
 HAN Pu,JIANG Jie.Application and Research of Hidden Markov Model in Natural Language Processing Domain[J].,2010,(07):245.
[3]胡国晴 李建华.一种基于可信度分析的Web页面新属性发现方法[J].计算机技术与发展,2009,(01):56.
 HU Guo-qing,LI Jian-hua.A Credibility Analysis- Based Method to Discover New Attributes Web Pages[J].,2009,(07):56.
[4]李宏伟 史培中 张素智.一种高效Web数据抽取包装器的设计与实现[J].计算机技术与发展,2009,(02):123.
 LI Hong-wei,SHI Pei-zhong,ZHANG Su-zhi.Design and Implementation of an Efficient Wrapper for Web Data Extraction[J].,2009,(07):123.
[5]赵金仿 赵艳 缪建明.网页信息抽取及其自动文本分类的实现[J].计算机技术与发展,2008,(10):37.
 ZHAO Jin-fang,ZHAO Yan,MIAO Jian-ming.Extraction of Homepage Text Information and Realization of Text Automatic Categorization[J].,2008,(07):37.
[6]崔阳 吴爱华.一种面向B2B垂直搜索的网页信息去噪方法[J].计算机技术与发展,2008,(12):70.
 CUI Yang,WU Ai-hua.A Method of Eliminating Noisy Information in Web Pages Oriented B2B Vertical Searching[J].,2008,(07):70.
[7]徐慧 杨学兵.基于本体相似度的中文科研论文信息抽取[J].计算机技术与发展,2008,(12):203.
 XU Hui,YANG Xue-bing.Information Extraction from Chinese Research Papers Based on Ontology Similarity[J].,2008,(07):203.
[8]陈静 朱巧明 贡正仙.基于Ontology的信息抽取研究综述[J].计算机技术与发展,2007,(10):84.
 CHEN Jing,ZHU Qiao-ming,GONG Zheng-xian.Overview of Ontology - Based Information Extraction[J].,2007,(07):84.
[9]邹腊梅 肖基毅 龚向坚.基于Maximum Likelihood与HMM的文本挖掘[J].计算机技术与发展,2007,(12):110.
 ZOU La-mei,XIAO Ji-yi,GONG Xiang-jian.Text Information Mining Based on Maximum Likelihood and Hidden Markov Model[J].,2007,(07):110.
[10]杨红超 肖基毅.基于HMM/BP混合模型的文本信息抽取研究[J].计算机技术与发展,2011,(05):115.
 YANG Hong-chao,XIAO Ji-yi.Text Information Extraction Research Based on HMM and BP Network Hybrid Model[J].,2011,(07):115.

备注/Memo

备注/Memo:
江苏省高技术研究项目(BG2005019);教育部“高校博士点科研基金项目”(20040285016);教育部科研重点项目(205059)仲华(1981-),女,江苏苏州人,硕士研究生,研究方向为Deep Web数据挖掘、搜索引擎;崔志明,教授,博士生导师,研究方向为智能化信息处理、计算机网络与数据库应用
更新日期/Last Update: 1900-01-01