[1]李文骏 崔志明.基于搜索引擎的Deep Web数据源发现技术[J].计算机技术与发展,2008,(08):58-60.
 LI Wen-jun,CUI Zhi-ming.Deep Web Source Discovery Based on Search Engine[J].,2008,(08):58-60.
点击复制

基于搜索引擎的Deep Web数据源发现技术()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2008年08期
页码:
58-60
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Deep Web Source Discovery Based on Search Engine
文章编号:
1673-629X(2008)08-0058-03
作者:
李文骏 崔志明
苏州大学智能信息处理及应用研究所
Author(s):
LI Wen-junCUI Zhi-ming
Institute of Intelligent Information Processing and Application, Suzhou University
关键词:
搜索引擎DeepWeb网页表单查询扩展
Keywords:
search engine Deep Web HTML form query expansion
分类号:
TP11
文献标志码:
A
摘要:
随着Web数据库的广泛应用,Web正在不断“深化”。传统搜索引擎只能检索浅层网络,却不能直接索引到深层网络(Deep Web)的资源。为了有效地利用Deep Web资源,必须要对Deep Web数据进行大规模集成。其中,数据源发现是整合Deep Web资源的首要工作,能否高效地发现Deep Web站点是Deep Web数据获取的关键。提出了一种基于传统搜索引擎的Deep Web数据源发现方法,该方法通过分析返回结果来扩展查询,从而进一步提高了数据源发现的效率。实验证明该方法能得到较好的结果
Abstract:
With the prevalence of Web database,Web is continuously deepened. Traditional search engines are only able to reach surface Web except for deep Web source. To make use of deep Web source efficiently,must perform scalable integration on deep Web data. In t

相似文献/References:

[1]盛启东 谭守标 徐超 冯二媛 陈军宁.巧用黑盒法逆推百度中文分词算法[J].计算机技术与发展,2010,(04):136.
 SHENG Qi-dong,TAN Shou-biao,XU Chao,et al.Inferring Baidu's Chinese Word Segmentation Algorithm by Supposing a Black Box[J].,2010,(08):136.
[2]陈勇 刘勇.中医药主题搜索网络机器人的设计与实现[J].计算机技术与发展,2010,(05):162.
 CHEN Yong,LIU Yong.Design and Implementation of Topic-Specific Robot for Traditional Chinese Medicine[J].,2010,(08):162.
[3]周爱武 李玉梅 周闪闪 王宝铜.基于返回结果的DeepWeb查询接口识别[J].计算机技术与发展,2009,(07):117.
 ZHOU Ai-wu,LI Yu-mei,ZHOU Shan-shan,et al.Recognized Query Interface of Deep Web Based on Response Pages[J].,2009,(08):117.
[4]邓义乔 张代远.蚁群算法在搜索引擎系统中的应用研究[J].计算机技术与发展,2009,(12):21.
 DENG Yi-qiao,ZHANG Dai-yuan.Research and Application of Ant Colony Algorithm in Searching Engine System[J].,2009,(08):21.
[5]王攀 张顺颐 陈雪娇.基于动态行为轮廓库的Web用户行为分析关键技术[J].计算机技术与发展,2009,(02):20.
 WANG Pan,ZHANG Shun-yi,CHEN Xue-jiao.Key Technology of Web Users' Behavior Analysis Based on Dynamic Behavior Profile Database[J].,2009,(08):20.
[6]杜光芹 张化祥 赵瑞东.主题Web挖掘研究[J].计算机技术与发展,2008,(02):94.
 DU Guang-qin,ZHANG Hua-xiang,ZHAO Rui-dong.State of Topic Web Mining[J].,2008,(08):94.
[7]王兵 刘彩虹.DeepWeb信息集成系统中查询转换[J].计算机技术与发展,2008,(07):176.
 WANG Bing,LIU Cai-hong.Query Translation on Deep Web Information Integration System[J].,2008,(08):176.
[8]钟昕 伏玉琛.书籍搜索领域Deep Web数据集成系统[J].计算机技术与发展,2008,(09):50.
 ZHONG Xin,FU Yu-chen.A Deep Web Data Integration System for Book Searching Domain[J].,2008,(08):50.
[9]郑莉霞 刘连芳.可配置Web Robot的研究与实现[J].计算机技术与发展,2007,(06):83.
 ZHENG Li-xia,LIU Lian-fang.Research and Realization on Web Robot[J].,2007,(08):83.
[10]王冉冉 王刚 黄青松.基于Deep Web的信息采集系统[J].计算机技术与发展,2007,(10):171.
 WANG Ran-ran,WANG Gang,HUANG Qing-song.An Information Extraction System Based on Deep Web[J].,2007,(08):171.

备注/Memo

备注/Memo:
网家自然科学基金项目(60673092);2005年度教育部科研重点项目(205059);教育部“高校博士学科点科研基金项目”(20040285016);江苏省高技术研究计划项目(BG2005019)李文骏(1983-),男,江苏苏州人,硕士研究生,研究方向为Web数据挖掘、个性化服务技术。崔志明,教授,博士生导师,研究方向为智能化信息处理、计算机网络与数据库应用
更新日期/Last Update: 1900-01-01