[1]高岭 赵朋朋 崔志明.Deep Web查询接口的自动判定[J].计算机技术与发展,2007,(05):148-151.
 GAO Ling,ZHAO Peng-peng,CUI Zhi-ming.Automatic Judgment of Deep Web Query Interfaces[J].,2007,(05):148-151.
点击复制

Deep Web查询接口的自动判定()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2007年05期
页码:
148-151
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Automatic Judgment of Deep Web Query Interfaces
文章编号:
1673-629X(2007)05-0148-04
作者:
高岭 赵朋朋 崔志明
苏州大学智能信息处理及应用研究所
Author(s):
GAO Ling ZHAO Peng-peng CUI Zhi-ming
Institute of Intelligent Information Processing and Application, Suzhou University
关键词:
深网网页表单特征提取朴素贝叶斯分类
Keywords:
Deep Web HTML form feature extraction naive Bayes classification
分类号:
TP181
文献标志码:
A
摘要:
传统搜索引擎仅可以索引浅层Web页面.然而在网络深处隐含着大量、高质量的信息,传统搜索引擎由于技术原因不能索引这些被称之为Deep Web的页面。由于查询接口是Deep Web的唯一入口,因此要获取Deep Web信息就需判定哪些网页表单是Deep Web查询接口。文中介绍了一种利用朴素贝叶斯分类算法自动判定网页表单是否为Deep Web查询接口的方法,并实验验证了该方法的有效性
Abstract:
Traditional Web search engines work well for finding crawlable pages, but they ignore the tremendous amount information hidden behind query forms, in large searchable electronic databases. For obtaining dynamie information, firstly query interfaces must be extracted from massive Web forms to find the entrance to the datasets. This paper describes a technique for detecting query interface using naive Bayes classification and the test results are reported

相似文献/References:

[1]李文骏 崔志明.基于搜索引擎的Deep Web数据源发现技术[J].计算机技术与发展,2008,(08):58.
 LI Wen-jun,CUI Zhi-ming.Deep Web Source Discovery Based on Search Engine[J].,2008,(05):58.
[2]陈娟 王贤 黄青松.基于模式-区别方法聚类结构化的Deep Web源[J].计算机技术与发展,2007,(11):107.
 CHEN Juan,WANG Xian,HUANG Qing-song.Clustering Structured Deep Web Sources:a Schema- Based Model - Differentiation Approach[J].,2007,(05):107.

备注/Memo

备注/Memo:
教育部科研重点项目(205059);教育部“高校博士学科点科研基金项目”(20040285016);江苏省高技术研究计划项目(BG2005019)高岭(1982-),男,浙江义乌人,硕士研究生,研究方向为Web数据挖掘、个性化服务技术;崔志明,教授,博士生导师,研究方向为智能化信息处理、计算机网络应用与数据库
更新日期/Last Update: 1900-01-01