[1]陈娟 王贤 黄青松.基于模式-区别方法聚类结构化的Deep Web源[J].计算机技术与发展,2007,(11):107-109.
 CHEN Juan,WANG Xian,HUANG Qing-song.Clustering Structured Deep Web Sources:a Schema- Based Model - Differentiation Approach[J].,2007,(11):107-109.
点击复制

基于模式-区别方法聚类结构化的Deep Web源()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2007年11期
页码:
107-109
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Clustering Structured Deep Web Sources:a Schema- Based Model - Differentiation Approach
文章编号:
1673-629X(2007)11-0107-03
作者:
陈娟 王贤 黄青松
昆明理工大学信息工程与自动化学院
Author(s):
CHEN JuanWANG XianHUANG Qing-song
Sch. of Info. Eng. and Automation,Kunming Univ. of Sci. and Techn
关键词:
数据整合深网分层凝聚聚类
Keywords:
data integration deep Web hierarchical agglomerative clustering
分类号:
TP311
文献标志码:
A
摘要:
近几年,网络被在线数据库迅速深化。在深网中,大量的资料提供了丰富的数据模式。这些模式详细说明了它们的目标领域和查询性能。因此对大规模数据的整合是当前面临的挑战。在数据挖掘中聚类分析是一个重要方法,为了发现通过这种统计分布管理的聚类,提出了一个新的目标函数:模型-区别(model-differentiation)。实验显示对于聚类Web查询模式,凝聚的层次聚类能正确地组织资料,区别模型函数胜过现有的凝聚的层次聚类
Abstract:
In the recent years, the Web has been rapidly deepened with the databases online. On this deep Web, numerous sources are structured, providing schema- rich data. Their schemas define the object domain and its query capabilities. The structured deep Web thus presents challenges for large- scale information integration. Clustering is one of the important approaches in data mining. To find clusters governed by such statistical distributions, propose a novel objective function:model - differentiation. Our evaluation shows that, on clustering the Web query schemas, the model - differentiation function outperforms existing ones with the hierarchical agglomerative clustering algorithm

相似文献/References:

[1]李学俭 何文华.基于SOA架构的高校数据资源整合研究[J].计算机技术与发展,2010,(01):74.
 LI Xue-jian,HE Wen-hua.Research of Campus Data Integration Based on SOA[J].,2010,(11):74.
[2]高岭 赵朋朋 崔志明.Deep Web查询接口的自动判定[J].计算机技术与发展,2007,(05):148.
 GAO Ling,ZHAO Peng-peng,CUI Zhi-ming.Automatic Judgment of Deep Web Query Interfaces[J].,2007,(11):148.
[3]李治强 苗放.多源异构数据整合在信用系统中的应用研究[J].计算机技术与发展,2007,(02):172.
 LI Zhi-qiang,MIAO Fang.Application and Research of Credit System Based on Distributed Heterogeneous Database[J].,2007,(11):172.
[4]孙达 李旻.基于网络存储的公安信息系统数据整合[J].计算机技术与发展,2006,(08):1.
 SUN Da,LI Min.Data Integration of Police Information System Based on Network Storage[J].,2006,(11):1.
[5]许春 游洪跃 曾雪梅 刘学洪 伍良富.一种学生信息综合服务平台的设计与实现[J].计算机技术与发展,2011,(04):179.
 XU Chun,YOU Hong-yue,ZENG Xue-mei,et al.Design and Implementation for a Student Information Service Platform[J].,2011,(11):179.
[6]纳春宁.基于Java租赁服务器计费系统——数据采集与整合[J].计算机技术与发展,2011,(10):147.
 NA Chun-ning.Charging System of Openlab Using Java--Data Acquisition and Data Integration[J].,2011,(11):147.
[7]邓慧挺 毛宇光.不确定数据的重复记录检测[J].计算机技术与发展,2012,(08):60.
 DENG Hui-ting,MAO Yu.guang.Duplicate Record Detection of Uncertain Data[J].,2012,(11):60.

备注/Memo

备注/Memo:
云南省自然科学基金资助项目(Z2005-1-53004)陈娟(1982-),女,山东临沂人,硕士研究生,研究方向为智能信息系统;黄青松,教授,研究方向为智能信息系统
更新日期/Last Update: 1900-01-01