[1]邓慧挺 毛宇光.不确定数据的重复记录检测[J].计算机技术与发展,2012,(08):60-62.
 DENG Hui-ting,MAO Yu.guang.Duplicate Record Detection of Uncertain Data[J].,2012,(08):60-62.
点击复制

不确定数据的重复记录检测()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2012年08期
页码:
60-62
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Duplicate Record Detection of Uncertain Data
文章编号:
1673-629X(2012)08-0060-03
作者:
邓慧挺 毛宇光
南京航空航天大学计算机科学与技术学院
Author(s):
DENG Hui-ting MAO Yu.guang
College of Computer Science and Technology, Nanjing University of Aeronautics and Astronautics
关键词:
不确定数据重复记录数据整合比较向量决策模型
Keywords:
uncertain data duplicate record data integration comparison vector decision model
分类号:
TP311
文献标志码:
A
摘要:
随着不确定数据成为研究的热点,不确定数据管理吸引了研究者的极大兴趣。目前业界已经使用概率数据库来存储和管理不确定数据。为合并多个自治概率数据库中的数据,需要对不确定数据进行集成。现有对数据集成的研究主要集中于对确定数据(关系型数据和半结构化数据)的研究,对不确定性数据的集成没有相关工作。重复记录检测是集成过程中必要和具有代表性的组成部分,文中讨论了重复检测的基础,研究了有依赖和无依赖的不确定数据重复检测,最后提出了两个不确定数据重复记录检测的模型
Abstract:
As uncertain becomes a hot research, the management of uncertain data has attracted tremendous interest from research. Probabilistic databases have been proposed to manage uncertain data. In order to combine data from multiple autonomous probabilistic databases, an integration of probabilistic data has to be performed. Existing approaches have focused on the integration of certain source data f relational and semi-structure). There is no related work on the uncertain data integration. Duplicate detection is an essential and representative component. In this paper,discuss the foundation Of duplicate detection. Then study duplicate detection of uncertain data with (without) dependency. At last,present two models of duplicate record detection of uncertain data

相似文献/References:

[1]孙平平 刘方爱.不确定数据库中减小可能世界的RPW—kBest查询[J].计算机技术与发展,2011,(10):70.
 SUN Ping-ping,LIU Fang-ai.A RPW-kBest Query Based on Reduced Possible World in Uncertain Database[J].,2011,(08):70.
[2]赵学健,熊肖肖,张欣慧,等.不确定数据频繁项集挖掘算法研究[J].计算机技术与发展,2019,29(07):140.[doi:10. 3969 / j. issn. 1673-629X. 2019. 07. 028]
 ZHAO Xue-jian,XIONG Xiao-xiao,ZHANG Xin-hui,et al.Research on Frequent Itemset Mining Algorithm for Uncertain Data[J].,2019,29(08):140.[doi:10. 3969 / j. issn. 1673-629X. 2019. 07. 028]
[3]赵学健,熊肖肖,张欣慧,等.一种基于 Top-K 查询的加权频繁项集挖掘算法[J].计算机技术与发展,2019,29(07):49.[doi:10. 3969 / j. issn. 1673-629X. 2019. 07. 010]
 ZHAO Xue-jian,XIONG Xiao-xiao,ZHANG Xin-hui,et al.A Frequent Itemset Mining Algorithm for Uncertain Data Based on Top-K Queries[J].,2019,29(08):49.[doi:10. 3969 / j. issn. 1673-629X. 2019. 07. 010]

备注/Memo

备注/Memo:
国家自然科学基金(60873025)邓慧挺(1986-),男,福建永安人,硕士研究生,CCF会员,主要研究领域为不确定数据库与数据仓库;毛宇光,副教授,主要研究领域为数据库系统及理论、数据挖掘与数据仓库、特种数据库、多值逻辑及其应用
更新日期/Last Update: 1900-01-01