[1]吴楠 胡学钢.基于聚类分区的序列模式挖掘算法研究[J].计算机技术与发展,2010,(06):109-112.
 WU Nan,HU Xue-gang.Research on Clustering Partition-Based Approach of Sequential Pattern Mining[J].,2010,(06):109-112.
点击复制

基于聚类分区的序列模式挖掘算法研究()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2010年06期
页码:
109-112
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Research on Clustering Partition-Based Approach of Sequential Pattern Mining
文章编号:
1673-629X(2010)06-0109-04
作者:
吴楠12 胡学钢1
[1]合肥工业大学计算机与信息学院[2]宿州学院计算机科学与技术系
Author(s):
WU NanHU Xue-gang
[1]School of Computer and Information,Hefei University of Technology[2]Department of Computer Science and Technology,Suzhou College
关键词:
数据挖掘序列模式分区算法聚类
Keywords:
data mining sequential pattern partition-based approach clustering
分类号:
TP311.5
文献标志码:
A
摘要:
对较大数据集挖掘序列模式时,可能会因产生的大量候选集等原因无法装入内存而难以进行。文中提出基于分区的序列模式挖掘算法,以期克服有限存储问题,为并行处理及分布式处理做好基础。此外,当给出的分区数固定时,不同的分区性能可能存在较大差异,通过聚类方法对数据集预处理,以得到可以产生较少局部频繁序列的特定分区,最终得到较少的全局候选序列以减少第二遍扫描时间。理论分析和实验表明,所提出的方法可比普通分区方法得到更加优化的分区,从而效率更高。
Abstract:
Most algorithms do not work when the very large dataset and generated candidates which do not load into the main memory,are mined.This paper shows a partition-based approach to overcome not only the limited memory issue,but also in parallel processing and

相似文献/References:

[1]项响琴 汪彩梅.基于聚类高维空间算法的离群数据挖掘技术研究[J].计算机技术与发展,2010,(01):120.
 XIANG Xiang-qin,WANG Cai-mei.Study of Outlier Data Mining Based on CLIQUE Algorithm[J].,2010,(06):120.
[2]李雷 丁亚丽 罗红旗.基于规则约束制导的入侵检测研究[J].计算机技术与发展,2010,(03):143.
 LI Lei,DING Ya-li,LUO Hong-qi.Intrusion Detection Technology Research Based on Homing - Constraint Rule[J].,2010,(06):143.
[3]吉同路 柏永飞 王立松.住宅与房地产电子政务中数据挖掘的应用研究[J].计算机技术与发展,2010,(01):235.
 JI Tong-lu,BAI Yong-fei,WANG Li-song.Study and Application of Data Mining in E-government of House and Real Estate Industry[J].,2010,(06):235.
[4]杨静 张楠男 李建 刘延明 梁美红.决策树算法的研究与应用[J].计算机技术与发展,2010,(02):114.
 YANG Jing,ZHANG Nan-nan,LI Jian,et al.Research and Application of Decision Tree Algorithm[J].,2010,(06):114.
[5]赵裕啸 倪志伟 王园园 伍章俊.SQL Server 2005数据挖掘技术在证券客户忠诚度的应用[J].计算机技术与发展,2010,(02):229.
 ZHAO Yu-xiao,NI Zhi-wei,WANG Yuan-yuan,et al.Application of Data Mining Technology of SQL Server 2005 in Customer Loyalty Model in Securities Industry[J].,2010,(06):229.
[6]张笑达 徐立臻.一种改进的基于矩阵的频繁项集挖掘算法[J].计算机技术与发展,2010,(04):93.
 ZHANG Xiao-da,XU Li-zhen.An Advanced Frequent Itemsets Mining Algorithm Based on Matrix[J].,2010,(06):93.
[7]王爱平 王占凤 陶嗣干 燕飞飞.数据挖掘中常用关联规则挖掘算法[J].计算机技术与发展,2010,(04):105.
 WANG Ai-ping,WANG Zhan-feng,TAO Si-gan,et al.Common Algorithms of Association Rules Mining in Data Mining[J].,2010,(06):105.
[8]张广路 雷景生 吴兴惠.一种改进的Apriori关联规则挖掘算法(英文)[J].计算机技术与发展,2010,(06):84.
 ZHANG Guang-lu,LEI Jing-sheng,WU Xing-hui.An Improved Apriori Algorithm for Mining Association Rules[J].,2010,(06):84.
[9]吴青 傅秀芬.水平分布数据库的正负关联规则挖掘[J].计算机技术与发展,2010,(06):113.
 WU Qing,FU Xiu-fen.Positive and Negative Association Rules Mining on Horizontally Partitioned Database[J].,2010,(06):113.
[10]孙名松 邸明星 王湛昱.多决策树算法在P2P网络流量检测中的应用[J].计算机技术与发展,2010,(06):126.
 SUN Ming-song,DI Ming-xing,WANG Zhan-yu.Application of Decision Tree Algorithm in Traffic Detection of P2P Network[J].,2010,(06):126.
[11]王娜娜 陈立潮 潘理虎 张英俊.基于时间间隔和点击量的Prefixspan改进算法[J].计算机技术与发展,2011,(10):81.
 WANG Na-na,CHEN Li-chao,PAN Li-hu,et al.An Improved Prefixspan Algorithm Based on Time Interval and Click Quantity[J].,2011,(06):81.
[12]刘佳新.基于频繁序列树的交互式序列模式挖掘算法[J].计算机技术与发展,2012,(05):64.
 LIU Jia-xin.An Interactive Sequential Patterns Mining Algorithm Based on Frequent Sequence Tree[J].,2012,(06):64.
[13]占美星[],杨颖[],杨磊[]. 基于树结构多重最小支持度的挖掘算法研究[J].计算机技术与发展,2014,24(08):45.
 ZHAN Mei-xing[],YANG Ying[],YANG Lei[]. Study on Mining Algorithm Based on Tree Structure Multiple Minimum Supports[J].,2014,24(06):45.

备注/Memo

备注/Memo:
安徽省自然科学基金项目(090412044); 安徽省高等学校省级优秀青年人才基金项目(2010SQRL193)吴楠(1981-),女,安徽宿州人,讲师,硕士,研究方向为数据挖掘;胡学钢,教授,研究方向为知识工程、数据挖掘及数据结构。
更新日期/Last Update: 1900-01-01