[1]卢博礼 张小平 王翰虎.基于矩阵算法的序列模式挖掘研究[J].计算机技术与发展,2011,(01):120-124.
 LU Bo-li,ZHANG Xiao-ping,WANG Han-hu.Research on Sequential Pattern Mining Based on Algorithm of Matrix[J].,2011,(01):120-124.
点击复制

基于矩阵算法的序列模式挖掘研究()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2011年01期
页码:
120-124
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Research on Sequential Pattern Mining Based on Algorithm of Matrix
文章编号:
1673-629X(2011)01-0120-05
作者:
卢博礼 张小平 王翰虎
贵州大学计算机科学与信息学院
Author(s):
LU Bo-li ZHANG Xiao-ping WANG Han-hu
College of Computer Science and Information, Guizhou University
关键词:
序列模式挖掘序列模式大序列矩阵算法连接运算
Keywords:
sequential pattern mining sequential pattern large sequence algorithm of matrix connected computing
分类号:
TP311.13
文献标志码:
A
摘要:
序列模式挖掘中几种算法的缺点:都要进行多次扫描数据库,CPU要进行多次I/O操作。这成为序列挖掘中的一大瓶颈,使得算法在实际应用中的效率不高。文中提出一种矩阵算法,即在一次扫描数据库时,根据扫描数据建立由0和1组成的事务矩阵。接下来的大序列、序列模式等都是通过矩阵的列向量对应元素的相乘运算和简单的加法运算而得到。从而使算法得到进一步优化,提高了CPU的使用率,解决了序列挖掘中的瓶颈问题。本算法通过大量的数据实验,证明了算法确实有效地优化了算法的时间复杂度
Abstract:
Based on several shortcomings of algorithm of the sequential pattern mining. Itmust scan the database many times, so a number of CPU to I / O operation, it become bottlenecks. The efficiency of algorithm is not high in practical applications. The paper presents an algorithm of matrix, that is, in a scan database, in accordance with scan data to establish the matrix of affairs which are composition of 0 and 1. Then, large sequence and sequential patterns are all out pass the vector of matrix multiplication operator corresponding to the elements and simple addition operations have been. So that the algorithm has been further optimized to improve the CPU rate of utilization. The algorithm use a large number of experimental data to prove that the algorithm is indeed effective to optimize the algorithm of complexity of time

相似文献/References:

[1]吴楠 胡学钢.基于聚类分区的序列模式挖掘算法研究[J].计算机技术与发展,2010,(06):109.
 WU Nan,HU Xue-gang.Research on Clustering Partition-Based Approach of Sequential Pattern Mining[J].,2010,(01):109.
[2]李锡娟 刘锋 闫娜娜 徐杰 耿波.PrefixSpan算法与CloSpan算法的分析与研究[J].计算机技术与发展,2008,(01):70.
 LI Xi-juan,LIU Feng,YAN Na-na,et al.Research and Analysis Between Algorithm of PrefixSpan and CloSpan[J].,2008,(01):70.
[3]孟宪苹 宋菲 李俊.基于序列模式挖掘的入侵检测系统的研究[J].计算机技术与发展,2008,(03):154.
 MENG Xian-ping,SONG Fei,LI Jun.Research of Intrusion Detection System Based on Sequential Pattern Mining[J].,2008,(01):154.
[4]叶和平 尚敏.一种面向入侵检测的数据挖掘算法研究[J].计算机技术与发展,2008,(11):149.
 YE He-ping,SHANG Min.Study on an Intrusion Detection Oriented Data Mining Algorithm[J].,2008,(01):149.
[5]王红侠 胡学钢.基于Bitmap的序列模式挖掘的改进算法[J].计算机技术与发展,2007,(08):84.
 WANG Hong-xia,HU Xue-gang.An Improved Algorithm for Mining Sequential Pattern Based on Bitmap[J].,2007,(01):84.
[6]夏明波 王晓川 孙永强 金士尧.序列模式挖掘算法研究[J].计算机技术与发展,2006,(04):4.
 XIA Ming-bo,WANG Xiao-chuan,SUN Yong-qiang,et al.Research on Sequential Pattern Mining Algorithms[J].,2006,(01):4.
[7]刘洪辉 吴岳芬.用户行为模式挖掘问题的研究[J].计算机技术与发展,2006,(05):50.
 LIU Hong-hui,WU Yue-fen.Research on User's Behavior Pattern Mining[J].,2006,(01):50.
[8]靳明霞 李玉华 管建军.序列模式挖掘在电子商务个性化服务中的应用[J].计算机技术与发展,2006,(10):233.
 JIN Ming-xia,LI Yu-hua,GUAN Jian-jun.Application of Sequential Patterns Mining Project on Electronic Commerce Personal Information Service[J].,2006,(01):233.
[9]阳小兰 钱程 赵海廷.Web日志分析系统研究[J].计算机技术与发展,2011,(09):211.
 YANG Xiao-lan,QIAN Cheng,ZHAO Hai-ting.Research on Web Log Analysis System[J].,2011,(01):211.
[10]王娜娜 陈立潮 潘理虎 张英俊.基于时间间隔和点击量的Prefixspan改进算法[J].计算机技术与发展,2011,(10):81.
 WANG Na-na,CHEN Li-chao,PAN Li-hu,et al.An Improved Prefixspan Algorithm Based on Time Interval and Click Quantity[J].,2011,(01):81.

备注/Memo

备注/Memo:
贵州省2008年省级信息化专项资金项目(0830);贵州省科技计划工业攻关课题(黔科合GY字[2008]3035)卢博礼(1978-),男,贵州黔西人,硕士研究生,CCF会员,研究方向为数据库技术与软件工程;张小平,研究员,硕士生导师,研究方向为数据库技术与软件工程;王翰虎,教授,硕士生导师,研究方向为数据库系统、分布式系统、面向对象方法
更新日期/Last Update: 1900-01-01