[1]阳小兰 钱程 赵海廷.Web日志分析系统研究[J].计算机技术与发展,2011,(09):211-215.
 YANG Xiao-lan,QIAN Cheng,ZHAO Hai-ting.Research on Web Log Analysis System[J].,2011,(09):211-215.
点击复制

Web日志分析系统研究()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2011年09期
页码:
211-215
栏目:
应用开发研究
出版日期:
1900-01-01

文章信息/Info

Title:
Research on Web Log Analysis System
文章编号:
1673-629X(2011)09-0211-05
作者:
阳小兰 钱程 赵海廷
武汉科技大学中南分校信息工程学院
Author(s):
YANG Xiao-lanQIAN ChengZHAO Hai-ting
College of Information Engineering,Zhongnan Branch,Wuhan University of Science and Technology
关键词:
日志分析数据预处理频繁项目集序列模式
Keywords:
log analysis data preprocessing frequent itemsets sequential patterns
分类号:
TP393
文献标志码:
A
摘要:
Web日志分析系统不仅能改进Web网站结构,提高Web服务器性能,而且能识别用户的喜好、满意度,发现潜在用户,增强网站服务竞争力。介绍了Web日志挖掘的各个阶段,设计并实现了一个Web日志分析系统。分析了传统的频繁项集挖掘算法与序列模式挖掘算法的不足之处,根据日志数据的特性,将用户属性引入频繁项目集的生成过程,有效地减少了候选项集的数目,并根据候选集的特点,逐轮压缩数据库。将连续序列引入到ApiroriAll算法的候选集合并过程中,实现了改进算法。通过实验比较了改进算法与传统算法的效率,证明了改进算法的有效性
Abstract:
Web log analysis system can not only improve the Web site structure and improve Web server performance,but also identify the user's preferences,satisfaction,identify potential customers and enhance the competitiveness of Web services.The stages of Web log mining are described,and a Web log analysis system is designed and implemented.The shortcomings of traditional frequent itemsets mining algorithm and sequential pattern mining algorithm are analyzed.According to the characteristics of log data,the user attributes are added into the generation process of frequent item sets,effectively reducing the number of candidate items.According to the characteristics of the candidate set,by round of compressed database.ApiroriAll continuous sequence introduced into the algorithm and the process of candidate set.An improved algorithm is implemented.In the experiment,the efficiency of improved algorithm and traditional algorithm is compared,the effectiveness of the improved algorithm is proved

相似文献/References:

[1]方杰 朱京红.日志挖掘中的数据预处理[J].计算机技术与发展,2010,(04):17.
 FANG Jie,ZHU Jing-hong.Data Pretreatment of Log Mining[J].,2010,(09):17.
[2]于飞 丁华福 姜伦.Web日志挖掘中数据预处理技术的研究[J].计算机技术与发展,2010,(05):47.
 YU Fei,DING Hua-fu,JIANG Lun.Research on Data Preprocessing Technology in Web Log Mining[J].,2010,(09):47.
[3]葛育祥 熊励.整合文本挖掘的商务智能系统结构研究[J].计算机技术与发展,2009,(04):1.
 GE Yu-xiang,XIONG Li.System Structure Study of Business Intelligence Integrated Text Mining[J].,2009,(09):1.
[4]方元康 胡学钢 夏启寿.一种改进的Web日志会话识别方法[J].计算机技术与发展,2008,(11):214.
 FANG Yuan-kang,HU Xue-gang,XIA Qi-shou.An Improved Method for Transaction Session Identification in Web Usage Mining[J].,2008,(09):214.
[5]王琼 刘珏 徐汀荣.结合Web站点结构的路径补充[J].计算机技术与发展,2007,(06):120.
 WANG Qiong,LIU Jue,XU Ting-rong.Combining With the Structure of Website for Path Complement[J].,2007,(09):120.
[6]李烈彪 张海鹏 周亚峰.Web日志挖掘中数据预处理方法的研究[J].计算机技术与发展,2007,(07):45.
 LI Lie-biao,ZHANG Hai-peng,ZHOU Ya-feng.Data Preprocessing Method Research for Web Log Mining[J].,2007,(09):45.
[7]熊忠阳 周亚峰.Web访问挖掘的预处理技术的研究[J].计算机技术与发展,2007,(08):11.
 XIONG Zhong-yang,ZHOU Ya-feng.Research on Data Preprocessing Technology in Web Log Mining[J].,2007,(09):11.
[8]严楠 刘涛.基于校园网的用户行为数据分析系统的设计[J].计算机技术与发展,2007,(01):239.
 YAN Nan,LIU Tao.Design of Data Analyzing System of Visitors' Behavior Patterns Based on Web of Campus[J].,2007,(09):239.
[9]董艳.数据预处理方法在移动通信行业中的应用[J].计算机技术与发展,2010,(11):225.
 DONG Yan.Application of Data Pre-processing Method in Mobile Telecommunication Industry[J].,2010,(09):225.
[10]周爱武 肖云 封军.Web日志挖掘数据预处理优化[J].计算机技术与发展,2011,(01):42.
 ZHOU Ai-wu,XIAO Yun,FENG Jun.An Improved Method for Data Preprocessing in Web Log Mining[J].,2011,(09):42.

备注/Memo

备注/Memo:
湖北省自然科学基金项目(2010CDB11102)阳小兰(1978-),女,湖北广水人,硕士,讲师,研究方向为数据挖掘、软件工程
更新日期/Last Update: 1900-01-01