[1]周爱武 肖云 封军.Web日志挖掘数据预处理优化[J].计算机技术与发展,2011,(01):42-45.
 ZHOU Ai-wu,XIAO Yun,FENG Jun.An Improved Method for Data Preprocessing in Web Log Mining[J].,2011,(01):42-45.
点击复制

Web日志挖掘数据预处理优化()

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2011年01期
页码:
42-45
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
An Improved Method for Data Preprocessing in Web Log Mining
文章编号:
1673-629X(2011)01-0042-04
作者:
周爱武 肖云 封军
安徽大学计算机科学与技术学院
Author(s):
ZHOU Ai-wu XIAO Yun FENG Jun
College of Computer Science & Technology, Anhui University
关键词:
数据预处理Web日志用户识别事务识别
Keywords:
bata pre-processingweb log mininguser identification transaction identification
分类号:
TP311
文献标志码:
A
摘要:
在web日志挖掘中,数据预处理技术是各项工作的基础,此项内容将直接影响到后面的各个阶段,因此,也就显得至关重要。在已有的预处理方法基础上,选用了一种建立用户访问树的方法对用户进行识别,并且可以在缺乏网站拓扑结构的情况下对日志进行处理。提出了一种改进的事务处理方法,这可以在不额外增加步骤的基础上,能直接去除无用的事务,从而减少预处理结果对数据挖掘的影响.使得到的事务能更好地应用到模式分析当中,大大增强了后期挖掘的正确性
Abstract:
In the web log mining, data preprocessing technique is crucial ,which is the basis of the work and will directly influence the later stages. In this paper, choose a method that establish a user access tree to identify the user, based on the existing pretreatment methods, which can take on by the lack of site topology in the case of the log processing. Also give an improved method of transaction processing ,which can remove unnecessary transaction derectly without additional steps, thereby reducing the pretreatment results on the impact of data mining to be better applied to the model analysis,to induce the correction on the late mining

相似文献/References:

[1]邵兰洁 李光忠.Web使用挖掘的数据采集技术探究[J].计算机技术与发展,2010,(03):225.
 SHAO Lan-jie,LI Guang-zhong.Research on Techniques of Data Collecting for Web Usage Mining[J].,2010,(01):225.
[2]方杰 朱京红.日志挖掘中的数据预处理[J].计算机技术与发展,2010,(04):17.
 FANG Jie,ZHU Jing-hong.Data Pretreatment of Log Mining[J].,2010,(01):17.
[3]于飞 丁华福 姜伦.Web日志挖掘中数据预处理技术的研究[J].计算机技术与发展,2010,(05):47.
 YU Fei,DING Hua-fu,JIANG Lun.Research on Data Preprocessing Technology in Web Log Mining[J].,2010,(01):47.
[4]葛育祥 熊励.整合文本挖掘的商务智能系统结构研究[J].计算机技术与发展,2009,(04):1.
 GE Yu-xiang,XIONG Li.System Structure Study of Business Intelligence Integrated Text Mining[J].,2009,(01):1.
[5]方元康 胡学钢 夏启寿.一种改进的Web日志会话识别方法[J].计算机技术与发展,2008,(11):214.
 FANG Yuan-kang,HU Xue-gang,XIA Qi-shou.An Improved Method for Transaction Session Identification in Web Usage Mining[J].,2008,(01):214.
[6]李烈彪 张海鹏 周亚峰.Web日志挖掘中数据预处理方法的研究[J].计算机技术与发展,2007,(07):45.
 LI Lie-biao,ZHANG Hai-peng,ZHOU Ya-feng.Data Preprocessing Method Research for Web Log Mining[J].,2007,(01):45.
[7]熊忠阳 周亚峰.Web访问挖掘的预处理技术的研究[J].计算机技术与发展,2007,(08):11.
 XIONG Zhong-yang,ZHOU Ya-feng.Research on Data Preprocessing Technology in Web Log Mining[J].,2007,(01):11.
[8]严楠 刘涛.基于校园网的用户行为数据分析系统的设计[J].计算机技术与发展,2007,(01):239.
 YAN Nan,LIU Tao.Design of Data Analyzing System of Visitors' Behavior Patterns Based on Web of Campus[J].,2007,(01):239.
[9]吴辉娟 袁方.个性化服务技术研究[J].计算机技术与发展,2006,(02):32.
 WU Hui-juan,YUAN Fang.Research of Technologies on Personalized Information Service[J].,2006,(01):32.
[10]董艳.数据预处理方法在移动通信行业中的应用[J].计算机技术与发展,2010,(11):225.
 DONG Yan.Application of Data Pre-processing Method in Mobile Telecommunication Industry[J].,2010,(01):225.
[11]王琼 刘珏 徐汀荣.结合Web站点结构的路径补充[J].计算机技术与发展,2007,(06):120.
 WANG Qiong,LIU Jue,XU Ting-rong.Combining With the Structure of Website for Path Complement[J].,2007,(01):120.
[12]曾永忠[] []张帅[] 马忠权[]. 一种基于用户会话的异常检测方法[J].计算机技术与发展,2014,24(07):141.
 ZENG Yong-zhong[][],ZHANG Shuai[] A Zhong-quan[]. An Anomaly Detection Method Based on Session[J].,2014,24(01):141.

备注/Memo

备注/Memo:
安徽省教育科研重点项目(KJ2009A57)周爱武(1965-),女,安徽舒城人,副教授,主要从市数据库与web技术、数据仓库与数据挖掘、信息系统安全
更新日期/Last Update: 1900-01-01