[1]于飞 丁华福 姜伦.Web日志挖掘中数据预处理技术的研究[J].计算机技术与发展,2010,(05):47-50.
 YU Fei,DING Hua-fu,JIANG Lun.Research on Data Preprocessing Technology in Web Log Mining[J].,2010,(05):47-50.
点击复制

Web日志挖掘中数据预处理技术的研究()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2010年05期
页码:
47-50
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Research on Data Preprocessing Technology in Web Log Mining
文章编号:
1673-629X(2010)05-0047-04
作者:
于飞 丁华福 姜伦
哈尔滨理工大学计算机科学与技术学院
Author(s):
YU FeiDING Hua-fuJIANG Lun
College of Computer Sci.& Tech.,Harbin Univ.of Sci.& Tech.
关键词:
Web日志挖掘数据预处理会话识别数据清洗
Keywords:
Web log mining data preprocessing session identification data cleaning
分类号:
TP311
文献标志码:
A
摘要:
数据预处理在Web日志挖掘过程中起着至关重要的作用,直接影响日志挖掘的质量和结果。详细分析了数据预处理的过程,提出一种改进的数据清洗方法,以提高日志挖掘中数据预处理的效率,并针对Web日志数据预处理中会话识别这一重要环节,提出一种改进的会话识别方法。在用户识别后,根据页面内容、站点结构确定页面重要程度,对阈值进行调整。然后,根据用户对页面内容的兴趣度来删除会话中的链接页面和不感兴趣的页面。实验结果表明,提出的方法能更准确地确定页面访问时间阈值,得到更为合理有效的会话集合。
Abstract:
Data preprocessing plays an essential role in the process of Web log mining,directly influenced the quality of the Web log mining and its results.Analyses data preprocessing process for Web log mining in detail,proposes an improved method of data cleaning

相似文献/References:

[1]方杰 朱京红.日志挖掘中的数据预处理[J].计算机技术与发展,2010,(04):17.
 FANG Jie,ZHU Jing-hong.Data Pretreatment of Log Mining[J].,2010,(05):17.
[2]冯春辉.Web日志挖掘在网络教学中的应用研究[J].计算机技术与发展,2010,(06):183.
 FENG Chun-hui.Research on Application of Web Log Mining in Network Teaching[J].,2010,(05):183.
[3]葛育祥 熊励.整合文本挖掘的商务智能系统结构研究[J].计算机技术与发展,2009,(04):1.
 GE Yu-xiang,XIONG Li.System Structure Study of Business Intelligence Integrated Text Mining[J].,2009,(05):1.
[4]方元康 胡学钢 夏启寿.一种改进的Web日志会话识别方法[J].计算机技术与发展,2008,(11):214.
 FANG Yuan-kang,HU Xue-gang,XIA Qi-shou.An Improved Method for Transaction Session Identification in Web Usage Mining[J].,2008,(05):214.
[5]王琼 刘珏 徐汀荣.结合Web站点结构的路径补充[J].计算机技术与发展,2007,(06):120.
 WANG Qiong,LIU Jue,XU Ting-rong.Combining With the Structure of Website for Path Complement[J].,2007,(05):120.
[6]李烈彪 张海鹏 周亚峰.Web日志挖掘中数据预处理方法的研究[J].计算机技术与发展,2007,(07):45.
 LI Lie-biao,ZHANG Hai-peng,ZHOU Ya-feng.Data Preprocessing Method Research for Web Log Mining[J].,2007,(05):45.
[7]严楠 刘涛.基于校园网的用户行为数据分析系统的设计[J].计算机技术与发展,2007,(01):239.
 YAN Nan,LIU Tao.Design of Data Analyzing System of Visitors' Behavior Patterns Based on Web of Campus[J].,2007,(05):239.
[8]董艳.数据预处理方法在移动通信行业中的应用[J].计算机技术与发展,2010,(11):225.
 DONG Yan.Application of Data Pre-processing Method in Mobile Telecommunication Industry[J].,2010,(05):225.
[9]周爱武 肖云 封军.Web日志挖掘数据预处理优化[J].计算机技术与发展,2011,(01):42.
 ZHOU Ai-wu,XIAO Yun,FENG Jun.An Improved Method for Data Preprocessing in Web Log Mining[J].,2011,(05):42.
[10]阳小兰 钱程 赵海廷.Web日志分析系统研究[J].计算机技术与发展,2011,(09):211.
 YANG Xiao-lan,QIAN Cheng,ZHAO Hai-ting.Research on Web Log Analysis System[J].,2011,(05):211.
[11]熊忠阳 周亚峰.Web访问挖掘的预处理技术的研究[J].计算机技术与发展,2007,(08):11.
 XIONG Zhong-yang,ZHOU Ya-feng.Research on Data Preprocessing Technology in Web Log Mining[J].,2007,(05):11.
[12]顾兆军 李晓红 王伟 黄杰培.Web日志挖掘中的会话识别方法研究[J].计算机技术与发展,2012,(04):45.
 GU Zhao-jun,LI Xiao-hong,WANG Wei,et al.Research on Method of Session Identification in Web Log Mining[J].,2012,(05):45.

备注/Memo

备注/Memo:
国家自然科学基金项目(60736014)于飞(1983-),男,黑龙江哈尔滨人,硕士研究生,研究方向为数据挖掘;丁华福,硕士生导师,教授,研究方向为数据库、数据挖掘。
更新日期/Last Update: 1900-01-01