[1]李烈彪 张海鹏 周亚峰.Web日志挖掘中数据预处理方法的研究[J].计算机技术与发展,2007,(07):45-48.
 LI Lie-biao,ZHANG Hai-peng,ZHOU Ya-feng.Data Preprocessing Method Research for Web Log Mining[J].,2007,(07):45-48.
点击复制

Web日志挖掘中数据预处理方法的研究()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2007年07期
页码:
45-48
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Data Preprocessing Method Research for Web Log Mining
文章编号:
1673-629X(2007)07-0045-04
作者:
李烈彪 张海鹏 周亚峰
重庆大学计算机学院
Author(s):
LI Lie-biao ZHANG Hai-peng ZHOU Ya-feng
College of Computer Science, Chongqing University
关键词:
数据挖掘Web日志挖掘数据预处理
Keywords:
data mining Web log mining data preprocessing
分类号:
TP393
文献标志码:
A
摘要:
Web日志挖掘是目前网上智能信息检索和电子商务的主要研究课题之一。而数据预处理在Web日志挖掘中起着很重要的作用,直接影响日志挖掘的质量和结果。介绍了Web日志挖掘数据预处理过程,综述了国际上的研究现状,及流行的处理方法。针对预处理步骤中的用户会话识别和路径填充进行了相应的改进。根据评估会话构造方法的标准,通过实验对给出的新方法与其他方法进行了分析比较
Abstract:
Web log mining is one of the main research domains in intelligent information retrieval system and electronic commerce. While data preprocessing has played an important part in Web log mining, directly influenced the quality of the Web log mining and its results. This paper introduces Web log mining data preprocessing process. Summarizes studies status and prevalent methods did in this area. Then improves the user session identification and path identification which are the processes of the data preprocessing. Finally according to measures for session construction methods, compares the performance of the new method to other session construction methods by means of experimental data

相似文献/References:

[1]项响琴 汪彩梅.基于聚类高维空间算法的离群数据挖掘技术研究[J].计算机技术与发展,2010,(01):120.
 XIANG Xiang-qin,WANG Cai-mei.Study of Outlier Data Mining Based on CLIQUE Algorithm[J].,2010,(07):120.
[2]李雷 丁亚丽 罗红旗.基于规则约束制导的入侵检测研究[J].计算机技术与发展,2010,(03):143.
 LI Lei,DING Ya-li,LUO Hong-qi.Intrusion Detection Technology Research Based on Homing - Constraint Rule[J].,2010,(07):143.
[3]吉同路 柏永飞 王立松.住宅与房地产电子政务中数据挖掘的应用研究[J].计算机技术与发展,2010,(01):235.
 JI Tong-lu,BAI Yong-fei,WANG Li-song.Study and Application of Data Mining in E-government of House and Real Estate Industry[J].,2010,(07):235.
[4]杨静 张楠男 李建 刘延明 梁美红.决策树算法的研究与应用[J].计算机技术与发展,2010,(02):114.
 YANG Jing,ZHANG Nan-nan,LI Jian,et al.Research and Application of Decision Tree Algorithm[J].,2010,(07):114.
[5]秦振海 谭守标 徐超.基于Web的表格信息抽取研究[J].计算机技术与发展,2010,(02):217.
 QIN Zhen-hai,TAN Shou-biao,XU Chao.Study on ,Tables Information Extraction Based on Web[J].,2010,(07):217.
[6]赵裕啸 倪志伟 王园园 伍章俊.SQL Server 2005数据挖掘技术在证券客户忠诚度的应用[J].计算机技术与发展,2010,(02):229.
 ZHAO Yu-xiao,NI Zhi-wei,WANG Yuan-yuan,et al.Application of Data Mining Technology of SQL Server 2005 in Customer Loyalty Model in Securities Industry[J].,2010,(07):229.
[7]陆遥 魏皎 陈丽果.基于Web的个性化营养评估保障系统设计与实现[J].计算机技术与发展,2010,(03):1.
 LU Yao,WEI Jiao,CHEN Li-guo.Design and Implementation of Web - Based Personalized Intelligent Nutrition Assessment and Guarantee System[J].,2010,(07):1.
[8]张笑达 徐立臻.一种改进的基于矩阵的频繁项集挖掘算法[J].计算机技术与发展,2010,(04):93.
 ZHANG Xiao-da,XU Li-zhen.An Advanced Frequent Itemsets Mining Algorithm Based on Matrix[J].,2010,(07):93.
[9]王爱平 王占凤 陶嗣干 燕飞飞.数据挖掘中常用关联规则挖掘算法[J].计算机技术与发展,2010,(04):105.
 WANG Ai-ping,WANG Zhan-feng,TAO Si-gan,et al.Common Algorithms of Association Rules Mining in Data Mining[J].,2010,(07):105.
[10]何忠秀 王霜 杜亚军.基于Web的多渠道用户需求知识获取框架研究[J].计算机技术与发展,2010,(04):124.
 HE Zhong-xiu,WANG Shuang,DU Ya-jun.Research on Multi- channel's Knowledge Acquisition Frame for Customer Requirements Based on Web[J].,2010,(07):124.
[11]王冉冉 王刚 黄青松.基于Deep Web的信息采集系统[J].计算机技术与发展,2007,(10):171.
 WANG Ran-ran,WANG Gang,HUANG Qing-song.An Information Extraction System Based on Deep Web[J].,2007,(07):171.
[12]祝闻华,赵朋朋.基于SOA居民健康档案与数据挖掘技术研究[J].计算机技术与发展,2013,(06):175.
 ZHU Wen-hua[],ZHAO Peng-peng[].Research on Resident Health Record and Data Mining Technology Based on SOA[J].,2013,(07):175.

备注/Memo

备注/Memo:
李烈彪(1948-),男,重庆人,副教授,硕士生导师,研究方向为建筑智能化、计算机控制
更新日期/Last Update: 1900-01-01