[1]董艳.数据预处理方法在移动通信行业中的应用[J].计算机技术与发展,2010,(11):225-228.
 DONG Yan.Application of Data Pre-processing Method in Mobile Telecommunication Industry[J].,2010,(11):225-228.
点击复制

数据预处理方法在移动通信行业中的应用()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2010年11期
页码:
225-228
栏目:
应用开发研究
出版日期:
1900-01-01

文章信息/Info

Title:
Application of Data Pre-processing Method in Mobile Telecommunication Industry
文章编号:
1673-629X(2010)11-0225-04
作者:
董艳
合肥工业大学管理学院
Author(s):
DONG Yan
School of Management,Hefei University of Technology
关键词:
数据预处理数据挖掘数据清洗多重插补缺失值
Keywords:
data pre-processing data mining data cleaning multiple imputation missing value
分类号:
TP274
文献标志码:
A
摘要:
解决数据本身的质量问题,以某移动通信用户离网原因分析及预测为主题及为数据挖掘模型处理出需要的数据是文章的主要目的。文中运用了数据预处理中,维规约,属性集成与构造,多重插补,离散化,规范化,数据抽样等方法来得到一个完整的、近似真实的数据集。针对所处理数据含有大量缺失值的特点,选取了插补的方法进行处理。包括方法的插补方法的选择,到最后使用多重插补方法对缺失数据进行修正。预处理后的数据应用到具体数据挖掘模型后提高了数据挖掘的效率,降低了数据挖掘复杂度
Abstract:
The main purpose of the article is solving the data quality,in order to pre-process data for data mining model customer churn analysis and prediction of a certain mobile telecommunication industry as a subject.The method used in the paper are:dimension reduction,integration and structural properties,multiple imputation,discretization,normalization,data sampling and other methods to get a complete,similar to the real data sets.In this paper,the processing of data containing a large number of missing values to the characteristics of the imputation methods for processing.It is including the method of imputation method of choice and using multiple imputation methods for missing data correction.The data after pre-processing applied to the data mining model improve the efficiency and reduce the complexity of data mining

相似文献/References:

[1]项响琴 汪彩梅.基于聚类高维空间算法的离群数据挖掘技术研究[J].计算机技术与发展,2010,(01):120.
 XIANG Xiang-qin,WANG Cai-mei.Study of Outlier Data Mining Based on CLIQUE Algorithm[J].,2010,(11):120.
[2]李雷 丁亚丽 罗红旗.基于规则约束制导的入侵检测研究[J].计算机技术与发展,2010,(03):143.
 LI Lei,DING Ya-li,LUO Hong-qi.Intrusion Detection Technology Research Based on Homing - Constraint Rule[J].,2010,(11):143.
[3]吉同路 柏永飞 王立松.住宅与房地产电子政务中数据挖掘的应用研究[J].计算机技术与发展,2010,(01):235.
 JI Tong-lu,BAI Yong-fei,WANG Li-song.Study and Application of Data Mining in E-government of House and Real Estate Industry[J].,2010,(11):235.
[4]杨静 张楠男 李建 刘延明 梁美红.决策树算法的研究与应用[J].计算机技术与发展,2010,(02):114.
 YANG Jing,ZHANG Nan-nan,LI Jian,et al.Research and Application of Decision Tree Algorithm[J].,2010,(11):114.
[5]赵裕啸 倪志伟 王园园 伍章俊.SQL Server 2005数据挖掘技术在证券客户忠诚度的应用[J].计算机技术与发展,2010,(02):229.
 ZHAO Yu-xiao,NI Zhi-wei,WANG Yuan-yuan,et al.Application of Data Mining Technology of SQL Server 2005 in Customer Loyalty Model in Securities Industry[J].,2010,(11):229.
[6]方杰 朱京红.日志挖掘中的数据预处理[J].计算机技术与发展,2010,(04):17.
 FANG Jie,ZHU Jing-hong.Data Pretreatment of Log Mining[J].,2010,(11):17.
[7]张笑达 徐立臻.一种改进的基于矩阵的频繁项集挖掘算法[J].计算机技术与发展,2010,(04):93.
 ZHANG Xiao-da,XU Li-zhen.An Advanced Frequent Itemsets Mining Algorithm Based on Matrix[J].,2010,(11):93.
[8]王爱平 王占凤 陶嗣干 燕飞飞.数据挖掘中常用关联规则挖掘算法[J].计算机技术与发展,2010,(04):105.
 WANG Ai-ping,WANG Zhan-feng,TAO Si-gan,et al.Common Algorithms of Association Rules Mining in Data Mining[J].,2010,(11):105.
[9]于飞 丁华福 姜伦.Web日志挖掘中数据预处理技术的研究[J].计算机技术与发展,2010,(05):47.
 YU Fei,DING Hua-fu,JIANG Lun.Research on Data Preprocessing Technology in Web Log Mining[J].,2010,(11):47.
[10]张广路 雷景生 吴兴惠.一种改进的Apriori关联规则挖掘算法(英文)[J].计算机技术与发展,2010,(06):84.
 ZHANG Guang-lu,LEI Jing-sheng,WU Xing-hui.An Improved Apriori Algorithm for Mining Association Rules[J].,2010,(11):84.
[11]葛育祥 熊励.整合文本挖掘的商务智能系统结构研究[J].计算机技术与发展,2009,(04):1.
 GE Yu-xiang,XIONG Li.System Structure Study of Business Intelligence Integrated Text Mining[J].,2009,(11):1.
[12]李烈彪 张海鹏 周亚峰.Web日志挖掘中数据预处理方法的研究[J].计算机技术与发展,2007,(07):45.
 LI Lie-biao,ZHANG Hai-peng,ZHOU Ya-feng.Data Preprocessing Method Research for Web Log Mining[J].,2007,(11):45.
[13]贺瑶,王文庆,薛飞.基于云计算的海量数据挖掘研究[J].计算机技术与发展,2013,(02):69.

备注/Memo

备注/Memo:
国家自然科学基金重点项目(70631003); 教育部博士点基金(200803590007)董艳(1982-),女,安徽合肥人,硕士生,研究方向为数据挖掘、数据库
更新日期/Last Update: 1900-01-01