[1]吴敏,张化朋,李雷.欠抽样和DEC相结合的不平衡数据分类算法[J].计算机技术与发展,2014,24(04):110-113.
 U Min,ZHANG Hua-peng,LI Lei.Classification Algorithm for Imbalanced Datasets Combined Undersampling with DEC[J].,2014,24(04):110-113.
点击复制

欠抽样和DEC相结合的不平衡数据分类算法()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
24
期数:
2014年04期
页码:
110-113
栏目:
智能、算法、系统工程
出版日期:
2014-04-30

文章信息/Info

Title:
Classification Algorithm for Imbalanced Datasets Combined Undersampling with DEC
文章编号:
1673-629X(2014)04-0110-04
作者:
吴敏张化朋李雷
南京邮电大学 理学院
Author(s):
U MinZHANG Hua-pengLI Lei
关键词:
不平衡数据集支持向量机预处理数据集欠抽样DEC
Keywords:
imbalanced datasetsSVMpreprocess datasetundersamplingDEC
分类号:
TP301.6
文献标志码:
A
摘要:
DEC算法是一种基于支持向量机的改进算法,但是研究表明,对于某些不平衡数据集,DEC分类器不能达到较高的少数类分类精度。针对这种情况,提出了一种基于欠抽样方法和DEC方法结合的新算法US-DEC来提高少数类分类精度。先用一个新的欠抽样方法来预处理数据集,再用DEC分类器训练处理过的数据集。通过在七个不平衡数据集上的仿真实验,比较了US-DEC算法和支持向量机,欠抽样方法以及DEC方法的分类性能。实验结果表明,在提高每类数据集的少数类分类精度上,US-DEC算法要优于其他算法。
Abstract:
Different Error Costs (DEC) was a modified algorithm based on Support Vector Machine (SVM),but for the some imbal-anced datasets,it may fail to reach high classification accuracy. In view of this condition,a new algorithm US-DEC based on the under-sampling combined with DEC was presented. In the algorithm,first a new undersampling method was used to preprocess the imbalanced datasets,then DEC classifier was trained on the processed imbalanced dataset. The experiments on seven UCI imbalanced datasets show that the generalization performance of US-DEC is compared with SVM,undersampling,and DEC,the results indicate that this algorithm outperforms all of them.

相似文献/References:

[1]李雷 张建民.一种改善的基于支持向量机的边缘检测算子[J].计算机技术与发展,2010,(03):125.
 LI Lei,ZHANG Jian-min.An Improved Edge Detector Using the Support Vector Machines[J].,2010,(04):125.
[2]陈俏 曹根牛 陈柳.支持向量机应用于大气污染物浓度预测[J].计算机技术与发展,2010,(01):247.
 CHEN Qiao,CAO Gen-niu,CHEN Liu.Application of Support Vector Machine to Atmospheric Pollution Prediction[J].,2010,(04):247.
[3]李晶 姚明海.基于支持向量机的语义图像分类研究[J].计算机技术与发展,2010,(02):75.
 LI Jing,YAO Ming-hai.Research of Semantic Image Classification Based on Support Vector Machine[J].,2010,(04):75.
[4]姜鹤 陈丽亚.SVM文本分类中一种新的特征提取方法[J].计算机技术与发展,2010,(03):17.
 JIANG He,CHEN Li-ya.A New Feature Selection Method in SVM Text Categorization[J].,2010,(04):17.
[5]曹庆璞 董淑福 罗赟骞.网络时延的混沌特性分析及预测[J].计算机技术与发展,2010,(04):43.
 CAO Qing-pu,DONG Shu-fu,LUO Yun-qian.Chaotic Analysis and Prediction of Internet Time- Delay[J].,2010,(04):43.
[6]路川 胡欣杰.区域航空市场航线客流量预测研究[J].计算机技术与发展,2010,(04):84.
 LU Chuan,HU Xin-jie.Analysis of Regional Airline Passenger Forecast Title[J].,2010,(04):84.
[7]黄炜 黄志华.一种基于遗传算法和SVM的特征选择[J].计算机技术与发展,2010,(06):21.
 HUANG Wei,HUANG Zhi-hua.Feature Selection Based on Genetic Algorithm and SVM[J].,2010,(04):21.
[8]孙秋凤.microRNA计算识别中的模式识别技术[J].计算机技术与发展,2010,(06):97.
 SUN Qiu-feng.Pattern Recognition Technology for MicroRNA Identification[J].,2010,(04):97.
[9]刘振岩 王勇 陈立平 马俊杰 陈天恩.基于SVM的农业智能决策Web服务的研究与实现[J].计算机技术与发展,2010,(06):213.
 LIU Zhen-yan,WANG Yong,CHEN Li-ping,et al.Research and Implementation of Intelligence Decision Web Services Based on SVM for Digital Agriculture[J].,2010,(04):213.
[10]王李冬.一种新的人脸识别算法[J].计算机技术与发展,2009,(05):147.
 WANG Li-dong.A New Algorithm of Face Recognition[J].,2009,(04):147.
[11]刘凌,郭剑,韩崇. 面向不平衡数据的模糊支持向量机[J].计算机技术与发展,2015,25(11):38.
  Fuzzy Support Vector Machine for Imbalanced Data[J].,2015,25(04):38.

更新日期/Last Update: 1900-01-01