[1]黄秀丽 王蔚.SVM在非平衡数据集中的应用[J].计算机技术与发展,2009,(06):190-193.
 HUANG Xiu-li,WANG Wei.Application of SVM in Imbalances Dataset[J].,2009,(06):190-193.
点击复制

SVM在非平衡数据集中的应用()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2009年06期
页码:
190-193
栏目:
应用开发研究
出版日期:
1900-01-01

文章信息/Info

Title:
Application of SVM in Imbalances Dataset
文章编号:
1673-629X(2009)06-0190-04
作者:
黄秀丽 王蔚
南京师范大学教育科学学院
Author(s):
HUANG Xiu-li WANG Wei
School of Education, Nanjing Normal University
关键词:
非平衡数据SVM机器学习
Keywords:
imbalances data SVM machine learning
分类号:
TP181
文献标志码:
A
摘要:
在一个数据集中,至少有一个类别相对与其他类别有很少的样本,则这样数据集可以称为高度倾斜的或者是非平衡的数据集,非平衡数据在现实中普遍存在。在非平衡数据分类中.传统机器学习算法的分类表现受到了阻碍。支持向量机(SVM)基于结构风险最小化原则,是近几年发展起来的机器学习方法。分析了SVM在非平衡数据集中的应用情况,同时提出了几种SVM运用于非平衡数据集中的主要改进方法,这些方法对于非平衡数据的分类有很好的分类效果
Abstract:
A training data.set is called imbalance if at least one of the classes are represented by significantly less number of instances than the others. The class imbalance problem occurs when there is significantly less number of observations of the target conc

相似文献/References:

[1]陈全 赵文辉 李洁 江雨燕.选择性集成学习算法的研究[J].计算机技术与发展,2010,(02):87.
 CHEN Quan,ZHAO Wen-hui,LI Jie,et al.Research of Selective Ensemble Learning Algorithm[J].,2010,(06):87.
[2]鲁晓南 接标.一种基于个性化邮件特征的反垃圾邮件系统[J].计算机技术与发展,2009,(08):155.
 LU Xiao-nan,JIE Biao.An Individual Anti- Spam Technology[J].,2009,(06):155.
[3]张苗 张德贤.多类支持向量机文本分类方法[J].计算机技术与发展,2008,(03):139.
 ZHANG Miao,ZHANG De-xian.Research on Text Categorization Based on. M- SVMs[J].,2008,(06):139.
[4]汤萍萍 王红兵.基于强化学习的Web服务组合[J].计算机技术与发展,2008,(03):142.
 TANG Ping-ping,WANG Hong-bing.Web Service Composition Based on Reinforcement -Learning[J].,2008,(06):142.
[5]杨雪洁 赵姝 张燕平.基于商空间理论的冬小麦产量预测和分析[J].计算机技术与发展,2008,(03):249.
 YANG Xue-jie,ZHAO Shu,ZHANG Yan-ping.Analysis on Winter Wheat Yield Based on Quotient Space Theory[J].,2008,(06):249.
[6]汤伟 程家兴 纪霞.一种基于概率推理的邮件过滤系统的研究与设计[J].计算机技术与发展,2008,(08):76.
 TANG Wei,CHENG Jia-xing,JI Xia.Research and Design of a Spam Filtering System Based on Probability Inference[J].,2008,(06):76.
[7]孙海虹 丁华福.基于模糊粗糙集的Web文本分类[J].计算机技术与发展,2010,(07):21.
 SUN Hai-hong,DING Hua-fu.Web Document Classification Based on Fuzzy-Rough Set[J].,2010,(06):21.
[8]汤伟 程家兴 纪霞.统计学理论在邮件分类中的应用研究[J].计算机技术与发展,2008,(12):231.
 TANG Wei,CHENG Jia-xing,JI Xia.Research and Design of a Spam Filtering System Based on Statistical Learning Theory[J].,2008,(06):231.
[9]张高胤 谭成翔 汪海航.基于K-近邻算法的网页自动分类系统的研究及实现[J].计算机技术与发展,2007,(01):21.
 ZHANG Gao-yin,TAN Cheng-xiang,WANG Hai-hang.Design and Implementation of Web Page Automation Classification System Based on K- Nearest Neighbor Algorithm[J].,2007,(06):21.
[10]常小红 张明.基于RBFN的交互式图像检索方法[J].计算机技术与发展,2007,(09):31.
 CHANG Xiao-hong,ZHANG Ming.An Interactive Image Retrieval Approach RBFN- Based[J].,2007,(06):31.

备注/Memo

备注/Memo:
全国教行科学“十五”规划教育部重点基金项目(DCA050056);江苏省教育科学“十一五”规划项目(D/2006/01/096)黄秀丽(1986-),女,硕士研究生,研究方向为机器学习与数据挖掘;王蔚,博士,教授,研究方向为机器学习与数据挖掘、信号处理等。
更新日期/Last Update: 1900-01-01