[1]胡素君 李云.排序特征子集选取方法研究[J].计算机技术与发展,2010,(09):119-122.
 HU Su-jun,LI Yun.Research on Feature Subset Selection After Ranking[J].,2010,(09):119-122.
点击复制

排序特征子集选取方法研究()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2010年09期
页码:
119-122
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Research on Feature Subset Selection After Ranking
文章编号:
1673-629X(2010)09-0119-04
作者:
胡素君1 李云2
[1]南京邮电大学计算机技术研究所[2]南京邮电大学计算机学院
Author(s):
HU Su-junLI Yun
[1]Institute of Computer Technology,Nanjing University of Posts and Telecommunications[2]College of Computer,Nanjing University of Posts and Telecommunications
关键词:
特征选择排序指数熵模糊特征评价指标
Keywords:
feature selection ranking exponential entropy fuzzy feature evaluation index
分类号:
TP301
文献标志码:
A
摘要:
特征选择是机器学习和数据挖掘领域的一个关键问题。而对于高维数据,通常会利用特定的评价准则,获取原始特征的权重并进行排序。而如何从排序后的特征集中选择较优子集,仍然值得探讨。文中提出了一种简单的特征排序后子集选取的过滤器方法,基本思想就是将指数熵与模糊特征评价指标相结合,利用类似顺序前向选择的搜索策略,通过寻找模糊特征评价指标的变化曲线拐点,作为搜索的终止条件。通过理论分析以及在合成和基准的现实数据集上的实验表明该方法具有较好的性能
Abstract:
Feature selection is one of key problems in machine learning and data mining.As the high-dimensional data set,the features are always ranked based on the weights obtained from a specific evaluation criterion.However,it is still an open question for how to choose the optimal subset after ranking.In the paper,a simple method for subset selection based on exponential entropy,fuzzy feature evaluation index and sequential forward search strategy is presented,which belongs to filter model.And the experimental results on synthesis and benchmark data sets have shown its high performance

相似文献/References:

[1]刘利 何先平 袁文亮.股票趋势预测中Wrapper方法的研究与应用[J].计算机技术与发展,2010,(01):209.
 LIU Li,HE Xian-ping,YUAN Wen-liang.Research and Application of Wrapper Approach to Stock Trend Prediction[J].,2010,(09):209.
[2]黄炜 黄志华.一种基于遗传算法和SVM的特征选择[J].计算机技术与发展,2010,(06):21.
 HUANG Wei,HUANG Zhi-hua.Feature Selection Based on Genetic Algorithm and SVM[J].,2010,(09):21.
[3]张家柏 王小玲.基于聚类和二进制PSO的特征选择[J].计算机技术与发展,2010,(06):25.
 ZHANG Jia-bai,WANG Xiao-ling.A Novel Algorithm Based on K-Means Clustering and Binary Particle Swarm Optimization[J].,2010,(09):25.
[4]郭创 余谅.网格任务调度算法的研究[J].计算机技术与发展,2009,(06):5.
 GUO Chuang,YU Liang.Research on Algorithm for Tasks Scheduling in Grid[J].,2009,(09):5.
[5]冯甲策 叶明 王惠文.基于Gram—Schmidt过程的支持向量机降维方法[J].计算机技术与发展,2009,(11):7.
 FENG Jia-ce,YE Ming,WANG Hui-wen.Dimension Reduction Method of Support Vector Machine Based on Gram- Schmidt Process[J].,2009,(09):7.
[6]林伟 柳荣其 徐熙.邮件过滤中一种改进的特征选择方法研究[J].计算机技术与发展,2009,(01):84.
 LIN Wei,LIU Rong-qi,XU Xi.Improvement of Feature Selection Algorithm in Spam Filtering[J].,2009,(09):84.
[7]刘毅 张月琳.基于Agent的邮件过滤与个性化分类系统设计[J].计算机技术与发展,2009,(02):66.
 LIU Yi,ZHANG Yue-lin.Design of a Mail Filter and Personalized Classification System Based on Agent[J].,2009,(09):66.
[8]陈素萍 谢丽聪.一种文本特征选择方法的研究[J].计算机技术与发展,2009,(02):112.
 CHEN Su-ping,XIE Li-cong.Research on Document Feature Selection[J].,2009,(09):112.
[9]葛浩 杨传健[].基于分布计数的基数排序方法的研究[J].计算机技术与发展,2008,(02):122.
 GE Hao,YANG Chuan-jian.Research on Radix Sort Based on Distributing Counting Sort Method[J].,2008,(09):122.
[10]张超 吴小培.频域盲解卷积局限性分析及一种改进算法[J].计算机技术与发展,2008,(10):57.
 ZHANG Chao,WU Xiao-pei.Limitations of Frequency- Domain Blind Deconvolution and an Improved Algorithm[J].,2008,(09):57.

备注/Memo

备注/Memo:
江苏省自然科学基金(08KJB520008)胡素君(1973-),女,河南开封人,讲师,从事计算机网络、数据挖掘技术的教学与研究
更新日期/Last Update: 1900-01-01