[1]孙海虹 丁华福.基于模糊粗糙集的Web文本分类[J].计算机技术与发展,2010,(07):21-24.
 SUN Hai-hong,DING Hua-fu.Web Document Classification Based on Fuzzy-Rough Set[J].,2010,(07):21-24.
点击复制

基于模糊粗糙集的Web文本分类()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2010年07期
页码:
21-24
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Web Document Classification Based on Fuzzy-Rough Set
文章编号:
1673-629X(2010)07-0021-04
作者:
孙海虹 丁华福
哈尔滨理工大学计算机科学与技术系
Author(s):
SUN Hai-hongDING Hua-fu
Department of Computer Science and Technology of Harbin University of Scinece andTechnology
关键词:
机器学习模糊粗糙集Web文本分类属性约简
Keywords:
machine learning fuzzy-rough set web document classification attribution reduction
分类号:
TP301
文献标志码:
A
摘要:
网络信息的多样性和多变性给信息的管理和过滤带来极大困难,为加快网络信息的分类速度和分类精度,提出了一种基于模糊粗糙集的Web文本分类方法。采用机器学习的方法:在训练阶段,首先对Web文本信息预处理,用向量空间模型表示文本,生成初始特征属性空间,并进行权值计算;然后用模糊粗糙集算法来进行信息过滤,用基于模糊粗糙集的属性约简算法生成分类规则;最后利用知识库进行文档分类。在测试阶段,对未经预处理的文本直接进行关键属性匹配,经模糊粗糙因子加权后,用空间距离法分类。通过试验比较,该方法具有较好的分类效果
Abstract:
The diversity and variability of network information brings great difficulty to information management and information filtering.Put forward a method to Web document classification based on fuzzy-rough set in order to improve the speed and accuracy of net

相似文献/References:

[1]陈全 赵文辉 李洁 江雨燕.选择性集成学习算法的研究[J].计算机技术与发展,2010,(02):87.
 CHEN Quan,ZHAO Wen-hui,LI Jie,et al.Research of Selective Ensemble Learning Algorithm[J].,2010,(07):87.
[2]黄秀丽 王蔚.SVM在非平衡数据集中的应用[J].计算机技术与发展,2009,(06):190.
 HUANG Xiu-li,WANG Wei.Application of SVM in Imbalances Dataset[J].,2009,(07):190.
[3]鲁晓南 接标.一种基于个性化邮件特征的反垃圾邮件系统[J].计算机技术与发展,2009,(08):155.
 LU Xiao-nan,JIE Biao.An Individual Anti- Spam Technology[J].,2009,(07):155.
[4]张苗 张德贤.多类支持向量机文本分类方法[J].计算机技术与发展,2008,(03):139.
 ZHANG Miao,ZHANG De-xian.Research on Text Categorization Based on. M- SVMs[J].,2008,(07):139.
[5]汤萍萍 王红兵.基于强化学习的Web服务组合[J].计算机技术与发展,2008,(03):142.
 TANG Ping-ping,WANG Hong-bing.Web Service Composition Based on Reinforcement -Learning[J].,2008,(07):142.
[6]杨雪洁 赵姝 张燕平.基于商空间理论的冬小麦产量预测和分析[J].计算机技术与发展,2008,(03):249.
 YANG Xue-jie,ZHAO Shu,ZHANG Yan-ping.Analysis on Winter Wheat Yield Based on Quotient Space Theory[J].,2008,(07):249.
[7]汤伟 程家兴 纪霞.一种基于概率推理的邮件过滤系统的研究与设计[J].计算机技术与发展,2008,(08):76.
 TANG Wei,CHENG Jia-xing,JI Xia.Research and Design of a Spam Filtering System Based on Probability Inference[J].,2008,(07):76.
[8]汤伟 程家兴 纪霞.统计学理论在邮件分类中的应用研究[J].计算机技术与发展,2008,(12):231.
 TANG Wei,CHENG Jia-xing,JI Xia.Research and Design of a Spam Filtering System Based on Statistical Learning Theory[J].,2008,(07):231.
[9]张高胤 谭成翔 汪海航.基于K-近邻算法的网页自动分类系统的研究及实现[J].计算机技术与发展,2007,(01):21.
 ZHANG Gao-yin,TAN Cheng-xiang,WANG Hai-hang.Design and Implementation of Web Page Automation Classification System Based on K- Nearest Neighbor Algorithm[J].,2007,(07):21.
[10]常小红 张明.基于RBFN的交互式图像检索方法[J].计算机技术与发展,2007,(09):31.
 CHANG Xiao-hong,ZHANG Ming.An Interactive Image Retrieval Approach RBFN- Based[J].,2007,(07):31.

备注/Memo

备注/Memo:
国家自然科学基金重点项目(60736014)孙海虹(1984-),女,硕士,研究方向为机器学习、文本分类丁华福,研究员,研究方向为机器学习
更新日期/Last Update: 1900-01-01