[1]张高胤 谭成翔 汪海航.基于K-近邻算法的网页自动分类系统的研究及实现[J].计算机技术与发展,2007,(01):21-23.
 ZHANG Gao-yin,TAN Cheng-xiang,WANG Hai-hang.Design and Implementation of Web Page Automation Classification System Based on K- Nearest Neighbor Algorithm[J].,2007,(01):21-23.
点击复制

基于K-近邻算法的网页自动分类系统的研究及实现()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2007年01期
页码:
21-23
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Design and Implementation of Web Page Automation Classification System Based on K- Nearest Neighbor Algorithm
文章编号:
1673-629X(2007)01-0021-03
作者:
张高胤 谭成翔 汪海航
同济大学
Author(s):
ZHANG Gao-yin TAN Cheng-xiangWANG Hai-hang
Tongji University
关键词:
K-近邻算法机器学习网页分类
Keywords:
K- nearest neighbors algorithrmmachine learningWeb pages automation classification
分类号:
TP301.6
文献标志码:
A
摘要:
随着网络信息量的爆炸式增长,人们查找信息越来越难。Web搜索引擎的出现在一定程度上解决了这种矛盾。然而现行的搜索引擎无法根据用户所指定的主题进行针对性的搜索,因此,必须在搜索后对结果是否属于目标主题进行判断,以提高搜索的准确性,文中提出了一种基于K-近邻机器学习算法的信息自动分类的方法,能够对搜索到的网页自动地判定是否属于目标主题,并在实验的基础上验证了其在提高搜索准确性上的作用
Abstract:
The capacity of information in the network is growing like explosion, and it is much harder for people to find information that they want to precisely and quickly. The appearance of Web search engine resolves that problem in some level. However the popular search engine nowadays can not search in a special category. To improve the accuracy of search, decisions for whether a Web page belongs to the target category needs to be made automatically. Introduce a Web page automation classification method based on one of machine learning algorithm named K- nearest neighbors(KNN) algorithm, which can be used to decide if a Web page is relative to a special category. This page also proved the improvement of this method by experiments

相似文献/References:

[1]陈全 赵文辉 李洁 江雨燕.选择性集成学习算法的研究[J].计算机技术与发展,2010,(02):87.
 CHEN Quan,ZHAO Wen-hui,LI Jie,et al.Research of Selective Ensemble Learning Algorithm[J].,2010,(01):87.
[2]黄秀丽 王蔚.SVM在非平衡数据集中的应用[J].计算机技术与发展,2009,(06):190.
 HUANG Xiu-li,WANG Wei.Application of SVM in Imbalances Dataset[J].,2009,(01):190.
[3]鲁晓南 接标.一种基于个性化邮件特征的反垃圾邮件系统[J].计算机技术与发展,2009,(08):155.
 LU Xiao-nan,JIE Biao.An Individual Anti- Spam Technology[J].,2009,(01):155.
[4]张苗 张德贤.多类支持向量机文本分类方法[J].计算机技术与发展,2008,(03):139.
 ZHANG Miao,ZHANG De-xian.Research on Text Categorization Based on. M- SVMs[J].,2008,(01):139.
[5]汤萍萍 王红兵.基于强化学习的Web服务组合[J].计算机技术与发展,2008,(03):142.
 TANG Ping-ping,WANG Hong-bing.Web Service Composition Based on Reinforcement -Learning[J].,2008,(01):142.
[6]杨雪洁 赵姝 张燕平.基于商空间理论的冬小麦产量预测和分析[J].计算机技术与发展,2008,(03):249.
 YANG Xue-jie,ZHAO Shu,ZHANG Yan-ping.Analysis on Winter Wheat Yield Based on Quotient Space Theory[J].,2008,(01):249.
[7]汤伟 程家兴 纪霞.一种基于概率推理的邮件过滤系统的研究与设计[J].计算机技术与发展,2008,(08):76.
 TANG Wei,CHENG Jia-xing,JI Xia.Research and Design of a Spam Filtering System Based on Probability Inference[J].,2008,(01):76.
[8]孙海虹 丁华福.基于模糊粗糙集的Web文本分类[J].计算机技术与发展,2010,(07):21.
 SUN Hai-hong,DING Hua-fu.Web Document Classification Based on Fuzzy-Rough Set[J].,2010,(01):21.
[9]汤伟 程家兴 纪霞.统计学理论在邮件分类中的应用研究[J].计算机技术与发展,2008,(12):231.
 TANG Wei,CHENG Jia-xing,JI Xia.Research and Design of a Spam Filtering System Based on Statistical Learning Theory[J].,2008,(01):231.
[10]常小红 张明.基于RBFN的交互式图像检索方法[J].计算机技术与发展,2007,(09):31.
 CHANG Xiao-hong,ZHANG Ming.An Interactive Image Retrieval Approach RBFN- Based[J].,2007,(01):31.

备注/Memo

备注/Memo:
张高胤(1981-),男,浙江嘉善人,硕士研究生,研究方向为计算机网络安全与电子商务;谭成翔,教授,研究员,博士,主要研究方向为计算机网络安全与电子商务;汪海航,教授,博士生导师,主要研究方向为电子商务、网络与信息安全
更新日期/Last Update: 1900-01-01