[1]袁浩 黄烟波.网页标题分析对主题爬虫的改进[J].计算机技术与发展,2009,(06):22-24.
 YUAN Hao,HUANG Yan-bo.Analysis of Title Page to Improve Focus Crawler[J].,2009,(06):22-24.
点击复制

网页标题分析对主题爬虫的改进()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2009年06期
页码:
22-24
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Analysis of Title Page to Improve Focus Crawler
文章编号:
1673-629X(2009)06-0022-03
作者:
袁浩 黄烟波
中南大学信息科学与工程学院
Author(s):
YUAN Hao HUANG Yan-bo
School of Information Science and Engineering, Central South University
关键词:
网页标题分析Web结构挖掘主题爬虫主题相关度语义分析
Keywords:
analysis of title page web structure mining focus crawler related degree semantic analysis
分类号:
TP393
文献标志码:
A
摘要:
随着网络信息资源的爆发式增长,现有的搜索引擎已经无法满足迅速获取准确信息的需要,为搜索引擎引入搜索内容更为精确的主题爬虫显得十分迫切。然而目前的主题爬虫所采用的两种基本抓取网页的方式效率比较低下。提出了一种通过网页标题分析对主题爬虫的改进方案,比较了引入标题分析前后的结果,论证了设计的可行性与可操作性,优化了主题爬虫对同类型特定信息的抓取
Abstract:
With explosive growth of the network information resources,the existing search engines have been unable to meet the rapid demand to get accurate information. It's an urgent needed for the search engines to introduce a focus crawler to search the contents

相似文献/References:

[1]周勇 刘锋.基于粗糙集的Web结构挖掘[J].计算机技术与发展,2008,(03):151.
 ZHOU Yong,LIU Feng.Web Structure Mining Based on Rough Set Theory[J].,2008,(06):151.
[2]李莹 吴晓军.基于最大流及页面相似度的Web结构挖掘[J].计算机技术与发展,2011,(10):112.
 LI Ying,WU Xiao-jun.Web Structure Mining Based on Maximum Flow and Page Similar Value[J].,2011,(06):112.

备注/Memo

备注/Memo:
袁浩(1983-),男,湖南邵阳人,硕士研究生,研究方向为数据挖掘;黄烟波,教授,研究方向为计算机网络和现代教育技术。
更新日期/Last Update: 1900-01-01