[1]黄玉明 廉成洋 毛宇光.基于启发式规则的Web信息抽取技术研究[J].计算机技术与发展,2009,(08):4-7.
 HUANG Yu-ming,LIAN Cheng-yang,MAO Yu-guang.Web Information Extraction Technology Research Based on Heuristic Rules[J].,2009,(08):4-7.
点击复制

基于启发式规则的Web信息抽取技术研究()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2009年08期
页码:
4-7
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Web Information Extraction Technology Research Based on Heuristic Rules
文章编号:
1673-629X(2009)08-0004-04
作者:
黄玉明1 廉成洋1 毛宇光12
[1]南京航空航天大学信息科学与技术学院[2]南京大学计算机软件新技术国家重点实验室
Author(s):
HUANG Yu-mingLIAN Cheng-yang MAO Yu-guang
[1]College of Information Science and Technology, Nanjing University of Aeronautics and Astronautics[2]State Key Laboratory for Novel Software Technology at Nanjing University
关键词:
Web信息抽取网页过滤启发式规则
Keywords:
Web information extraction Web clear heuristic rule
分类号:
TP311
文献标志码:
A
摘要:
随着Internet的发展,Web挖掘技术越来越重要,其中的Web信息抽取技术逐渐成为热点,逐渐成为Web挖掘技术的关键技术之一,对Web信息抽取技术的深入研究也为构建更好的面向主题的搜索引擎提供了思路。文中对Web信息抽取的现有技术以及现有技术存在的问题进行了详细的论述。根据Web信息抽取的原理,依据软件工程的观点对Web信息抽取技术提出了具有指导意义的8条启发式规则。在这些规则的指导下,着重阐述了Web信息抽取中的基于结构和内容的信息抽取。通过理论分析及相应的实验说明所提出的8条规则对Web信息抽取具
Abstract:
Web mining becomes more and more important along with the popularity of Intemet. Web information extraction is a hotspot, and becomes one of key technologies in Web mining, and it gives a solution to construct a better theme - oriented search engine. Desc

相似文献/References:

[1]张鑫 陈梅 王翰虎 王嫣然.基于视觉特征和领域本体的Web信息抽取[J].计算机技术与发展,2011,(02):58.
 ZHANG Xin,CHEN Mei,WANG Han-hu,et al.Visual Features and Domain Ontology-Based Web Information Extraction[J].,2011,(08):58.

备注/Memo

备注/Memo:
教育部计算机软件新技术国家重点实验室(南京大学)基金(A200711)毛宇光,副教授,博士后,硕士生导师,研究方向为数据库系统及理论,数据挖掘与数据仓库
更新日期/Last Update: 1900-01-01