[1]张鑫 陈梅 王翰虎 王嫣然.基于视觉特征和领域本体的Web信息抽取[J].计算机技术与发展,2011,(02):58-61.
 ZHANG Xin,CHEN Mei,WANG Han-hu,et al.Visual Features and Domain Ontology-Based Web Information Extraction[J].,2011,(02):58-61.
点击复制

基于视觉特征和领域本体的Web信息抽取()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2011年02期
页码:
58-61
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Visual Features and Domain Ontology-Based Web Information Extraction
文章编号:
1673-629X(2011)02-0058-04
作者:
张鑫 陈梅 王翰虎 王嫣然
贵州大学计算机科学与信息学院
Author(s):
ZHANG XinCHEN MeiWANG Han-huWANG Yan-ran
College of Computer Science and Information,Guizhou University
关键词:
视觉特征领域本体Web信息抽取路径学习启发式学习
Keywords:
visual features domain ontology Web information extraction path learning discovery learning
分类号:
TP391.4
文献标志码:
A
摘要:
为了解决网页信息的自动抽取,该文提出了一种基于视觉特征和领域本体的Web信息抽取算法。该算法以基于领域本体的信息抽取为基础,根据网页的视觉特征来准确划定信息抽取区域,然后结合DOM树技术和抽取路径的启发式学习,获得Web页面中信息项的抽取路径。通过信息项的抽取路径自动生成信息项的领域本体,通过信息项的领域本体解析出信息项的抽取规则。使用本算法来进行Web信息的抽取,具有查全率与查准率高、时间复杂度低、用户负担较轻和自动化程度高的特点
Abstract:
Put forward a Web information extraction algorithm based on visual features and domain ontology in order to solve the problem of Web information automatic extraction.This algorithm is on base of domain ontology-based Web page information extraction,according to the visual characteristics of the sample Web page to accurately delineated the area of information extraction,and get the Web page information item extraction path by combining DOM tree technology and extraction path heuristic learning.Through the domain ontology which is automatically generated by the extraction path,get the extraction rules of the information items.Using this algorithm for Web information extraction has many advantages,such as higher recall and precision rate,lower time complexity,lighter user burden and higher degree of automation

相似文献/References:

[1]拜战胜 徐德智 彭佳红 陈光仪.基于主题本体的信息采集模型研究[J].计算机技术与发展,2009,(10):102.
 BAI Zhan-sheng,XU De-zhi,PENG Jia-hong,et al.Research of a Model of Web Information Acquisition Based on Topic-Ontology[J].,2009,(02):102.
[2]刘燕玲 华庆一 郭晓娟.基于领域本体面向问题的需求分析与领域建模[J].计算机技术与发展,2007,(08):99.
 LIU Yan-ling,HUA Qing-yi,GUO Xiao-juan.An Ontology - Based, Problem - Oriented Requirements Analysis and Domain Modeling Method[J].,2007,(02):99.
[3]陈坚 何洁月.RDF可信度扩展在领域本体构建中的应用[J].计算机技术与发展,2006,(01):120.
 CHEN Jian,FIE Jie-yue.A Credibility Extension to RDF and Its Application for Domain- Ontology Building[J].,2006,(02):120.
[4]陈立峰 宋金玉 石坚.军事通信领域本体构建与分析[J].计算机技术与发展,2011,(07):90.
 CHEN Li-feng,SONG Jin-yu,SHI Jian.Specific Ontology Building and Analysis on Military Communication Domain[J].,2011,(02):90.
[5]张晓孪 王西锋.基于本体和相似图的概念语义相似度计算[J].计算机技术与发展,2011,(08):101.
 ZHANG Xiao-luan,WANG Xi-feng.Concept Semantic Similarity Computation Based on Ontology and Similar Graph[J].,2011,(02):101.
[6]易利涛 周肆清 丁长松.信息抽取中领域本体建模方法研究[J].计算机技术与发展,2011,(10):23.
 YI Li-tao,ZHOU Si-qing,DING Chang-song.Research on Modeling Method of Domain Ontology in Information Extraction[J].,2011,(02):23.
[7]马斌,柴智.基于领域本体的方剂知识获取与研究[J].计算机技术与发展,2013,(06):227.
 MA Bin,CHAI Zhi.Chinese Medicine Prescription Knowledge Acquisition and Research Based on Domain Ontology[J].,2013,(02):227.
[8]林培金,曹苏燕,应捷.基于领域本体的语义合成研究[J].计算机技术与发展,2013,(07):44.
 LIN Pei-jin[],CAO Su-yan[],YING Jie[].Research on Semantic Synthesis Based on Domain Ontology[J].,2013,(02):44.
[9]兰富菊,赵志弘,韩永国.基于领域本体的主观题自动评阅算法的研究[J].计算机技术与发展,2014,24(06):166.
 LAN Fu-ju,ZHAO Zhi-hong,HAN Yong-guo.Research on Subjective Machine Marking Algorithm Based on Domain Ontology[J].,2014,24(02):166.
[10]郑学伟. 基于知识管理的本体自动构建算法研究[J].计算机技术与发展,2014,24(12):64.
 ZHENG Xue-wei. Research on Ontology Automatic Construction Algorithm Based on Knowledge Management[J].,2014,24(02):64.

备注/Memo

备注/Memo:
贵州省2008年省级信息化专项基金项目(0830); 贵州省科技计划工业攻关基金项目(黔科合GY字[2008]3035)张鑫(1985-),男,山西怀仁人,硕士研究生,研究方向为信息安全;陈梅,副教授,硕士生导师,研究方向为数据库技术与软件工程;王翰虎,教授,硕士生导师,研究方向为数据库系统、分布式系统、面向对象方法
更新日期/Last Update: 1900-01-01