«上一篇/Previous Article|本期目录/Table of Contents|下一篇/Next Article»

[1]徐慧杨学兵.基于本体相似度的中文科研论文信息抽取[J].计算机技术与发展,2008,(12):203-206.
　XU Hui,YANG Xue-bing.Information Extraction from Chinese Research Papers Based on Ontology Similarity[J].,2008,(12):203-206.
点击复制

基于本体相似度的中文科研论文信息抽取()

分享到：

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:: 2008年12期

页码:: 203-206

栏目:: 应用开发研究

出版日期:: 1900-01-01

文章信息/Info

Title:: Information Extraction from Chinese Research Papers Based on Ontology Similarity

文章编号:: 1673-629X（2008）12-0203-04

作者:: 徐慧杨学兵; 安徽工业大学计算机学院

Author(s):: XU Hui; YANG Xue-bing; School of Computer, Anhui University of Technology

关键词:: 信息抽取; 本体相似度; 语义推理; 主动学习

Keywords:: information extraction; ontology similarity; semantic reasoning; active learning

分类号:: TP18

文献标志码:: A

摘要:: 随着大量的科研论文出现在互联网上，从中精确地抽取论文头部信息和引文信息显得十分重要。提出了基于本体相似度的信息抽取方法，该方法的关键在于用本体相似度判定某个行本体是正例还是反例，然后通过主动学习选择最有可能包含抽取信息的行本体集，再充分利用本体的语义推理能力找到正确的片断。从论文中提取头部信息和引文信息为进一步的语义检索和语义存储奠定基础。测试数据集的实验结果显示该方法比其他方法具有较高的准确率

Abstract:: Information extraction from Chinese research papers based on ontology similarity abstract as many research papers appear on the Intemet, it becomes more and more important to extract paper header information and citations accurately from these papers. Pre

相似文献/References:

[1]秦振海谭守标徐超.基于Web的表格信息抽取研究[J].计算机技术与发展,2010,(02):217.
　QIN Zhen-hai,TAN Shou-biao,XU Chao.Study on ,Tables Information Extraction Based on Web[J].,2010,(12):217.
[2]韩普姜杰.HMM在自然语言处理领域中的应用研究[J].计算机技术与发展,2010,(02):245.
　HAN Pu,JIANG Jie.Application and Research of Hidden Markov Model in Natural Language Processing Domain[J].,2010,(12):245.
[3]胡国晴李建华.一种基于可信度分析的Web页面新属性发现方法[J].计算机技术与发展,2009,(01):56.
　HU Guo-qing,LI Jian-hua.A Credibility Analysis- Based Method to Discover New Attributes Web Pages[J].,2009,(12):56.
[4]李宏伟史培中张素智.一种高效Web数据抽取包装器的设计与实现[J].计算机技术与发展,2009,(02):123.
　LI Hong-wei,SHI Pei-zhong,ZHANG Su-zhi.Design and Implementation of an Efficient Wrapper for Web Data Extraction[J].,2009,(12):123.
[5]赵金仿赵艳缪建明.网页信息抽取及其自动文本分类的实现[J].计算机技术与发展,2008,(10):37.
　ZHAO Jin-fang,ZHAO Yan,MIAO Jian-ming.Extraction of Homepage Text Information and Realization of Text Automatic Categorization[J].,2008,(12):37.
[6]崔阳吴爱华.一种面向B2B垂直搜索的网页信息去噪方法[J].计算机技术与发展,2008,(12):70.
　CUI Yang,WU Ai-hua.A Method of Eliminating Noisy Information in Web Pages Oriented B2B Vertical Searching[J].,2008,(12):70.
[7]仲华崔志明.基于XML的信息抽取和多层向量空间技术研究[J].计算机技术与发展,2007,(07):49.
　ZHONG Hua,CUI Zhi-ming.Research on Information Extraction and Multilayer Vector Space Based on XML Technology[J].,2007,(12):49.
[8]陈静朱巧明贡正仙.基于Ontology的信息抽取研究综述[J].计算机技术与发展,2007,(10):84.
　CHEN Jing,ZHU Qiao-ming,GONG Zheng-xian.Overview of Ontology - Based Information Extraction[J].,2007,(12):84.
[9]邹腊梅肖基毅龚向坚.基于Maximum Likelihood与HMM的文本挖掘[J].计算机技术与发展,2007,(12):110.
　ZOU La-mei,XIAO Ji-yi,GONG Xiang-jian.Text Information Mining Based on Maximum Likelihood and Hidden Markov Model[J].,2007,(12):110.
[10]杨红超肖基毅.基于HMM／BP混合模型的文本信息抽取研究[J].计算机技术与发展,2011,(05):115.
　YANG Hong-chao,XIAO Ji-yi.Text Information Extraction Research Based on HMM and BP Network Hybrid Model[J].,2011,(12):115.

备注/Memo

备注/Memo:: 安徽省自然科学基金重点资助项目（2004KJ053ZD）徐慧（1982-），女，安徽巢湖人，硕士研究生，研究方向为本体与信息抽取；杨学兵，教授，研究方向为数据挖掘

常用功能

工具/Tools

统计/Statistics

摘要浏览/Viewed1831
全文下载/Downloads542
评论/Comments

更新日期/Last Update: 1900-01-01