[1]徐慧 杨学兵.基于本体相似度的中文科研论文信息抽取[J].计算机技术与发展,2008,(12):203-206.
 XU Hui,YANG Xue-bing.Information Extraction from Chinese Research Papers Based on Ontology Similarity[J].,2008,(12):203-206.
点击复制

基于本体相似度的中文科研论文信息抽取()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2008年12期
页码:
203-206
栏目:
应用开发研究
出版日期:
1900-01-01

文章信息/Info

Title:
Information Extraction from Chinese Research Papers Based on Ontology Similarity
文章编号:
1673-629X(2008)12-0203-04
作者:
徐慧 杨学兵
安徽工业大学计算机学院
Author(s):
XU Hui YANG Xue-bing
School of Computer, Anhui University of Technology
关键词:
信息抽取本体相似度语义推理主动学习
Keywords:
information extraction ontology similarity semantic reasoning active learning
分类号:
TP18
文献标志码:
A
摘要:
随着大量的科研论文出现在互联网上,从中精确地抽取论文头部信息和引文信息显得十分重要。提出了基于本体相似度的信息抽取方法,该方法的关键在于用本体相似度判定某个行本体是正例还是反例,然后通过主动学习选择最有可能包含抽取信息的行本体集,再充分利用本体的语义推理能力找到正确的片断。从论文中提取头部信息和引文信息为进一步的语义检索和语义存储奠定基础。测试数据集的实验结果显示该方法比其他方法具有较高的准确率
Abstract:
Information extraction from Chinese research papers based on ontology similarity abstract as many research papers appear on the Intemet, it becomes more and more important to extract paper header information and citations accurately from these papers. Pre

相似文献/References:

[1]秦振海 谭守标 徐超.基于Web的表格信息抽取研究[J].计算机技术与发展,2010,(02):217.
 QIN Zhen-hai,TAN Shou-biao,XU Chao.Study on ,Tables Information Extraction Based on Web[J].,2010,(12):217.
[2]韩普 姜杰.HMM在自然语言处理领域中的应用研究[J].计算机技术与发展,2010,(02):245.
 HAN Pu,JIANG Jie.Application and Research of Hidden Markov Model in Natural Language Processing Domain[J].,2010,(12):245.
[3]胡国晴 李建华.一种基于可信度分析的Web页面新属性发现方法[J].计算机技术与发展,2009,(01):56.
 HU Guo-qing,LI Jian-hua.A Credibility Analysis- Based Method to Discover New Attributes Web Pages[J].,2009,(12):56.
[4]李宏伟 史培中 张素智.一种高效Web数据抽取包装器的设计与实现[J].计算机技术与发展,2009,(02):123.
 LI Hong-wei,SHI Pei-zhong,ZHANG Su-zhi.Design and Implementation of an Efficient Wrapper for Web Data Extraction[J].,2009,(12):123.
[5]赵金仿 赵艳 缪建明.网页信息抽取及其自动文本分类的实现[J].计算机技术与发展,2008,(10):37.
 ZHAO Jin-fang,ZHAO Yan,MIAO Jian-ming.Extraction of Homepage Text Information and Realization of Text Automatic Categorization[J].,2008,(12):37.
[6]崔阳 吴爱华.一种面向B2B垂直搜索的网页信息去噪方法[J].计算机技术与发展,2008,(12):70.
 CUI Yang,WU Ai-hua.A Method of Eliminating Noisy Information in Web Pages Oriented B2B Vertical Searching[J].,2008,(12):70.
[7]仲华 崔志明.基于XML的信息抽取和多层向量空间技术研究[J].计算机技术与发展,2007,(07):49.
 ZHONG Hua,CUI Zhi-ming.Research on Information Extraction and Multilayer Vector Space Based on XML Technology[J].,2007,(12):49.
[8]陈静 朱巧明 贡正仙.基于Ontology的信息抽取研究综述[J].计算机技术与发展,2007,(10):84.
 CHEN Jing,ZHU Qiao-ming,GONG Zheng-xian.Overview of Ontology - Based Information Extraction[J].,2007,(12):84.
[9]邹腊梅 肖基毅 龚向坚.基于Maximum Likelihood与HMM的文本挖掘[J].计算机技术与发展,2007,(12):110.
 ZOU La-mei,XIAO Ji-yi,GONG Xiang-jian.Text Information Mining Based on Maximum Likelihood and Hidden Markov Model[J].,2007,(12):110.
[10]杨红超 肖基毅.基于HMM/BP混合模型的文本信息抽取研究[J].计算机技术与发展,2011,(05):115.
 YANG Hong-chao,XIAO Ji-yi.Text Information Extraction Research Based on HMM and BP Network Hybrid Model[J].,2011,(12):115.

备注/Memo

备注/Memo:
安徽省自然科学基金重点资助项目(2004KJ053ZD)徐慧(1982-),女,安徽巢湖人,硕士研究生,研究方向为本体与信息抽取;杨学兵,教授,研究方向为数据挖掘
更新日期/Last Update: 1900-01-01