[1]胡国晴 李建华.一种基于可信度分析的Web页面新属性发现方法[J].计算机技术与发展,2009,(01):56-59.
 HU Guo-qing,LI Jian-hua.A Credibility Analysis- Based Method to Discover New Attributes Web Pages[J].,2009,(01):56-59.
点击复制

一种基于可信度分析的Web页面新属性发现方法()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2009年01期
页码:
56-59
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
A Credibility Analysis- Based Method to Discover New Attributes Web Pages
文章编号:
1673-629X(2009)01-0056-04
作者:
胡国晴 李建华
中南大学信息科学与工程学院
Author(s):
HU Guo-qing LI Jian-hua
School of Information Science and Engineering, Central South University
关键词:
可信度分装器信息抽取新属性发现
Keywords:
credibility wrapper information extraction new attributes discover
分类号:
TP39
文献标志码:
A
摘要:
分装器已经越来越多地应用到Web信息抽取中,但是当Web页面出现新的待抽取属性并且页面结构发生变化时,目前并没有一个完善的分装器能根据这种情况而做出相应调整从而抽取出新的属性信息。文中根据待抽取属性自身结构和内容的特点,通过定义一系列规则和证据,提出了一种基于可信度分析发现Web页面新属性的方法,并建立了该方法的模型。通过在实际网站中选取网页对本方法进行了实验分析,取得了较好的效果,具有现实可行性。
Abstract:
Although wrapper is applied to Web information extraction much more, when new attributes appear and the structure of Web pages is changed, there is no perfect wrapper to extract the new attributes information corresponding. Based on the attribute' own str

相似文献/References:

[1]胡健 罗家国 杨炳儒.基于信息扩张机制的意外规则处理新方法研究[J].计算机技术与发展,2008,(12):74.
 HU Jian,LUO Jia-guo,YANG Bing-ru.Research on Exceptional Rules Selecting and Comprehensibility Based on Information Increasing Mechanism[J].,2008,(01):74.
[2]方贤进 李龙澍 钟娟[].基于主观Bayes方法对Web使用挖掘的研究[J].计算机技术与发展,2007,(06):56.
 FANG Xian-jin,LI Long-shu,ZHONG Juan.Research on Web Usage Mining by Subjective Bayesian Approach[J].,2007,(01):56.
[3]丁卫平 管致锦 陈建平.基于程序设计主观题智能阅卷算法的应用研究[J].计算机技术与发展,2007,(11):205.
 DING Wei-ping,GUAN Zhi-jin,CHEN Jian-ping.Research and Application of Intelligent Assessment Algorithm Based on Programming Subjective Questions[J].,2007,(01):205.
[4]陈坚 何洁月.RDF可信度扩展在领域本体构建中的应用[J].计算机技术与发展,2006,(01):120.
 CHEN Jian,FIE Jie-yue.A Credibility Extension to RDF and Its Application for Domain- Ontology Building[J].,2006,(01):120.
[5]程玉胜 邓小光 江效尧.Apriori算法中频繁项集挖掘实现研究[J].计算机技术与发展,2006,(03):58.
 CHENG Yu-sheng,DENG Xiao-guang,JIANG Xiao-yao.Realization of Mining Frequent Itemsets Based on Apriori[J].,2006,(01):58.
[6]费稼轩 张涛 林为民 陈亚东 曾荣.基于动态可信度量的敏感信息安全控制模型[J].计算机技术与发展,2012,(05):237.
 FEI Jia-xuan,ZHANG Tao,LIN Wei-min,et al.Secure Control Model of Sensitive Information Based on Dynamic Trust Measurement[J].,2012,(01):237.
[7]雷智朋,裘杭萍,杨志才. Web服务调整策略研究[J].计算机技术与发展,2014,24(08):135.
 LEI Zhi-peng,QIU Hang-ping,YANG Zhi-cai. Research on Web Services Adjustment Strategy[J].,2014,24(01):135.
[8]胡致杰[][],杨成义[],胡羽沫[]. 模糊Petri网的研讨节点评价算法研究[J].计算机技术与发展,2017,27(03):91.
 HU Zhi-jie[][],YANG Cheng-yi[],HU Yu-mo[]. Investigation on Evaluation Algorithm for Argumentative Node of Fuzzy Petri Net[J].,2017,27(01):91.

备注/Memo

备注/Memo:
胡国睛(1982-),男,湖南邵阳人,硕士研究生,研究方向为web信息抽取、垂直搜索引擎;李建华,教授,研究方向为分布式计算、软件工程
更新日期/Last Update: 1900-01-01