«上一篇/Previous Article|本期目录/Table of Contents|下一篇/Next Article»

[1]崔阳吴爱华.一种面向B2B垂直搜索的网页信息去噪方法[J].计算机技术与发展,2008,(12):70-73.
　CUI Yang,WU Ai-hua.A Method of Eliminating Noisy Information in Web Pages Oriented B2B Vertical Searching[J].,2008,(12):70-73.
点击复制

一种面向B2B垂直搜索的网页信息去噪方法()

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:: 2008年12期

页码:: 70-73

栏目:: 智能、算法、系统工程

出版日期:: 1900-01-01

文章信息/Info

Title:: A Method of Eliminating Noisy Information in Web Pages Oriented B2B Vertical Searching

文章编号:: 1673-629X（2008）12-0070-04

作者:: 崔阳¹; 2 吴爱华²; [1]北京科技大学信息工程学院[2]九城网络技术集团有限公司

Author(s):: CUI Yang; WU Ai-hua; [1]Department of Computer Science,Beijing University of Science and Technology[2]Ninetowns Internet Technology Group Co. ,Ltd

关键词:: B2B垂直搜索引擎; 信息抽取; 去噪; 企业站点树

Keywords:: B2B vertical search engine; information extraction; noise elimination; corporation website tree

分类号:: TP393.09

文献标志码:: A

摘要:: B2B垂直搜索引擎是垂直搜索引擎在电子商务领域的应用。怎样更好地对互联网中海量的企业产品信息进行抽取和去噪，是当前B2B垂直搜索引擎构建中所面临的重要问题。介绍了B2B垂直搜索引擎的特征；分析了一般企业网站的基本结构，在此基础上提出一种面向B2B垂直搜索引擎的企业站点产品信息去噪方法；给出了该方法的实验结果。使用这种方法抽取到的产品信息可用于指导产品进一步的分类工作

Abstract:: B2B vertical search engine is a kind of vertical searching engines and used for E - business. Now it is an important issue that how to eliminate noise and extract useful manufacture information from corporation websites. The characters of B2B vertical sea

相似文献/References:

[1]秦振海谭守标徐超.基于Web的表格信息抽取研究[J].计算机技术与发展,2010,(02):217.
　QIN Zhen-hai,TAN Shou-biao,XU Chao.Study on ,Tables Information Extraction Based on Web[J].,2010,(12):217.
[2]韩普姜杰.HMM在自然语言处理领域中的应用研究[J].计算机技术与发展,2010,(02):245.
　HAN Pu,JIANG Jie.Application and Research of Hidden Markov Model in Natural Language Processing Domain[J].,2010,(12):245.
[3]胡国晴李建华.一种基于可信度分析的Web页面新属性发现方法[J].计算机技术与发展,2009,(01):56.
　HU Guo-qing,LI Jian-hua.A Credibility Analysis- Based Method to Discover New Attributes Web Pages[J].,2009,(12):56.
[4]李宏伟史培中张素智.一种高效Web数据抽取包装器的设计与实现[J].计算机技术与发展,2009,(02):123.
　LI Hong-wei,SHI Pei-zhong,ZHANG Su-zhi.Design and Implementation of an Efficient Wrapper for Web Data Extraction[J].,2009,(12):123.
[5]赵金仿赵艳缪建明.网页信息抽取及其自动文本分类的实现[J].计算机技术与发展,2008,(10):37.
　ZHAO Jin-fang,ZHAO Yan,MIAO Jian-ming.Extraction of Homepage Text Information and Realization of Text Automatic Categorization[J].,2008,(12):37.
[6]徐慧杨学兵.基于本体相似度的中文科研论文信息抽取[J].计算机技术与发展,2008,(12):203.
　XU Hui,YANG Xue-bing.Information Extraction from Chinese Research Papers Based on Ontology Similarity[J].,2008,(12):203.
[7]仲华崔志明.基于XML的信息抽取和多层向量空间技术研究[J].计算机技术与发展,2007,(07):49.
　ZHONG Hua,CUI Zhi-ming.Research on Information Extraction and Multilayer Vector Space Based on XML Technology[J].,2007,(12):49.
[8]陈静朱巧明贡正仙.基于Ontology的信息抽取研究综述[J].计算机技术与发展,2007,(10):84.
　CHEN Jing,ZHU Qiao-ming,GONG Zheng-xian.Overview of Ontology - Based Information Extraction[J].,2007,(12):84.
[9]邹腊梅肖基毅龚向坚.基于Maximum Likelihood与HMM的文本挖掘[J].计算机技术与发展,2007,(12):110.
　ZOU La-mei,XIAO Ji-yi,GONG Xiang-jian.Text Information Mining Based on Maximum Likelihood and Hidden Markov Model[J].,2007,(12):110.
[10]杨红超肖基毅.基于HMM／BP混合模型的文本信息抽取研究[J].计算机技术与发展,2011,(05):115.
　YANG Hong-chao,XIAO Ji-yi.Text Information Extraction Research Based on HMM and BP Network Hybrid Model[J].,2011,(12):115.

备注/Memo

备注/Memo:: 国家自然科学基金（60675030）崔阳（1979-），男，博士研究生，研究方向为知识发现

常用功能

工具/Tools

统计/Statistics

摘要浏览/Viewed1808
全文下载/Downloads609
评论/Comments

更新日期/Last Update: 1900-01-01