[1]崔阳 吴爱华.一种面向B2B垂直搜索的网页信息去噪方法[J].计算机技术与发展,2008,(12):70-73.
 CUI Yang,WU Ai-hua.A Method of Eliminating Noisy Information in Web Pages Oriented B2B Vertical Searching[J].,2008,(12):70-73.
点击复制

一种面向B2B垂直搜索的网页信息去噪方法()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2008年12期
页码:
70-73
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
A Method of Eliminating Noisy Information in Web Pages Oriented B2B Vertical Searching
文章编号:
1673-629X(2008)12-0070-04
作者:
崔阳12 吴爱华2
[1]北京科技大学信息工程学院[2]九城网络技术集团有限公司
Author(s):
CUI Yang WU Ai-hua
[1]Department of Computer Science,Beijing University of Science and Technology[2]Ninetowns Internet Technology Group Co. ,Ltd
关键词:
B2B垂直搜索引擎信息抽取去噪企业站点树
Keywords:
B2B vertical search engine information extraction noise elimination corporation website tree
分类号:
TP393.09
文献标志码:
A
摘要:
B2B垂直搜索引擎是垂直搜索引擎在电子商务领域的应用。怎样更好地对互联网中海量的企业产品信息进行抽取和去噪,是当前B2B垂直搜索引擎构建中所面临的重要问题。介绍了B2B垂直搜索引擎的特征;分析了一般企业网站的基本结构,在此基础上提出一种面向B2B垂直搜索引擎的企业站点产品信息去噪方法;给出了该方法的实验结果。使用这种方法抽取到的产品信息可用于指导产品进一步的分类工作
Abstract:
B2B vertical search engine is a kind of vertical searching engines and used for E - business. Now it is an important issue that how to eliminate noise and extract useful manufacture information from corporation websites. The characters of B2B vertical sea

相似文献/References:

[1]秦振海 谭守标 徐超.基于Web的表格信息抽取研究[J].计算机技术与发展,2010,(02):217.
 QIN Zhen-hai,TAN Shou-biao,XU Chao.Study on ,Tables Information Extraction Based on Web[J].,2010,(12):217.
[2]韩普 姜杰.HMM在自然语言处理领域中的应用研究[J].计算机技术与发展,2010,(02):245.
 HAN Pu,JIANG Jie.Application and Research of Hidden Markov Model in Natural Language Processing Domain[J].,2010,(12):245.
[3]胡国晴 李建华.一种基于可信度分析的Web页面新属性发现方法[J].计算机技术与发展,2009,(01):56.
 HU Guo-qing,LI Jian-hua.A Credibility Analysis- Based Method to Discover New Attributes Web Pages[J].,2009,(12):56.
[4]李宏伟 史培中 张素智.一种高效Web数据抽取包装器的设计与实现[J].计算机技术与发展,2009,(02):123.
 LI Hong-wei,SHI Pei-zhong,ZHANG Su-zhi.Design and Implementation of an Efficient Wrapper for Web Data Extraction[J].,2009,(12):123.
[5]赵金仿 赵艳 缪建明.网页信息抽取及其自动文本分类的实现[J].计算机技术与发展,2008,(10):37.
 ZHAO Jin-fang,ZHAO Yan,MIAO Jian-ming.Extraction of Homepage Text Information and Realization of Text Automatic Categorization[J].,2008,(12):37.
[6]徐慧 杨学兵.基于本体相似度的中文科研论文信息抽取[J].计算机技术与发展,2008,(12):203.
 XU Hui,YANG Xue-bing.Information Extraction from Chinese Research Papers Based on Ontology Similarity[J].,2008,(12):203.
[7]仲华 崔志明.基于XML的信息抽取和多层向量空间技术研究[J].计算机技术与发展,2007,(07):49.
 ZHONG Hua,CUI Zhi-ming.Research on Information Extraction and Multilayer Vector Space Based on XML Technology[J].,2007,(12):49.
[8]陈静 朱巧明 贡正仙.基于Ontology的信息抽取研究综述[J].计算机技术与发展,2007,(10):84.
 CHEN Jing,ZHU Qiao-ming,GONG Zheng-xian.Overview of Ontology - Based Information Extraction[J].,2007,(12):84.
[9]邹腊梅 肖基毅 龚向坚.基于Maximum Likelihood与HMM的文本挖掘[J].计算机技术与发展,2007,(12):110.
 ZOU La-mei,XIAO Ji-yi,GONG Xiang-jian.Text Information Mining Based on Maximum Likelihood and Hidden Markov Model[J].,2007,(12):110.
[10]杨红超 肖基毅.基于HMM/BP混合模型的文本信息抽取研究[J].计算机技术与发展,2011,(05):115.
 YANG Hong-chao,XIAO Ji-yi.Text Information Extraction Research Based on HMM and BP Network Hybrid Model[J].,2011,(12):115.

备注/Memo

备注/Memo:
国家自然科学基金(60675030)崔阳(1979-),男,博士研究生,研究方向为知识发现
更新日期/Last Update: 1900-01-01