[1]常红要 朱征宇.网页正文提取中与正文无关的图像清除技术[J].计算机技术与发展,2010,(07):17-20.
 CHANG Hong-yao,ZHU Zheng-yu.HTML Text Extraction Based on Independent Image Links Removal Technique[J].,2010,(07):17-20.
点击复制

网页正文提取中与正文无关的图像清除技术()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2010年07期
页码:
17-20
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
HTML Text Extraction Based on Independent Image Links Removal Technique
文章编号:
1673-629X(2010)07-0017-04
作者:
常红要 朱征宇
重庆大学计算机学院
Author(s):
CHANG Hong-yaoZHU Zheng-yu
College of Computer,Chongqing University
关键词:
吸引嵌入广告图像区域分块元素删除法
Keywords:
attraction embedding advertising images regional sub-block element delete method
分类号:
TP391.4
文献标志码:
A
摘要:
因为图像相比文字具有更强的表现力,站点的设计者在设计广告时考虑的首要问题是如何吸引用户的"眼球",所以通常网页中的广告通常都是以图像的形式嵌入到网页中。这使得在HTML网页正文提取中主要处理的就是广告图像。文中综合分析了网页中图像的特点,提出了区域分块的HTML元素删除法来清除网页中的广告等无关图像并提取网页正文。实验结果表明,所提出的区域分块的HTML元素删除法很好地解决了网页正文提取中图像处理问题
Abstract:
Because the images have a stronger than expressive writing,the site designers in the design of ads most important issue to consider is how to attract the user's"eye",it is usually the page the ads are usually in the form of images embedded in web pages.Th

相似文献/References:

[1]陶元芳,刘晓光.一种应用ARPSO优化RBF神经网络的方法[J].计算机技术与发展,2014,24(11):43.
 TAO Yuan-fang,LIU Xiao-guang. A Method of Optimizing Radial Basis Function Neural Network by ARPSO[J].,2014,24(07):43.
[2]张居晓. 嵌入式盲文单手输入系统设计与实现[J].计算机技术与发展,2015,25(01):183.
 ZHANG Ju-xiao. Design and Implementation of Embedded Input System of Braille by Using Single-hand[J].,2015,25(07):183.

备注/Memo

备注/Memo:
国家科技支撑计划课题(2007BAH08B04)常红要(1977-),男,河南许昌人,硕士生,研究方向为个性化服务;朱征字,博士,教授,CCF高级会员,研究方向为Web智能检索、电子商务
更新日期/Last Update: 1900-01-01