[1]龙珑,邓伟,覃晓.绿色网络PDF提取系统[J].计算机技术与发展,2014,24(01):204-207.
 LONG Long[],DENG Wei[],QIN Xiao[].PDF Extraction System of Green Network[J].,2014,24(01):204-207.
点击复制

绿色网络PDF提取系统()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
24
期数:
2014年01期
页码:
204-207
栏目:
应用开发研究
出版日期:
2014-01-31

文章信息/Info

Title:
PDF Extraction System of Green Network
文章编号:
1673-629X(2014)01-0204-04
作者:
龙珑1邓伟2覃晓1
[1]广西师范学院 计算机与信息学院;[2]广西肿瘤防治研究所
Author(s):
LONG Long[1]DENG Wei[2]QIN Xiao[1]
关键词:
绿色网络自动机提取信息不良内容PDF过滤
Keywords:
green networkautomataextracting informationundesirable PDF filter
分类号:
TP311
文献标志码:
A
摘要:
随着信息技术迅猛发展,很多不良信息与文化通过PDF文档传播,而传统的提取PDF内容的方法无法适应绿色网络提供优质内容并过滤不良PDF的社会需求。文中提出通过建立层次关键字自动机快速提取PDF内容并过滤不良PDF内容的方法。在提取准确性基本相同的情况下,文中方法提升了绿色网络系统提取PDF文档的速度,所用的时间仅为PDFBox方法的16%~36%,并能提供更好地过滤不良PDF的服务。
Abstract:
With the rapid growth of Internet,a lot of unhealthy information and culture spread through the PDF file,traditional PDF ex-traction algorithm cannot adapt to the requirement of green network to provide quality content and filter undesirable PDF. A new method that extracts PDF content and filters undesirable PDF through establishing keyword automata is proposed. With the approximately equal extraction accuracy,the new method can enhance the speed of the green network system to extract the PDF document,the extraction time is only 16% to 36% of PDFBox,and provide better service to filter undesirable PDF file.

相似文献/References:

[1]胡文江 高永兵 樊瑞民 张健.基于Web服务的工作流执行优化方法探讨[J].计算机技术与发展,2009,(06):156.
 HU Wen-jiang,GAO Yong-bing,FAN Rui-min,et al.Research of Workflow Optimal Strategy Based on Web Services[J].,2009,(01):156.
[2]张帅 贾珈 杨大利 徐明星 蔡莲红.方言转换系统中的音节切分算法研究[J].计算机技术与发展,2009,(07):41.
 ZHANG Shuai,JIA Jia,YANG Da-li,et al.Speech Syllable Segmentation Algorithm Research in Dialect Conversion System[J].,2009,(01):41.
[3]牛冀平[] 胡志华[] 余志超[].可扩展XML文本数据自动分析研究与实现[J].计算机技术与发展,2006,(03):8.
 NIU Ji-ping,HU Zhi-hua,YU Zhi-chao.Research and Implementation of XML Text Data Automatic Analysis[J].,2006,(01):8.
[4]龙珑 宁德鹏 宁葵.启发式规则网页主题定位方法绿网系统的应用[J].计算机技术与发展,2011,(10):226.
 LONG Long,NING De-peng,NING Kui.Approach of Subject Information Location Based on Heuristic Rules Applying in Green Network[J].,2011,(01):226.
[5]段惠超,王丽侠,潘旭[],等.入侵检测系统中的带权模式匹配算法[J].计算机技术与发展,2014,24(02):160.
 DUAN Hui-chao[],WANG Li-xia[],PAN Xu[],et al.Weighted Patterns Matching Algorithms in IDS[J].,2014,24(01):160.
[6]陈文清,孟庆民,杜 鹏,等.无连接区域覆盖的绿色网格网与数字孪生验证[J].计算机技术与发展,2024,34(04):109.[doi:10. 3969 / j. issn. 1673-629X. 2024. 04. 017]
 CHEN Wen-qing,MENG Qing-min,DU Peng,et al.Green Mesh Networks for Unconnected Area Coverage and Proof of Digital Twins[J].,2024,34(01):109.[doi:10. 3969 / j. issn. 1673-629X. 2024. 04. 017]

更新日期/Last Update: 1900-01-01