[1]周合明 奚建清.基于模板的Web信息提取系统的设计与实现[J].计算机技术与发展,2011,(11):105-108.
 ZHOU He-ming,XI Jian-qing.Design and Realization of Template-Based Web Crawler[J].,2011,(11):105-108.
点击复制

基于模板的Web信息提取系统的设计与实现()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2011年11期
页码:
105-108
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Design and Realization of Template-Based Web Crawler
文章编号:
1673-629X(2011)11-0105-04
作者:
周合明 奚建清
华南理工大学软件学院
Author(s):
ZHOU He-mingXI Jian-qing
School of Software Engineering, South China University of Technology
关键词:
信息提取模板内嵌HSQL个性化搜索
Keywords:
extracting information template In-Process HSQL customized search
分类号:
TP31
文献标志码:
A
摘要:
随着Web上信息的迅速扩展,Web信息提取技术正应用于搜索引擎、用户兴趣挖掘以及个性化信息获取等多种应用和研究中。文中通过采用模板技术,设计并实现Web招聘信息提取系统。该系统根据已配置的模板,从各高校就业中心网站提取招聘信息,结构化并存入内嵌HSQL数据库中。基于已采集的信息,进行个性化搜索,找到用户所需招聘信息。试验结果表明,该系统能够完成信息的提取和个性化搜索,具有很好的实际效用。另外,由于该系统采用java和内嵌HSQLDB开发,具有高度的平台移植性和很好的移动便捷性
Abstract:
With information rapidly expanding in the Web,extracting information for Web page is applying many fields. Design and realize a Web Crawler by using template technology. This Crawler extracts information from employment online of college through configured templates, structure information and store in the In-Process HSQLDB. Based on information stored in.database, perform custom- ized search and find useful recruitment informatious for user. Experimental results show that this system is able to complete the extraction of recruitment information and customized search. This system has high practicability. In addition,the system is developed by java and In -Process HSQLDB, so has the high platform portability and very good convenience

相似文献/References:

[1]汪畅 王铮 张胜歧.基于动词属性的模板化自动代码生成[J].计算机技术与发展,2010,(05):104.
 WANG Chang,WANG Zheng,ZHANG Sheng-qi.Template Automatic Code Generation Based on Properties of the Verb[J].,2010,(11):104.
[2]徐白 宋玲 吴昊.JSP静态网页生成技术的研究[J].计算机技术与发展,2010,(06):175.
 XU Bai,SONG Ling,WU Hao.Research of Techniques of Static Web Pages in JSP[J].,2010,(11):175.
[3]黄晟 刘海韬.基于WHOIS建立IP位置系统实现P2P拓扑感知[J].计算机技术与发展,2009,(07):80.
 HUANG Sheng,LIU Hai-tao.Build IP Location System Using WHOIS for P2P Network Topology - Aware Routing[J].,2009,(11):80.
[4]周登 戴玉刚 付涛.基于树结构的Web信息抽取[J].计算机技术与发展,2009,(09):38.
 ZHOU Deng,DAI Yu-gang,FU Tao.Extracting Web Data Using Tree Structure[J].,2009,(11):38.
[5]袁晓征 毛宁 陈庆新 陈晨.一类经验性知识解释器的设计与实现[J].计算机技术与发展,2009,(10):242.
 YUAN Xiao-zheng,MAO Ning,CHEN Qing-xin,et al.Design and Realization of a Type of Interpreter for Experiential Knowledge[J].,2009,(11):242.
[6]朱佳婷 吕建平.抗旋转的整数小波变换数字水印算法[J].计算机技术与发展,2007,(07):145.
 ZHU Jia-ting,LU Jian-ping.Digital Watermarking Algorithm Resistant to Rotation Based on Integer Wavelet Transform[J].,2007,(11):145.
[7]鄢沛 郭皎 应宏.一个基于.NET的多线程信息提取框架[J].计算机技术与发展,2007,(12):96.
 YAN Pei,GUO Jiao,YING Hong.A . NET- Based Multithreaded Information Extraction Framework[J].,2007,(11):96.
[8]邓忠华 刘飞.印刷品缺陷检测的初步方案[J].计算机技术与发展,2006,(10):171.
 DENG Zhong-hua,LIU Fei.Preliminary Scheme for Defect Inspection of Printed Material[J].,2006,(11):171.
[9]谢莹 范冰冰 黄兴平.移动服务平台终端智能适配框架的研究[J].计算机技术与发展,2010,(12):133.
 XIE Ying,FAN Bing-bing,HUANG Xing-ping.Research on Intelligent Adapitve Terminal Framework Based on MSP[J].,2010,(11):133.
[10]刘旭勇.用例驱动技术在需求获取过程中的应用[J].计算机技术与发展,2012,(03):153.
 LIU Xu-yong.Use Cases Drive Technology Application in Requirements Elicitation Process[J].,2012,(11):153.

备注/Memo

备注/Memo:
广东省产学研结合项目(2009A09010035);广东省国际合作项目(2009BOS070000S);广东省科技工业攻关项目(20081309050019,2006880407001)周合明(1986-),男,硕士研究生,研究方向为软件工程;奚建清,博士生导师,研究方向为数据库系统
更新日期/Last Update: 1900-01-01