[1]韩升 刘广志.全文检索系统的数据预处理研究[J].计算机技术与发展,2006,(03):208-210.
 HAN Sheng,LIU Guang-zhi.Study of Data-Pretreatment for Full-Text Search System[J].,2006,(03):208-210.
点击复制

全文检索系统的数据预处理研究()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2006年03期
页码:
208-210
栏目:
应用开发研究
出版日期:
1900-01-01

文章信息/Info

Title:
Study of Data-Pretreatment for Full-Text Search System
文章编号:
1005-3751(2006)03-0208-03
作者:
韩升 刘广志
北京交通大学软件学院
Author(s):
HAN Sheng LIU Guang-zhi
School of Software, Beijing Jiaotong University
关键词:
全文检索预处理文本标引索引数据库
Keywords:
full - text search pretreatment document indexing index database
分类号:
TP311.13
文献标志码:
A
摘要:
全文检索的应用导致了信息检索领域的一场革命,是文档数据库研发的核心。在一个全文检索系统中,全文索引数据库的建立是系统的基础,其设计结构直接影响到全文检索引擎的检索算法以及系统最终的检索效率。文中主要介绍全文检索系统中索引库结构设计、文本标引技术等数据预处理技术,以及全文检索系统索引数据库的数据处理流程。最后,在此基础上研究了全文检索系统索引库索引生成算法,给出了单个文档和批处理两种情况下的索引库索引生成算法
Abstract:
The application of full- text search has caused a revolution of the information retrieval field. It is the core that the file database researches and develops. In a full- text search system, the setting - up of the index database of full text is a systematic foundation. Its project organization influences the final search efficiency of searching algorithm and system of the full - text search engine directly. This paper introduces such data- pretreatment technology as index database structural design, text index technology, etc. Also introduces that in the full-text retrieval system mainly, and the data processing procedure of index database of full- text retrieval system. Finally, studied the produce- algorithms of index database of full- text retrieval system on this basis, provided produce - algorithm of index database under two kinds of situations: individual file and hatch processing

相似文献/References:

[1]郑榕增 林世平.基于Lucene的中文倒排索引技术的研究[J].计算机技术与发展,2010,(03):80.
 ZHENG Rong-zeng,LIN Shi-ping.Research of Chinese Full Texts Inverted Index Based on Lucene[J].,2010,(03):80.
[2]李永春 丁华福.Lucene的全文检索的研究与应用[J].计算机技术与发展,2010,(02):12.
 LI Yong-chun,DING Hua-fu.Research and Application of Full Text Search Based on Lucene[J].,2010,(03):12.
[3]李玲娟 豆坤.层次分析法中判断矩阵的一致性研究[J].计算机技术与发展,2009,(10):131.
 LI Ling-juan,DOU Kun.Research on the Consistency of the Judgment Matrix in AHP[J].,2009,(03):131.
[4]李健 徐超 谭守标.一种Web数据挖掘系统的设计和研究[J].计算机技术与发展,2009,(02):70.
 LI Jian,XU Chao,TAN Shou-biao.Design and Research of a Web Data Mining System[J].,2009,(03):70.
[5]孙林森 吴小培 项明.一种有效的指纹图像预处理方法[J].计算机技术与发展,2009,(02):133.
 SUN Lin-sen,WU Xiao-pei,XIANG Ming.An Effective Method of Fingerprint Image Preprocessing[J].,2009,(03):133.
[6]杨韶华 马骏.一种基于对象相容度的形式背景分割算法[J].计算机技术与发展,2008,(02):27.
 YANG Shao-hua,MA Jun.A Context Partition Algorithm Based on Objects- Match[J].,2008,(03):27.
[7]李玲娟 李冰 薛明.K-MEANS算法在IDS中的应用研究[J].计算机技术与发展,2010,(07):129.
 LI Ling-juan,LI Bing,XUE Ming.Research on Application of K-MEANS Algorithm in IDS[J].,2010,(03):129.
[8]林碧英 赵锐 陈良臣.基于Lucene的全文检索引擎研究与应用[J].计算机技术与发展,2007,(05):184.
 LIN Bi-ying,ZHAO Rui,CHEN Liang-chen.Research and Application of Full Text Search Engine Based on Lucene[J].,2007,(03):184.
[9]苏延君 张宏军 郝文宁.基于P2P的数据库全文检索系统的设计与实现[J].计算机技术与发展,2007,(09):28.
 SU Yan-jun,ZHANG Hong-jun,HAO Wen-ning.Design and Realization of DB Full Text Retrieval System Based on P2P[J].,2007,(03):28.
[10]陈立潮 王宇 刘佳 张伟 张力.基于方向图的指纹图像预处理算法[J].计算机技术与发展,2007,(09):85.
 CHEN Li-chao,WANG Yu,LIU Jia,et al.Preprocessing of Fingerprint Image Based on Orientation Map[J].,2007,(03):85.

备注/Memo

备注/Memo:
韩升(1980-),男,山西长治人,硕士研究生,研究方向为软件工程、数据仓库和数据挖掘;导师:黄厚宽,教授,研究方向为软件工程、数据仓库和数据挖掘
更新日期/Last Update: 1900-01-01