[1]郑榕增 林世平.基于Lucene的中文倒排索引技术的研究[J].计算机技术与发展,2010,(03):80-83.
 ZHENG Rong-zeng,LIN Shi-ping.Research of Chinese Full Texts Inverted Index Based on Lucene[J].,2010,(03):80-83.
点击复制

基于Lucene的中文倒排索引技术的研究()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2010年03期
页码:
80-83
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Research of Chinese Full Texts Inverted Index Based on Lucene
文章编号:
1673-629X(2010)03-0080-04
作者:
郑榕增 林世平
福州大学数学与计算机科学学院
Author(s):
ZHENG Rong-zeng LIN Shi-ping
Department of Mathematics and Computer Science, Fuzhou University
关键词:
全文检索倒排索引索引压缩Lucene
Keywords:
full- text retrieval inverted index index compression Lucene
分类号:
TP391.3
文献标志码:
A
摘要:
索引是所有搜索引擎的核心概念,为了进行快速查找,就需要把数据处理成一种高效的、可交叉引用的组织格式。倒排索引是一种高效的索引组织模式,其组织模式和存储结构对检索系统的性能起着至关重要的作用,文中探讨了基于Lucene的倒排索引模式,分析了Lucene索引文件的结构、索引过程以及相关排序算法,讨论了Lucene的压缩算法,并且通过设计一个中文模块实现了基于正向减字最大匹配分词方式的中文索引。实验表明新的分词算法比Lucene自带的分词算法性能有了很大的提高。
Abstract:
Index is the core concept of all search engines. For quick search, the data need to be processed into a highly efficient, cross- references structure. Inverted index is a high - performance index model. Its organizational model and storage structure is cr

相似文献/References:

[1]李永春 丁华福.Lucene的全文检索的研究与应用[J].计算机技术与发展,2010,(02):12.
 LI Yong-chun,DING Hua-fu.Research and Application of Full Text Search Based on Lucene[J].,2010,(03):12.
[2]李想 吴国新 郭晶.基于分布式倒排索引和VSM算法的P2P复杂搜索[J].计算机技术与发展,2009,(04):25.
 LI Xiang,WU Guo-xin,GUO Jing.Distributed Inverted Index and VSM Algorithm Based Complex Peer- to- Peer Search[J].,2009,(03):25.
[3]林碧英 赵锐 陈良臣.基于Lucene的全文检索引擎研究与应用[J].计算机技术与发展,2007,(05):184.
 LIN Bi-ying,ZHAO Rui,CHEN Liang-chen.Research and Application of Full Text Search Engine Based on Lucene[J].,2007,(03):184.
[4]苏延君 张宏军 郝文宁.基于P2P的数据库全文检索系统的设计与实现[J].计算机技术与发展,2007,(09):28.
 SU Yan-jun,ZHANG Hong-jun,HAO Wen-ning.Design and Realization of DB Full Text Retrieval System Based on P2P[J].,2007,(03):28.
[5]蒙辉 陈燕.Oracle Text技术在复杂结构数据库中的应用[J].计算机技术与发展,2007,(04):38.
 MENG Hui,CHEN Yan.Application of Oracle Text in Complex - Structured Database[J].,2007,(03):38.
[6]江有福 郑庆华.自然语言网络答疑系统中倒排索引技术的研究[J].计算机技术与发展,2006,(02):126.
 JIANG You-fu,ZHENG Qing-hua.Research of Inverted Index in NLWAS[J].,2006,(03):126.
[7]韩升 刘广志.全文检索系统的数据预处理研究[J].计算机技术与发展,2006,(03):208.
 HAN Sheng,LIU Guang-zhi.Study of Data-Pretreatment for Full-Text Search System[J].,2006,(03):208.
[8]聂红梅 赵建民.Oracle数据库中Clob大字段的查询优化技术研究[J].计算机技术与发展,2006,(08):97.
 NIE Hong-mei,ZHAO Jian-min.Research of Optimum Query Technology on Clob Big Segment in Oracle Database[J].,2006,(03):97.
[9]周锦程 王丹 余泉 张维.基于Lucene的全文检索系统的研究与实现[J].计算机技术与发展,2011,(03):67.
 ZHOU Jin-cheng,WANG Dan,YU Quan,et al.Research and Implementation of Full-Text Retrieval Engine Based on Lucene[J].,2011,(03):67.
[10]吴代文 詹海生.西安市数字方志全文检索系统的设计与实现[J].计算机技术与发展,2011,(10):121.
 WU Dai-wen,ZHAN Hai-sheng.Design and Implementation of Full-Text Retrieval System for Xi'an Data Chorography[J].,2011,(03):121.

备注/Memo

备注/Memo:
郑榕增(1982-),男,硕士研究生,研究方向为Web智能与信息检索;林世平,副教授,研究方向为数据挖掘。
更新日期/Last Update: 1900-01-01