[1]熊桂喜 陆壮飞.专业信息检索系统中索引项提取策略的研究[J].计算机技术与发展,2008,(09):19-21.
XIONG Gui-xi,LU Zhuang-fei.Research on Index Unit Selection Strategy in Domain- Oriented Information Retrieval[J].,2008,(09):19-21.
点击复制
专业信息检索系统中索引项提取策略的研究(
)
《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]
- 卷:
-
- 期数:
-
2008年09期
- 页码:
-
19-21
- 栏目:
-
智能、算法、系统工程
- 出版日期:
-
1900-01-01
文章信息/Info
- Title:
-
Research on Index Unit Selection Strategy in Domain- Oriented Information Retrieval
- 文章编号:
-
1673-629X(2008)09-0019-03
- 作者:
-
熊桂喜 陆壮飞
-
北京航空航天大学计算机学院
- Author(s):
-
XIONG Gui-xi; LU Zhuang-fei
-
School of Computer Science, Beihang University
-
- 关键词:
-
专业检索; 索引权重; 倒排文件
- Keywords:
-
domain - oriented information retrieval ; index weight; inverted file
- 分类号:
-
TP391
- 文献标志码:
-
A
- 摘要:
-
索引项(Index Unit)的提取是中文全文检索领域的关键技术之一。将通用搜索引擎的索引项提取策略应用于某一专业领域的检索系统中,会出现因标引词典无法覆盖该领域的专业词汇而造成的查准率偏低和因辞典不断加入专业词汇而造成检索效率降低的矛盾。介绍了一种面向专业领域的索引项提取策略,通过在提取过程中区分索引项和专业索引项并分别计算其权值,提升专业索引项与目标文档的相似度。在北京公安交通管理领域的网页数据集进行实验,证明该索引策略在查询专业领域信息时可提供较高的查准率并显著提高检索效率
- Abstract:
-
Index unit selection is one of the key technologies of Chinese full - text retrieval. General purpose index unit selection method is not suitable for domain - oriented information retrieval because there will be a conflict between the low accuracy and rec
备注/Memo
- 备注/Memo:
-
“十五”国家科技攻关计划(2005BA414B04)熊桂喜(1964-),男,硕士,副教授,研究方向为企业应用系统集成(EAI)、智能交通系统(ITS)
更新日期/Last Update:
1900-01-01