[1]张赢 万仲保.对专业搜索引擎中未登录词的识别研究[J].计算机技术与发展,2009,(05):134-136.
 ZHANG Ying,WAN Zhong-bao.Professional Search Engine Unknown Word of Recognition[J].,2009,(05):134-136.
点击复制

对专业搜索引擎中未登录词的识别研究()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2009年05期
页码:
134-136
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Professional Search Engine Unknown Word of Recognition
文章编号:
1673-629X(2009)05-0134-03
作者:
张赢 万仲保
华东交通大学信息工程学院
Author(s):
ZHANG YingWAN Zhong-bao
School of Information Engineering, East China of Jiaotong University
关键词:
电影名中文分词未登录词识别策略
Keywords:
film name Chinese segmentation unknown words identification strategy
分类号:
TP393
文献标志码:
A
摘要:
未登录词的识别是中文分词要面对的数个难题之一,解决好了这个问题就能够有力提升中文分词的效率。对此,文中简要介绍了专业搜索引擎的概况,并具体分析了对电影名进行中文分词的特点和介绍了传统的未登录词的识别策略,最后在此基础上提出了一种电影名未登录词的识别策略并简要分析了这种策略未来的优化方向
Abstract:
Identification of unknown words is the Chinese word segmentation to face one of a number of problems, to resolve this problem will be able to effectively enhance the efficiency of the Chinese word segmentation. Gave a briefing on the profile of profession

相似文献/References:

[1]盛启东 谭守标 徐超 冯二媛 陈军宁.巧用黑盒法逆推百度中文分词算法[J].计算机技术与发展,2010,(04):136.
 SHENG Qi-dong,TAN Shou-biao,XU Chao,et al.Inferring Baidu's Chinese Word Segmentation Algorithm by Supposing a Black Box[J].,2010,(05):136.
[2]牟帅 黄映辉 李冠宇.语义Web服务的OWL—S描述及其应用[J].计算机技术与发展,2009,(01):13.
 MU Shuai,HUANG Ying-hui,LI Guan-yu.OWL - S Description of Semantic Web Service and Its Applications[J].,2009,(05):13.
[3]赵俊杰 胡学钢.一种基于段落词频统计的论文抄袭判定算法[J].计算机技术与发展,2009,(04):231.
 ZHAO Jun-jie,HU Xue-gang.A Way to Judge Plagiarism in Academic Papers Based on Word - Frequency Statistics of Paragraphs[J].,2009,(05):231.
[4]罗桂琼 费洪晓 戴弋.基于反序词典的中文分词技术研究[J].计算机技术与发展,2008,(01):80.
 LUO Gui-qiong,FEI Hong-xiao,DAI Yi.Research of Chinese Segmentation Based on Converse Segmentation Dictionary[J].,2008,(05):80.
[5]钟锋 罗燕京 杨曦 李虎.一种基于合并策略的机构名称切分方法[J].计算机技术与发展,2008,(05):12.
 ZHONG Feng,LUO Yan-jing,YANG Xi,et al.An Organization Name Segmentation Approach Based on Combination Strategy[J].,2008,(05):12.
[6]许高建 胡学钢 王庆人.文本挖掘中的中文分词算法研究及实现[J].计算机技术与发展,2007,(12):122.
 XU Gao-jian,HU Xue-gang,WANG Oing-ren.Research and Realization of Chinese Text Classification Algorithms on Text Mining[J].,2007,(05):122.
[7]丁兆贵 金敏.基于Lucene的个性化搜索引擎研究与实现[J].计算机技术与发展,2011,(02):105.
 DING Zhao-gui,JIN Min.Research and Implementation of Personal Search Engine Based on Lucene[J].,2011,(05):105.
[8]魏博诚 王爱平 沙先军 王永.一种消除中文分词中交集型歧义的方法[J].计算机技术与发展,2011,(05):60.
 WEI Bo-cheng,WANG Ai-ping,SHA Xian-jun,et al.A Method about Removing Overlapping Ambiguity Producing in Chinese Matching[J].,2011,(05):60.
[9]韩月阳 邓世昆 贾时银 李远方.基于字分类的中文分词的研究[J].计算机技术与发展,2011,(07):29.
 HAN Yue-yang,DENG Shi-kun,JIA Shi-yin,et al.Chinese Word Segmentation Research Based on Classification of Words[J].,2011,(05):29.
[10]黄宇达 魏霞 王迤冉[].一种轻量级中文搜索引擎模型的设计与实现[J].计算机技术与发展,2012,(09):201.
 HUANG Yu-da,WEI Xia,WANG Yi-ran.Design and Implementation of System Model of a Lightweight Chinese Search Engine[J].,2012,(05):201.

备注/Memo

备注/Memo:
江四省自然科学基金(0411035)张赢(1982-),男,湖南常德人,硕士研究生,研究方向为信息安全、搜索引擎万仲保,副教授,研究方向为信息安全、网络工程。
更新日期/Last Update: 1900-01-01