[1]王永景 刘功申 李生红 荆涛.用于文本校对的分词与词性标注一体化算法[J].计算机技术与发展,2008,(08):1-3.
 WANG Yong-jing,LIU Gong-shen,LI Sheng-hong,et al.One Combined Approach of Chinese Segment and Tagging for Proofreading[J].,2008,(08):1-3.
点击复制

用于文本校对的分词与词性标注一体化算法()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2008年08期
页码:
1-3
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
One Combined Approach of Chinese Segment and Tagging for Proofreading
文章编号:
1673-629X(2008)08-0001-03
作者:
王永景 刘功申 李生红 荆涛
上海交通大学电子工程系
Author(s):
WANG Yong-jing LIU Gong-shen LI Sheng-hong JING Tao
School of Electronic Information and Electrical Engineering, Shanghai J iaotong University
关键词:
文本校对分词词性标注一体化算法
Keywords:
automatic proofreading automatic segment tagging combined approach
分类号:
TP391.1
文献标志码:
A
摘要:
分词和词性标注是中文处理中的一项基本步骤,其性能的好坏很大程度上影响了中文处理的效果。传统上人们使用基于词典的机械分词法,但是,在文本校对处理中的文本错误会恶化这种方法的结果,使之后的查错和纠错就建立在一个不正确的基础上。文中试探着寻找一种适用于文本校对处理的分词和词性标注算法。提出了全切分和一体化标注的思想。试验证明,该算法除了具有较高的正确率和召回率之外,还能够很好地抑制文本错误给分词和词性标注带来的影响
Abstract:
Segment and part-of - speech tagging is two important procedures in Chinese processing. Use machine segment based on dictionary traditionally, but during the process of proofreading the errors in the input texts would deteriorate the result of segment and

相似文献/References:

[1]程节华.基于FAQ的智能答疑系统中分词模块的设计[J].计算机技术与发展,2008,(07):181.
 CHENG Jie-hua.Design of Words Module in Intelligent Q/A System Based on FAQ[J].,2008,(08):181.
[2]龚伟 李柳柏.基于IDSS的中文垃圾邮件过滤模型设计[J].计算机技术与发展,2007,(03):163.
 GONG Wei,LI Liu-bai.Chinese Spam Mail Filtering Model Design Based on IDSS[J].,2007,(08):163.
[3]闻玉彪 贾时银 邓世昆 李远方.一种改进的最大匹配中文分词算法[J].计算机技术与发展,2011,(10):92.
 WEN Yu-biao,JIA Shi-yin,DENG Shi-kun,et al.An Improved Algorithm for Maximum Matching of Chinese Word Segmentation[J].,2011,(08):92.
[4]周永梅 陶红 陈姣姣 张再跃.自动问答系统中的句子相似度算法的研究[J].计算机技术与发展,2012,(05):75.
 ZHOU Yong-mei,TAO Hong,CHEN Jiao-jiao,et al.Study on Sentence Similarity Approach of Automatic Ask & Answer System[J].,2012,(08):75.
[5]陶非凡. 基于层叠隐马模型的屏蔽关键词研究[J].计算机技术与发展,2014,24(11):167.
 TAO Fei-fan. Research on Shielded Keywords Based on Cascaded Hidden Markov Model[J].,2014,24(08):167.
[6]李春生,卢鹏飞,张可佳.基于语句相似度计算的智能答疑系统机理研究[J].计算机技术与发展,2018,28(04):91.[doi:10.3969/ j. issn.1673-629X.2018.04.0019]
 LI Chun-sheng,LU Peng-fei,ZHANG Ke-jia.Research on Mechanism of Intelligent Question Answering System Based on Sentence Similarity Computation[J].,2018,28(08):91.[doi:10.3969/ j. issn.1673-629X.2018.04.0019]
[7]高嘉琦,赵庆聪.基于新词发现的古典文学作品分词方法研究[J].计算机技术与发展,2021,31(09):178.[doi:10. 3969 / j. issn. 1673-629X. 2021. 09. 030]
 GAO Jia-qi,ZHAO Qing-cong.Study on Word Segmentation Method of Classical Literature Based on New Word Discovery[J].,2021,31(08):178.[doi:10. 3969 / j. issn. 1673-629X. 2021. 09. 030]

备注/Memo

备注/Memo:
国家自然科学基金资助项目(60402019,60502032);教育部新世纪优秀人才支持汁划项目(NCET-06-0393)王永景(1982-),男,江苏徐州人,硕士研究生,研究方向为自然语言理解、文本自动校对。刘功申,副教授,研究方向为内容安全、舆情分析、恶意代码防范。李生红,教授,研究方向为网络安全、计算机病毒、内容过滤。荆涛,副教授,研究方向为信息安全、计算机通信网
更新日期/Last Update: 1900-01-01