[1]徐远方 李成城.基于SVM和词间特征的新词识别研究[J].计算机技术与发展,2012,(05):134-136.
 XU Yuan-fang,LI Cheng-cheng.Research on New Word Identification Based on SVM and Word Characteristics[J].,2012,(05):134-136.
点击复制

基于SVM和词间特征的新词识别研究()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2012年05期
页码:
134-136
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Research on New Word Identification Based on SVM and Word Characteristics
文章编号:
1673-629X(2012)05-0134-03
作者:
徐远方 李成城
内蒙古师范大学计算机与信息工程学院
Author(s):
XU Yuan-fang LI Cheng-cheng
School of Computer & Information, Inner Mongolia Normal University
关键词:
自然语言处理支持向量机新词识别词间特征
Keywords:
natural language processing support vector machine new word recognition word feature
分类号:
TP301
文献标志码:
A
摘要:
中文分词的难点在于处理歧义和识别未登录词,因此对新词的正确识别具有重要作用。文中结合提出的新词测间模式特征以及各种词内部模式特征,对从训练语料中抽取正负样本进行向量化,通过支持向量机的训练得到新词分类支持向量。对测试语料结合绝对折扣法进行新词候选的提取与筛选,并与洲练语料中提取的词间模式特征以及各种词内部模式特征进行向量化,得到新词候选向量,最后将训练语料中得到的新词分类支持向量以及对测试语料中得到的新洲候选向量结合进行SVM测试,得到最终的新词识别结果
Abstract:
Chinese word segmentation is difficult to deal with ambiguity and unknown words recognition. Propose the new word mode features as well as various word internal patterns from the training corpus of positive and negative samples to quantify extraction, and then through the training of support vector machine get new support vector classification. On the test corpus with absolute discounting method new candidate is extracted and selected,and with the training corpus to extract word patterns to quantify according to the new classifica- tion support vector on the SVM test,through a portion of the rule falter to get the final word recognition results

相似文献/References:

[1]李雷 张建民.一种改善的基于支持向量机的边缘检测算子[J].计算机技术与发展,2010,(03):125.
 LI Lei,ZHANG Jian-min.An Improved Edge Detector Using the Support Vector Machines[J].,2010,(05):125.
[2]陈俏 曹根牛 陈柳.支持向量机应用于大气污染物浓度预测[J].计算机技术与发展,2010,(01):247.
 CHEN Qiao,CAO Gen-niu,CHEN Liu.Application of Support Vector Machine to Atmospheric Pollution Prediction[J].,2010,(05):247.
[3]李晶 姚明海.基于支持向量机的语义图像分类研究[J].计算机技术与发展,2010,(02):75.
 LI Jing,YAO Ming-hai.Research of Semantic Image Classification Based on Support Vector Machine[J].,2010,(05):75.
[4]姜鹤 陈丽亚.SVM文本分类中一种新的特征提取方法[J].计算机技术与发展,2010,(03):17.
 JIANG He,CHEN Li-ya.A New Feature Selection Method in SVM Text Categorization[J].,2010,(05):17.
[5]曹庆璞 董淑福 罗赟骞.网络时延的混沌特性分析及预测[J].计算机技术与发展,2010,(04):43.
 CAO Qing-pu,DONG Shu-fu,LUO Yun-qian.Chaotic Analysis and Prediction of Internet Time- Delay[J].,2010,(05):43.
[6]路川 胡欣杰.区域航空市场航线客流量预测研究[J].计算机技术与发展,2010,(04):84.
 LU Chuan,HU Xin-jie.Analysis of Regional Airline Passenger Forecast Title[J].,2010,(05):84.
[7]黄炜 黄志华.一种基于遗传算法和SVM的特征选择[J].计算机技术与发展,2010,(06):21.
 HUANG Wei,HUANG Zhi-hua.Feature Selection Based on Genetic Algorithm and SVM[J].,2010,(05):21.
[8]孙秋凤.microRNA计算识别中的模式识别技术[J].计算机技术与发展,2010,(06):97.
 SUN Qiu-feng.Pattern Recognition Technology for MicroRNA Identification[J].,2010,(05):97.
[9]刘振岩 王勇 陈立平 马俊杰 陈天恩.基于SVM的农业智能决策Web服务的研究与实现[J].计算机技术与发展,2010,(06):213.
 LIU Zhen-yan,WANG Yong,CHEN Li-ping,et al.Research and Implementation of Intelligence Decision Web Services Based on SVM for Digital Agriculture[J].,2010,(05):213.
[10]王李冬.一种新的人脸识别算法[J].计算机技术与发展,2009,(05):147.
 WANG Li-dong.A New Algorithm of Face Recognition[J].,2009,(05):147.

备注/Memo

备注/Memo:
国家自然科学基金项目(2002AA117010-07);内蒙古师范大学校基金(GCRC09001,ZRYB08018)徐远方(1986-),男,硕士研究生,研究方向为自然语言处理;李成城,博士,副教授,研究方向为自然语言处理、自动文摘
更新日期/Last Update: 1900-01-01