[1]吴庆棋 林江云.基于聚类优化GMM提高说话人识别性能的研究[J].计算机技术与发展,2009,(04):35-37.
 WU Qing-qi,LIN Jiang-yun.A Study on GMM Optimization with Clustering for Improving Speaker Recognition[J].,2009,(04):35-37.
点击复制

基于聚类优化GMM提高说话人识别性能的研究()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2009年04期
页码:
35-37
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
A Study on GMM Optimization with Clustering for Improving Speaker Recognition
文章编号:
1673-629X(2009)04-0035-03
作者:
吴庆棋 林江云
厦门大学计算机科学系
Author(s):
WU Qing-qi LIN Jiang-yun
Dept. of Computer Science, Xiamen University
关键词:
说话人识别高斯混合模型聚类算法
Keywords:
speaker recognition Gaussian mixture model clustering algorithm
分类号:
TN92
文献标志码:
A
摘要:
高斯混合模型(GMM)已广泛地应用于文本无关的说话人识别系统,该方法具有简单高效的特点。但如果GIVIM模型的高斯混合分量的数目比较多时,整个模型运算的复杂度会比较大。针对这个问题,提出将聚类算法和传统的高斯混合建模结合起来从而优化高斯混合模型,能够有效地提高说话人识别的速度。实验结果验证了这种算法的高效性。
Abstract:
Ganssian mixture model (GMM) has been widely used for text- independent speaker recognition. This method has simple and efficient character. However,if it has a large number of Gaussians in GMM, it leads to a large complexity of computation. To solve this

相似文献/References:

[1]但志平 郑胜.最小二乘向量机在说话人识别中的应用[J].计算机技术与发展,2007,(05):30.
 DAN Zhi-ping,ZHENG Sheng.Application of LS - SVM in Speaker Recognition[J].,2007,(04):30.
[2]刘大鹏 尾关和彦 朱庆生.添加音素持续时间信息到频谱模型的说话人辨认研究[J].计算机技术与发展,2007,(05):156.
 LIU Da-peng,Kazuhiko Ozeki,ZHU Qing-sheng.Adding Phoneme Duration Information to Spectral Model : in Speaker Identification[J].,2007,(04):156.
[3]张华 裘雪红.说话人识别中LPCCEP倒谱分量的相对重要性[J].计算机技术与发展,2006,(04):67.
 ZHANG Hua,QIU Xue-hong.On the Importance of Components of LPCCEP in Speaker Recognition[J].,2006,(04):67.
[4]翟继友 张鹏.高斯混合模型参数估值算法的优化[J].计算机技术与发展,2011,(11):145.
 ZHAI Ji-you,ZHANG Peng.Optimization of Parameter Estimation Based on Gaussian Mixture Model[J].,2011,(04):145.
[5]赵青 成谢锋 朱冬梅.基于改进MFCC和短时能量的咳嗽音身份识别[J].计算机技术与发展,2012,(06):82.
 ZHAO Qing,CHENG Xie-feng,ZHU Dong-mei.Cough Sound Identification Based on Improved MFCC and Short-time Energy[J].,2012,(04):82.
[6]李燕萍 张玲华.基于多时间尺度韵律特征分析的语音转换研究[J].计算机技术与发展,2012,(12):67.
 LI Yan-ping,ZHANG Ling-hua.Voice Conversion Research Based on Multi-time Scale Prosodic Feature Analysis[J].,2012,(04):67.
[7]辛月兰.基于超像素的Grabcut彩色图像分割[J].计算机技术与发展,2013,(07):48.
 XIN Yue-lan.Superpixel-based Grabcut Color Image Segmentation[J].,2013,(04):48.
[8]黄景星,吴伟隆,龙楚君,等.基于OpenCV的视频运动目标检测及其应用研究[J].计算机技术与发展,2014,24(03):15.
 HUANG Jing-xing,WU Wei-long,Long Chu-jun,et al.Study of Moving Object Detection in Video and Its Application Based on OpenCV[J].,2014,24(04):15.
[9]高蕾[],曹建忠[]. 基于可穿戴传感器的行为识别随机逼近模型[J].计算机技术与发展,2014,24(12):83.
 GAO Lei[],CAO Jian-zhong[]. Activity Recognition Using Stochastic Approximation Model Based on Wearable Sensor[J].,2014,24(04):83.
[10]蒋翠清,邵宏波. 基于MFCC与改进ACF的汽车声音识别算法研究[J].计算机技术与发展,2015,25(02):140.
 JIANG Cui-qing,SHAO Hong-bo. Research on Vehicle Audio Recognition Algorithm Based on MFCC and Improved ACF[J].,2015,25(04):140.

备注/Memo

备注/Memo:
“985工程”二期“信息技术”创新平台资助项目(0000—X07204)吴庆棋(1982-),男,研究方向为声音识别;林江云,硕士,研究方向为说话人识别。
更新日期/Last Update: 1900-01-01