[1]刘家涛 陈一民.一种快速嘴部检测方法在视听语音识别的应用[J].计算机技术与发展,2008,(10):16-19.
 LIU Jia-tao,CHEN Yi-min.Fast Mouth Detection Approach Applied in Audio- Visual Speech Recognition[J].,2008,(10):16-19.
点击复制

一种快速嘴部检测方法在视听语音识别的应用()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2008年10期
页码:
16-19
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Fast Mouth Detection Approach Applied in Audio- Visual Speech Recognition
文章编号:
1673-629X(2008)10-0016-04
作者:
刘家涛 陈一民
上海大学计算机科学与工程学院
Author(s):
LIU Jia-tao CHEN Yi-min
Seh. of Computer Sci. & Eng.,Shanghai Univ. of Science and Tech
关键词:
模态视听语音识别Harr-like特征重要区域积分图像区域划分
Keywords:
modality audio - visual speech recognition Harr - like feature region of interest integral image regionalization
分类号:
TP391.41
文献标志码:
A
摘要:
在改进噪音环境下的语音识别率中,来自于说话人嘴部的可视化语音信息有着显著的作用。介绍了在视听语音识别(AVSR)中的重要组成部分之一:可视化信息的前端设计;描述了一种用于快速处理图像并能达到较高识别率的人脸嘴部检测的机器学习方法,此方法引入了旋转Hart-like特征在积分图像中的应用,在基于AdaBoost学习算法上通过使用单值分类作为基础特征分类器,以级联的方式合并强分类器,最后划分检测区域用于嘴部定位。将上述方法应用于AVSR系统中,基本上达到了对人脸嘴部实时准确的检测效果
Abstract:
The visual information comes from speaker's mouth had proved very useful in improving speech recognition, especially in noise environment. In this paper, first introduced one of the main components in audio-visual speech recognition system: visual front e

备注/Memo

备注/Memo:
上海市科技基金资助项目(7A07094)刘家涛(1980-),男,山东烟台人,硕士研究生,研究方向为多媒体应用技术;陈一民,博士,教授,研究方向为多媒体应用技术、计算机增强现实
更新日期/Last Update: 1900-01-01