期刊文献+

一种噪音环境下的基于特征口形的音频视频混合连续语音识别系统 被引量:1

An Eigen Mouth Based Audio Visual Continuous Speech Recognition System in Noisy Environments
下载PDF
导出
摘要 文章抓住人类语音感知多模型的特点,尝试建立一个在噪音环境下的基于音频和视频复合特征的连续语音识别系统。在视频特征提取方面,引入了一种基于特征口形的提取方法。识别实验证明,这种视频特征提取方法比传统DCT、DWT方法能够带来更高的识别率;基于特征口形的音频-视频混合连续语音识别系统具有很好的抗噪性。 Considering that human speech perception is inherently a multi-modal process,the paper tries to develop a continuous speech recognition system based on audio-visual fusion,which is used in noisy environments.In the visual feature extraction,an eigen mouth based method is introduced.Experimental results show that the feature extraction method presented in this paper outperforms the traditional methods,such as DCT and DWT.The experiments also show that the audio-visual continuous speech recognition system is robust in noisy environments.
出处 《计算机工程与应用》 CSCD 北大核心 2003年第16期3-5,35,共4页 Computer Engineering and Applications
基金 中国科技部与比利时弗拉芒大区的国际科技合作项目"现实世界的机器视觉与语音技术"的支持(编号:国科外字19990209号)
关键词 音频-视频混合连续语音识别 主分量分析 特征口形 多数据流 HMM Audio-Visual Speech Recognition,Principal Components Analysis,Eigen Mouth,Multi-Stream,HMM
  • 相关文献

参考文献6

  • 1K R Castleman.朱志刚 林学闫 石定机等译.数字图像处理[M].Prentice Hall出版公司,电子工业出版社,1998.253-254.
  • 2H McGurk,J MacDonald.Hearing lips and seeing voices[J].Nature, 1976; 264 : 746-748.
  • 3D W Massaro,D G Stork.Speech recognition and sensory integration [J].American Scientist, 1998 ; 86 (3) : 236-244.
  • 4I Ravyse, M Reinders,J Cornelis et al.Eye gesture estimation[C].In : IEEE Benelux Signal Processing Chapter,Signal Processing Symposium, SPS2000, The Netherlands, 2000:4.
  • 5H Bourlard ,S Dupone,C Riss.Muhi-stream speech recognition[R]. Technical Report IDIAP-RR 96-07 ,IDIAP, 1996.
  • 6I Ravyse,M Reinders,J Comelis et a1.Eye gesture estimation[C].In: IEEE Benelux Signal Processing Chapter,Signal Processing Symposium,SPS2000,The Netherlands,2000.

共引文献1

同被引文献3

  • 1NAKAMURA S. Statistical Multimodal Integration for Audio-Visual Speech[J]. Processing of IEEE Transactions on Neural Networks, 2002,13(4):854-866.
  • 2MarquesdesaJP 吴逸飞 译.模式识别-原理、方法及应用[M].北京:清华大学出版社,2002.28-41.
  • 3刘青山,卢汉清,马颂德.综述人脸识别中的子空间方法[J].自动化学报,2003,29(6):900-911. 被引量:117

引证文献1

二级引证文献9

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部