期刊文献+

基于稀疏DBN和双向LSTM的视觉语音识别算法 被引量:4

Visual speech recognition algorithm based on improved sparse DBN and bidirectional LSTM
下载PDF
导出
摘要 唇部视觉信息作为语音识别的辅助信息一直受到广泛关注,为更好的提取唇部视觉信息,提出一种基于稀疏深度信念网络(Deep Belief Network,DBN)和双向长短期记忆网络(Bidirectional Long Short-Term Memory,BiLSTM)的视觉语音识别算法。该算法通过在DBN的目标函数后引入混合的范数和范数来实现DBN的稀疏表示,以此稀疏DBN对唇部视觉信息进行稀疏瓶颈特征的提取,再将提取的瓶颈特征送入BiLSTM进行特征的学习分类。实验表明,该算法能有效的识别唇部视觉信息。
作者 王一鸣 陈恳 Wang Yiming;Chen Ken
出处 《数据通信》 2019年第3期9-15,共7页
基金 国家自然科学基金资助项目(No.60972063) 宁波市自然科学基金资助项目(No.2014A610065) 宁波大学科研基金(理)/学科资助项目(No.XKXL1308)
  • 相关文献

同被引文献18

引证文献4

二级引证文献11

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部