期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于多模态融合的端到端中文唇读识别研究
1
作者 陈焯辉 林绰雅 +3 位作者 刘奕显 王茗琛 梁思敏 陈灵 《科学技术创新》 2023年第10期85-88,共4页
为了更好地帮助健全人与听障或语言障碍人士进行交流,构建无障碍社会。构建了一个基于多模态融合的端到端音视频识别系统,实现中文唇语翻译功能。实验结果表明,将所提出的端到端视听语音识别结构体系应用于唇语识别模型,实现了8.0%的字... 为了更好地帮助健全人与听障或语言障碍人士进行交流,构建无障碍社会。构建了一个基于多模态融合的端到端音视频识别系统,实现中文唇语翻译功能。实验结果表明,将所提出的端到端视听语音识别结构体系应用于唇语识别模型,实现了8.0%的字符错误率。与之前的唇语识别模型相比,它在融合图像特征和音频特征方面表现出了良好的性能。 展开更多
关键词 端到端音视觉语音识别结构体系 多模态融合 唇语识别
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部