摘要
文章提出一种结合长短期记忆网络(Long Short-Term Memory,LSTM)、卷积神经网络(Convolutional Neural Network,CNN)和连接主义时间分类(Connectionist Temporal Classification,CTC)的端到端英语口语识别模型。该模型直接对语音特征序列建模,无须中间表示,简化识别系统设计,为口语识别与交互技术发展奠定基础。此外介绍了如何在树莓派上实现基于深度神经网络的英语口语语音识别系统。由于系统的模式可以不断地改进识别精度,因此非常方便用于家居中进行英语口语自学检测。
出处
《中国宽带》
2023年第5期77-79,共3页
China BroadBand
基金
福建省中青年教师教育科研项目(科技类,No.JAT210447)和福建省大学生创新创业训练计划项目(No.202311312027)资助。