基于At-LSTM模型的音/视频双流语音识别算法仿真被引量：1

Simulation of Audio/Video Dual Stream Speech Recognition Algorithm Based on At LSTM Model

下载PDF

导出

摘要语音中的噪声会影响语音信号中的正常信息,影响语音识别效果,为提升音/视频双流语音识别准确率与效率,提出基于注意力LSTM的音/视频双流语音识别算法。使用小波阈值方法对音/视频双流语音数据实施去噪处理,依据去噪结果对语音数据矢量量化;基于语音数据量化结果构建At-LSTM模型,运用该模型提取语音数据的局部与整体特征,并融合处理特征;基于语音数据特征融合结果,对语音数据实施分类,实现音/视频双流语音的识别。实验结果表明,使用上述方法识别音/视频双流语音时,识别准确率高、识别时间短,且语音中的含噪部分较少,识别的语音更加流畅。 Noise in speech may affect the normal information in speech signal and the effect of speech recognition. Therefore, an algorithm of recognizing audio/video dual-stream speech based on attention LSTM was presented. At first, wavelet threshold method was used to reduce noise from audio/video dual stream speech data. Based on the denoising results, the speech data was vectorized. Based on the result of vector quantization for speech data, a At-LSTM model was constructed to extract the local and global features of speech data and fuse features. Based on the result of feature fusion, the voice data were classified. Finally, the recognition for audio/video dual-stream voice was achieved. Experimental results show that the method has high recognition accuracy, short recognition time when recognizing dual-stream speech of audio/video, with less noise and more fluent speech.

作者张添添王婧 ZHANG Tian-tian;WANG Jing(Tianhua College,Shanghai Normal University,Shanghai 201815,China;International School of Software,Wuhan University,Wuhan Hubei 430072,China)

机构地区上海师范大学天华学院武汉大学国际软件学院

出处《计算机仿真》北大核心 2023年第1期251-254,282,共5页 Computer Simulation

关键词注意力机制音/视频双流语音识别语音数据去噪 Attention mechanism LSTM model Audio/video Dual-stream speech recognition Speech data denoising

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献15

1朱方圆,马志强,陈艳,张晓旭,王洪彬,宝财吉拉呼.语音识别中说话人自适应方法研究综述[J].计算机科学与探索,2021,15(12):2241-2255. 被引量：7
2赵正平.GaN微电子学的新进展(续)[J].半导体技术,2020,0(2):89-98. 被引量：1
3唐海桃,薛嘉宾,韩纪庆.一种多尺度前向注意力模型的语音识别方法[J].电子学报,2020,48(7):1255-1260. 被引量：17
4白璐,王连明.基于卷积神经网络的大容量汉语孤立字语音识别方法[J].东北师大学报（自然科学版）,2020,52(2):52-57. 被引量：3
5张威,刘晨,费鸿博,李巍,俞经虎,曹毅.基于DL-T及迁移学习的语音识别研究[J].工程科学学报,2021,43(3):433-441. 被引量：5
6梁正友,黎雨星,孙宇,姚强.基于多特征组合的构音障碍语音识别[J].计算机工程与设计,2022,43(2):567-572. 被引量：4
7米翰宁,王昕,任广振,郑益慧.自适应小波阈值去噪算法用于局部放电白噪声去噪[J].高压电器,2021,57(6):94-101. 被引量：21
8张绘娟,张达敏,闫威,陈忠云,辛梓芸.基于改进阈值函数的小波变换图像去噪算法[J].计算机应用研究,2020,37(5):1545-1548. 被引量：41
9雷娅,方勇,张立明.基于Takenaka-Malmquist系的语音信号压缩与降噪方法[J].上海大学学报（自然科学版）,2020,26(1):33-46. 被引量：3
10王超,俞一彪.矢量量化正则变分自编码器做非平行语料语音转换[J].信号处理,2021,37(7):1339-1345. 被引量：4

二级参考文献86

1吕海灿,王伟峰,赵兵,张毅,郭秋婷,胡伟.基于Wide&Deep-LSTM模型的短期台区负荷预测[J].电网技术,2020,44(2):428-436. 被引量：49
2尹忠科,王建英,邵君.基于原子库结构特性的信号稀疏分解[J].西南交通大学学报,2005,40(2):173-178. 被引量：35
3尹忠科,邵君,Pierre Vandergheynst.利用FFT实现基于MP的信号稀疏分解[J].电子与信息学报,2006,28(4):614-618. 被引量：25
4李剑,孙才新,杨霁,杨洋,唐炬.局部放电在线监测中小波阈值去噪法的最优阈值自适应选择[J].电网技术,2006,30(8):25-30. 被引量：23
5戴蓓倩,郁正庆,戴任飞,张劲松,王长富,司虎.基于话者分类和HMM的话者自适应语音识别[J].中国科学技术大学学报,1996,26(2):147-153. 被引量：2
6李剑,杨洋,程昌奎,宁佳欣,高红武.变压器局部放电监测逐层最优小波去噪算法[J].高电压技术,2007,33(8):56-60. 被引量：17
7张莲,秦华峰,余成波.基于小波阈值去噪算法的研究[J].计算机工程与应用,2008,44(9):172-173. 被引量：41
8CAO Wenming,HE Tiancheng.The Multi-Weight Neuron with Geometry Algorithm and Its Application[J].Chinese Journal of Electronics,2008,17(2):261-264. 被引量：4
9张春涛,吴善培.最大互信息用于语音识别[J].北京邮电大学学报,1998,21(3):82-85. 被引量：3
10王军华,方勇.基于Curvelet域自适应数学形态学降噪的含噪图像盲分离方法[J].上海大学学报（自然科学版）,2010,16(4):336-341. 被引量：2

共引文献148

1董慧芬,陈蒙.电能质量信号的非均匀子带分解小波去噪[J].电子测量与仪器学报,2022,36(3):149-156. 被引量：2
2齐善鲁,范宝德,张迪.改进小波阈值去噪算法在GPR数据处理中的应用[J].电子测量技术,2023,46(1):17-24. 被引量：2
3高莹,马佳琳.基于改进的混合自注意力机制模型的研究[J].电视技术,2021,45(12):120-122. 被引量：1
4邹倩,陆安江,李春红.一种中值滤波和改进阈值函数的图像去噪算法[J].智能计算机与应用,2020,10(8):124-126. 被引量：8
5聂崇正.一幅名为郎世宁作品之真伪鉴别[J].荣宝斋,2000(2):170-177. 被引量：1
6王娟,姜玉菡,陈泽昊,武明虎,丁畅,曾春艳,袁旭亮.面向输电线路的压缩感知图像去噪方法[J].华中师范大学学报（自然科学版）,2020,54(3):376-383. 被引量：2
7张道杰,张馨文.语音编码在自动化互动模型中的应用研究[J].电力系统保护与控制,2020,48(12):147-153. 被引量：1
8谢丽娟,路锋,王旭,李敏.一种用于信号去噪的小波阈值去噪算法[J].国外电子测量技术,2020,39(4):32-36. 被引量：24
9孙伟,杨一涵,王野,李亚丹.基于BEEMD的单目测距图像区间阈值降噪算法[J].电子科技大学学报,2020,49(4):563-568. 被引量：3
10周红锴.基于单片机控制的孤立词语音自动识别系统设计[J].现代电子技术,2020,43(18):64-66. 被引量：2

同被引文献14

1郝玉福,李正浩,赵凯羽,董健.基于FNTSM-ELM的机器人执行器控制策略[J].计算机仿真,2021,38(12):349-355. 被引量：2
2钱牧云,张姣姣,魏新园.光纤光栅柔性触觉传感器的材质识别功能研究[J].仪器仪表学报,2022,43(4):206-212. 被引量：5
3陈颖,赵朋程,贾红霞,杨丽,马健.基于ELM-ARX组合模型的预测控制算法研究及应用[J].科技风,2022(21):4-10. 被引量：1
4张子涵,周斌,李文豪.基于注意力机制的短道速滑运动轨迹预测模型[J].现代计算机,2022,28(14):28-34. 被引量：1
5郝焕香.服务机器人自动化语音交互服务系统设计[J].自动化与仪器仪表,2022(7):233-237. 被引量：3
6武永强,于涛,纪俐.双机器人系统运动学建模与仿真[J].组合机床与自动化加工技术,2022(9):1-6. 被引量：4
7王菲露,吕珊娜,宋杨,李明坤,孙牛平,章英,章王勇.基于残差网络的新型触觉传感器接触状态感知与识别[J].传感技术学报,2022,35(10):1404-1411. 被引量：1
8屈瑾.基于语音识别的智能交互系统设计[J].自动化与仪器仪表,2023(1):221-225. 被引量：8
9白皓然,孙伟浩,金宁,马皓冉.基于改进Bi-LSTM-CRF的农业问答系统研究[J].中国农机化学报,2023,44(2):99-105. 被引量：7
10张振宇,钟佩思,张超,王祥文,刘梅,孙钰雁.基于工业机器人动力学模型的差分力矩偏差碰撞检测方法[J].制造技术与机床,2023(3):163-172. 被引量：2

引证文献1

1张丽群,薛世峰.基于ELM的控制器算法在机器人触觉识别和语音交互中的应用[J].自动化与仪器仪表,2023(12):161-164.

1左倪娜,覃晓.物体表面三维虚拟图像点云数据提取仿真[J].计算机仿真,2023,40(1):255-258.
2张琰,舒畅,王晶.基于知识蒸馏和超分辨率的车道检测算法仿真[J].计算机仿真,2023,40(1):178-181.
3王鹏.高速公路工程项目中的CFG桩软基处理技术分析[J].中国高新科技,2022(21):81-82. 被引量：1
4陈芳,张爽,陈姣.基于认证服务器的网络防火墙加密算法仿真[J].计算机仿真,2023,40(1):418-422. 被引量：2
5洪恩雨.大管径给排水管道径向变形自动检测[J].自动化技术与应用,2023,42(2):36-40. 被引量：1
6姚迎乐,李建,孙滨.拟合化处理不完整数据缺失序列插补算法仿真[J].计算机仿真,2023,40(1):523-527.
7屈瑾.基于语音识别的智能交互系统设计[J].自动化与仪器仪表,2023(1):221-225. 被引量：8
8洪宇,高骞,杨俊义,梁永青.基于DE-ELM算法的配电网电力系统负荷预测研究[J].吉林大学学报（信息科学版）,2022,40(6):918-923. 被引量：4
9钟远薪,王蕾,杨新涯,薛玉.徽州文书文本化语音识别技术应用研究[J].图书馆论坛,2023,43(2):49-56. 被引量：2
10熊景琦,桑庆兵,胡聪.结合感知损失与双重对抗网络的低剂量CT图像去噪[J].计算机工程,2023,49(2):213-221.

计算机仿真

2023年第1期

浏览历史

内容加载中请稍等...

基于At-LSTM模型的音/视频双流语音识别算法仿真被引量：1

参考文献15

二级参考文献86

共引文献148

同被引文献14

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于At-LSTM模型的音/视频双流语音识别算法仿真 被引量：1

参考文献15

二级参考文献86

共引文献148

同被引文献14

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于At-LSTM模型的音/视频双流语音识别算法仿真被引量：1