SOM-LSTM递归神经网络语音端点检测系统被引量：1

SOM-LSTM Recursive Neural Network Speech Recognition System

下载PDF

导出

摘要语音端点检测是语音信号处理的一个重要环节,传统的语音端点检测算法往往是基于短时能量以及过零率等实现,在低信噪比的环境下,检测算法的准确度较低。因此,提出了一种基于自组织映射(SOM)神经网络和长短时记忆(LSTM)递归神经网络相结合的端点检测算法。该算法通过检测语音信号在每个时间节点上的特征属性利用SOM神经网络进行聚类,并根据每个时间节点的语音状态对聚类结果进行调整,构造能够判别语音状态和噪声状态的样本作为LSTM递归神经网络的输入,利用LSTM递归神经网络实现端点检测的目的。 Speech endpoint detection is an important part of speech signal processing. The traditional speech endpoint detection algorithm is based on short-term energy and zero-crossing rate. In the low SNR environment, the accuracy of the detection algorithm is low. Therefore, an endpoint detection algorithm based on self-organizing map (SOM) neural network and long-term short-term memory (LSTM) recurrent neural network is proposed. The algorithm uses the SOM neural network to detect the feature attributes of the speech signal at each time node, and adjusts the clustering result according to the speech state of each time node to construct a sample that can discriminate the speech state and the noise state. Input to the LSTM recurrent neural network.

作者唐铠陆鹏 Tang Kai;Lu Peng(College of Computer and Information Technology, China Three Gorges University Yichang 443002 China;School of Mechanical Engineering, Yancheng Institute of Technology, Yancheng 224000, China)

机构地区三峡大学计算机与信息学院盐城工学院机械优集学院

出处《信息通信》 2019年第5期50-53,共4页 Information & Communications

关键词语音端点检测长短时记忆递归神经网络自组织映射神经网络语音状态堆叠无监督学习

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献4

1冀瑞国.神经网络在语音识别中的应用[J].电子技术与软件工程,2019(3):249-249. 被引量：4
2冯诗影,韩文廷,金旭,迟孟贤,安虹.循环神经网络在语音识别模型中的训练加速方法[J].小型微型计算机系统,2018,39(12):2561-2565. 被引量：9
3赵淑芳,董小雨.基于改进的LSTM深度神经网络语音识别研究[J].郑州大学学报（工学版）,2018,39(5):63-67. 被引量：26
4张文宇,刘畅.卷积神经网络算法在语音识别中的应用[J].信息技术,2018,42(10):147-152. 被引量：15

二级参考文献14

1史笑兴,顾明亮,王太君,何振亚.一种时间规整算法在神经网络语音识别中的应用[J].东南大学学报（自然科学版）,1999,29(5):47-51. 被引量：9
2孙志军,薛磊,许阳明,王正.深度学习研究综述[J].计算机应用研究,2012,29(8):2806-2810. 被引量：612
3田莎莎,唐菀,佘纬.改进MFCC参数在非特定人语音识别中的研究[J].科技通报,2013,29(3):139-142. 被引量：15
4余凯,贾磊,陈雨强,徐伟.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804. 被引量：606
5柯登峰,徐波.互联网时代语音识别基本问题[J].中国科学：信息科学,2013,43(12):1578-1597. 被引量：14
6李钊,卢苇,邢薇薇,孙占全,王伟东,魏云超.CNN视觉特征的图像检索[J].北京邮电大学学报,2015,38(B06):103-106. 被引量：21
7潘丽杰,徐本亮,朱琪,王利峰,缪惠根.基于双麦克风降噪技术的语音识别系统[J].现代电子技术,2016,39(2):137-139. 被引量：11
8李轩,李春升.一种交替变换更新层数的DBN-DNN快速训练方法[J].计算机应用研究,2016,33(3):843-847. 被引量：2
9吴进,张青.一种改进的孤立词语音识别系统设计[J].西安邮电大学学报,2016,21(1):76-80. 被引量：4
10陶佰睿,郭琴,苗凤娟,李青龙.基于自适应Mel滤波器组的MFCC特征提取的SOC设计[J].郑州大学学报（工学版）,2016,37(3):11-15. 被引量：3

共引文献48

1王怡,普运伟.基于CNN-BiLSTM-Attention融合神经网络的大气温度预测[J].中国水运（下半月）,2023(1):25-27. 被引量：3
2李卉,何晶,程富强,王晓薇,詹炳光.基于LSTM模型的卫星电源系统异常检测方法[J].装甲兵工程学院学报,2019,33(3):90-96. 被引量：3
3鲍瀛,何明远,李瑞瑶,何国平,王旭英,李显红,张耀.基于深度学习的宫颈癌智能辅助检测系统构建[J].中国数字医学,2021,16(7):44-49. 被引量：2
4郭龙银,扎西多吉,尚慧杰,旦增.基于LSTM的藏语语音识别[J].电脑知识与技术,2020,0(4):154-155. 被引量：2
5郑晓琼,汪晓,江海升,樊培培,张超.基于RNN和WFST译码的自动语音识别研究[J].信息技术,2019,43(6):115-120. 被引量：3
6侯涛,郑郁正.基于深度学习的通信信号调制方式识别[J].无线电工程,2019,49(9):796-800. 被引量：10
7王龙葛,王敏.基于用户评论的情感量化评分模型研究[J].数字技术与应用,2019,37(6):71-72. 被引量：1
8高树辉,姜晓佳.卷积神经网络在物证检验中的应用与毛发自动识别的展望[J].科学技术与工程,2019,19(23):1-9. 被引量：4
9高金峰,庞昊,杜耀恒.基于GRU网络的配电网故障数量等级预测方法[J].郑州大学学报（工学版）,2019,40(5):38-43. 被引量：3
10叶興,薛家祥.改进型LSTM网络光伏发电功率预测研究[J].中国测试,2019,45(11):14-20. 被引量：13

同被引文献8

1成新民,沈律,赵力,邹采荣.基于修正EM算法的说话人识别的研究[J].电声技术,2004,28(12):51-53. 被引量：4
2于明,袁玉倩,董浩,王哲.一种基于MFCC和LPCC的文本相关说话人识别方法[J].计算机应用,2006,26(4):883-885. 被引量：14
3吕治国,范文.基于DSP的身份确认双系统设计[J].通信电源技术,2013,30(3):33-35. 被引量：1
4甄斌,吴玺宏,刘志敏,迟惠生.语音识别和说话人识别中各倒谱分量的相对重要性[J].北京大学学报（自然科学版）,2001,37(3):371-378. 被引量：74
5刘玉珍,田金波.基于语音增强的双门限语音端点检测算法[J].测控技术,2016,35(11):33-35. 被引量：6
6欧国振,孙林慧,薛海双.基于重组超矢量的GMM-SVM说话人辨认系统[J].计算机技术与发展,2017,27(7):51-56. 被引量：3
7杨瑞田,周萍,杨青.TEO能量与Mel倒谱混合参数应用于说话人识别[J].计算机仿真,2017,34(8):215-219. 被引量：4
8周玥媛,孔钦.基于GMM-UBM的声纹识别技术的特征参数研究[J].计算机技术与发展,2020,30(5):76-83. 被引量：16

引证文献1

1孙佳宁,于玲.一种多特征融合的说话人辨认算法[J].电脑知识与技术,2022,18(15):82-84.

1马金风.计算教学中的“魔力”[J].新课程（小学）,2019,0(3):69-69.
2朱心怡,陈新业.感知武藏野美术大学图书馆的空间秩序之美[J].设计,2019,32(9):52-55. 被引量：1
3柯阳,隋杰.基于用户特征属性的微博话题关键用户挖掘[J].计算机应用研究,2019,36(6):1614-1617. 被引量：4
4刘慧,杨玉清,鲁梦瑶,李军会,赵龙莲.农产品市场环境下语音端点检测的研究[J].自动化技术与应用,2019,38(5):129-134. 被引量：1
5梁瑞宇,包永强,唐闺臣,王青云.语音信号处理实践课程的教学研究与改革[J].高教学刊,2019,0(13):73-75. 被引量：5
6姚彬,杜义华.一种基于深度学习的科普文章评论情感分析[J].科研信息化技术与应用,2018,9(4):27-33.
7黄金波,杨萍.SOM神经网络的矿井提升机减速器齿轮故障诊断研究[J].内燃机与配件,2019(11):149-150. 被引量：1
8田文洪,高印权,黄厚文,黎在万,张朝阳.基于多任务双向长短时记忆网络的隐式句间关系分析[J].中文信息学报,2019,33(5):47-53. 被引量：7
9和丽华,江涛,潘文林,杨建香,解雪琴,王璐,余彩裙.佤语语音语料端点检测算法[J].云南民族大学学报（自然科学版）,2019,28(2):186-190. 被引量：2
10宋利,刘靖.基于SOM神经网络的二阶变异体约简方法[J].软件学报,2019,30(5):1464-1480. 被引量：4

信息通信

2019年第5期

浏览历史

内容加载中请稍等...

SOM-LSTM递归神经网络语音端点检测系统被引量：1

参考文献4

二级参考文献14

共引文献48

同被引文献8

引证文献1

相关作者

相关机构

相关主题

浏览历史

SOM-LSTM递归神经网络语音端点检测系统 被引量：1

参考文献4

二级参考文献14

共引文献48

同被引文献8

引证文献1

相关作者

相关机构

相关主题

浏览历史

SOM-LSTM递归神经网络语音端点检测系统被引量：1