一种采用栈自动编码机的语音分类算法被引量：4

Research on the algorithm of speech classification using the stack autoencoder

下载PDF

导出

摘要为提高语音清音、浊音和静默帧的分类准确率,提出了一种基于栈自动编码机的语音分类新方法.该方法由栈自动编码机和Softmax分类器组成的深度神经网络实现.首先,提取子带信号强度、残差信号峰值、增益、基音周期和线谱频率作为训练序列无监督训练栈自动编码机;然后,使用栈自动编码机的输出对Softmax分类器进行有监督训练;最后,有监督微调整个网络,得到最终网络参数.实验结果表明,在不同背景噪声及不同信噪比下,文中算法的分类准确率均优于传统算法的,且信噪比越低,性能优势越明显. In order to improve the accuracy of the voiced/unvoiced/silence classification, a new method based on the Stack Autoencoder （SAE） is proposed. This method is implemented with a deep neural network composed of SAE and Softmax. First, the SAE is trained with the unsupervised method using a speech parameter training sequence which includes the residual signal peak, gains, pitch periods, and line spectrum frequency （LSF）, while the Softmax is trained with supervision by the use of the output of the SAE with the speech parameters training sequence as its training input. Then a supervised fine-turning method to the deep neural network is conducted to obtain the final parameters of the networks. Test results have shown that the accuracy of the speech classification of the presented method is better than the traditional methods in different background noise conditions with different signal-to-noise ratios （SNR）, especially in the low SNR condition.

作者马鸿飞赵月娇刘珂刘浩 MA Hongfei ZHAO Yuejiao LIU Ke LIU Hao(State Key Lab. of Integrated Service Networks, Xidian Univ., Xi＇an 710071, China)

机构地区西安电子科技大学综合业务网理论及关键技术国家重点实验室

出处《西安电子科技大学学报》 EI CAS CSCD 北大核心 2017年第5期13-17,共5页 Journal of Xidian University

关键词深度学习栈自动编码机语音处理语音分类 deep learning stack autoencoder speech processing speech classification

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

同被引文献36

1李如玮,鲍长春,窦慧晶.基于分带谱熵和小波域Teager能量的语音清浊分类算法[J].北京工业大学学报,2009,35(7):899-903. 被引量：1
2侯雪梅.一种SVM多类分类算法用于抗噪语音识别[J].西安邮电学院学报,2009,14(5):100-102. 被引量：6
3康广玉,郭世泽,孙圣和.基于子带能量的GMM含噪语音分类算法[J].仪器仪表学报,2009,30(9):1950-1955. 被引量：2
4徐新平,崔向群,蒲筠果,王志刚.数控皮革裁剪机的裁刀旋转控制算法研究[J].中国皮革,2010,39(13):49-51. 被引量：3
5王永,王敏,李敏.管理信息系统中用户个性化界面配置研究[J].科技管理研究,2012,32(17):220-224. 被引量：6
6李伟,辛耀中,沈国辉,黄昆,曹蓉蓉,孟鑫,万书鹏.基于CIM/G的电网图形维护与共享方案[J].电力系统自动化,2015,39(1):42-47. 被引量：50
7胡青,刘本永.基于卷积神经网络的说话人识别算法[J].计算机应用,2016,36(A01):79-81. 被引量：12
8史鹤欢,许悦雷,马时平,李岳云,李帅.PCA预训练的卷积神经网络目标识别算法[J].西安电子科技大学学报,2016,43(3):161-166. 被引量：26
9张彦,彭华.基于深度自编码器的单样本人脸识别[J].模式识别与人工智能,2017,30(4):343-352. 被引量：6
10张亚军,刘宗田,周文.基于深度信念网络的事件识别[J].电子学报,2017,45(6):1415-1423. 被引量：12

引证文献4

1李炜,宋威.基于深层自适应平衡自编码机的手写数字分类[J].传感器与微系统,2019,38(1):33-35. 被引量：2
2马苗,许西丹,武杰.一种耦合深度信念网络的图像识别方法[J].西安电子科技大学学报,2018,45(5):102-107. 被引量：10
3张道杰,张馨文.语音编码在自动化互动模型中的应用研究[J].电力系统保护与控制,2020,48(12):147-153. 被引量：1
4王娜,刘魏娜.基于课堂教学会话语料库的发言者分类算法研究[J].自动化技术与应用,2024,43(6):78-81.

二级引证文献13

1潘嘉,翟江涛,刘伟伟.基于改进递归残差网络的恶意流量分类算法[J].计算机应用研究,2020,37(S02):227-229. 被引量：4
2朱苏雅,杜建超,李云松,汪小鹏.采用U-Net卷积网络的桥梁裂缝检测方法[J].西安电子科技大学学报,2019,46(4):35-42. 被引量：51
3钟昕孜,廖闻剑.基于自编码器的语音情感识别方法研究[J].电子设计工程,2020,28(6):69-73. 被引量：5
4秦磊,汤鲲.基于改进深度置信网络的中文实体检测[J].电子设计工程,2020,28(3):38-42.
5朱程辉,沈飞,王建平,孙伟.基于反馈知识迁移的脱机手写体汉字识别方法[J].传感器与微系统,2020,39(5):30-33. 被引量：1
6杜小磊,陈志刚,王衍学.基于同步挤压S变换和集成深层脊波自编码器的轴承故障诊断[J].振动与冲击,2020,39(14):59-68. 被引量：6
7杭颖,廖昌义,任广为,黎楚阳.一种基于深度收缩自编码网络的变压器故障诊断方法[J].科技创新导报,2020,17(16):5-9. 被引量：2
8杜小磊,陈志刚,张楠,许旭.压缩感知和改进深层小波网络在轴承故障诊断中的应用[J].机械强度,2020,42(4):777-785. 被引量：5
9陈志刚,杜小磊,王衍学,张楠.改进集成深层自编码器在轴承故障诊断中的应用[J].控制与决策,2021,36(1):135-142. 被引量：6
10王平,江雨泽,赵光辉.目标检测的多尺度定位提升算法[J].西安电子科技大学学报,2021,48(3):85-90. 被引量：2

1李宛州.语音识别的简介[J].信号处理,1991,7(1):1-10. 被引量：2
2申元,孙英丽.数据通信中的语音信号处理[J].工业技术经济,1998,17(2):116-117.
3李学奇.清音图[J].广西民族师范学院学报,2017,34(3).
4李家伟.SAE与无损检测[J].无损检测,1996,18(6):164-165. 被引量：1
5韩芳,王学春,靳宗信.基于ACF的基音检测改进算法[J].现代电子技术,2017,40(19):71-74. 被引量：4
6黄健翀,邓玫玲.基于LSTM自动编码机的短文本聚类方法[J].计算技术与自动化,2017,36(3):75-80.
7袁宏伟.语音识别技术展望[J].软件工程师,1999(4):46-48.
8董晴,宋威.基于粒子群优化的深度神经网络分类算法[J].传感器与微系统,2017,36(9):143-146. 被引量：6
9凌公望.迎接语音和数据业务网络融合的挑战[J].山东通信技术,1999(3):1-4.
10谢绍国.《语音信号处理》课程教学改革研究[J].廊坊师范学院学报（自然科学版）,2017,17(3):112-113. 被引量：1

西安电子科技大学学报

2017年第5期

浏览历史

内容加载中请稍等...

一种采用栈自动编码机的语音分类算法被引量：4

同被引文献36

引证文献4

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

一种采用栈自动编码机的语音分类算法 被引量：4

同被引文献36

引证文献4

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

一种采用栈自动编码机的语音分类算法被引量：4