连续音素的改进深信度网络的识别算法被引量：1

Phoneme recognition based on deep belief network

下载PDF

导出

摘要为提高连续语音识别中的音素识别率,提出一种基于改进并行回火训练的受限波尔兹曼机的音素识别算法。首先,利用经过等能量划分后的改进并行回火算法来训练受限玻尔兹曼机,接着将受限玻尔兹曼机堆叠组成一个深信度网络,从而作为深度神经网络预训练的基础模型,然后通过softmax层输出,得到用于音素状态后验概率检测的深度神经网络。接着,利用少量的标签数据,根据反向传播算法对网络权重进行微调。最后,将所得后验概率作为隐马尔科夫的发射概率,然后利用Viterbi解码器实现音素识别。在TIMIT语料库上的实验表明,识别率相比于传统的对比散度类算法提高了约4.5%,在不增加计算量的情况下比原始并行回火算法提高约1%。 In order to improve the accuracy of phoneme recognition in continuous speech recognition,in this paper,a modified parallel tempering (PT) algorithm applied to train the restricted Boltzmann machine (RBM) is proposed.Firstly,RBM is trained in light of Metropolis-Hasting for parallel tempering sampling,then stacking up RBMs to form a deep belief network (DBN) as the basis for deep neural network (DNN) pre-training,then by adding an output layer called “softmax” to the network,a DNN detecting the posterior probability of phoneme can be created.Subsequently,backward propagation algorithm is applied to fine-tune the weights discriminatively with less label data.Finally,the sequence of the predicted probability distribution is fed into a standard Viterbi decoder.The experiments show that the proposed method has a better performance on the TIMIT dataset than traditional ways.Its recognition rate is higher 4.5% than contrastive divergence (CD),and 1% than original PT without more computation.

作者阴法明赵焱赵力 YIN Faming;ZHAO Yan;ZHAO Li(Nanjing College of Information Technology,Nanjing 210023,China;School of Information Science and Engineering,Southeast University,Nanjing 210096,China)

机构地区南京信息职业技术学院通信学院东南大学信息科学工程学院

出处《应用声学》 CSCD 北大核心 2019年第1期39-44,共6页 Journal of Applied Acoustics

基金国家自然科学基金项目(61571106)

关键词并行回火受限玻尔兹曼机深信度网络音素识别 Parallel tempering Restricted Boltzmann machine Deep belief network Phoneme recognition

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

同被引文献2

1张敏,杜丹阳,李洪海.智能语音控制系统设计[J].工业控制计算机,2019,32(1):144-145. 被引量：10
2陈春玲,李雯雯,余瀚.嵌入式语音识别系统的测试方法研究[J].计算机技术与发展,2019,29(7):108-113. 被引量：6

引证文献1

1陈良林.基于语音交互的航线检查单的开发及应用[J].航空维修与工程,2020,0(1):57-59.

1程歆.出租车GPS数据的地图匹配算法研究[J].中国战略新兴产业,2017(6X):97-97. 被引量：1
2陶泽华,董海明,段益峰.太赫兹辐射场下的石墨烯光生载流子和光子发射[J].物理学报,2018,67(2):259-264.
3刘旻,李梅,徐晓宇,毛善君.一种基于HMM模型改进的地图匹配算法[J].北京大学学报（自然科学版）,2018,54(6):1235-1241. 被引量：15
4孙书宁.深度迁移学习中两种反向传播方法的比较[J].电子制作,2019,27(2):67-68.
5孙念,张毅,林海波,黄超.基于多特征i-vector的短语音说话人识别算法[J].计算机应用,2018,38(10):2839-2843. 被引量：6
6梁尧,朱杰,马志贤.基于深度神经网络的单通道语音分离算法[J].信息技术,2018,42(7):24-27. 被引量：4
7吴尚之.把握发展趋势推进深度融合[J].中国期刊年鉴,2017,16(1):14-18. 被引量：1
8任晓文,郭一娜,刘其嘉,李健宇.基于卷积神经网络的手势识别研究[J].太原科技大学学报,2019,40(1):1-5. 被引量：4
9常峰铭,易灵芝.基于深度学习的智能楼宇微网负荷预测方法研究[J].测控技术,2018,37(12):42-45. 被引量：3
10汪煜纯.神经网络在股票预测中的应用[J].通讯世界,2019,26(1):15-17. 被引量：1

应用声学

2019年第1期

浏览历史

内容加载中请稍等...

连续音素的改进深信度网络的识别算法被引量：1

同被引文献2

引证文献1

相关作者

相关机构

相关主题

浏览历史

连续音素的改进深信度网络的识别算法 被引量：1

同被引文献2

引证文献1

相关作者

相关机构

相关主题

浏览历史

连续音素的改进深信度网络的识别算法被引量：1