基于并行回火改进的GRBM的语音识别被引量：1

Improved speech recognition of GRBM based on parallel tempering

下载PDF

导出

摘要为提高连续语音识别中的识别准确率,采用高斯伯努利受限玻尔兹曼机进行语音训练和识别。通过结合并行回火算法的思想,采样、交换不同的温度链下的重构数据,实现在全局范围内对整个分布进行采样,提出一种基于并行回火改进的高斯伯努利受限玻尔兹曼机(GRBM-PT)的建模方法。该方法通过对语音信号的连续数据进行预训练分析、建模,最后使用支持向量机作为语音识别的分类器。在TI-Digits数字语音训练和数字测试数据库上的实验结果表明,语音识别率能够达到83.14%,基于GRBM-PT模型下的语音识别率明显优于RBM,RBM-PT以及GRBM模型的性能。 To improve the performance of continuous data in speech recognition, the Gaussian-Bernoulli Restricted Boltzmann Machine（GRBM）is used to train and recognize the speech signal based on a developed recognition method.An improved GRBM network based on Parallel Tempering（GRBM-PT）is proposed by combining with the parallel tempering learning algorithm, which samples and swaps the reconstructed data in the different temperatures of entire distribution. Based on a scheme of pre-training and modeling the speech signal, the outputs are classified with a Support Vector Machine（SVM）. The experimental results of digit speech recognition on the core test of TI-Digits show that the proposed scheme works very well, the accuracy can be as high as 83.14%. It is found that the GRBM-PT performs better than other methods, such as RBM, RBM-PT and GRBM.

作者赵彩光张树群雷兆宜

机构地区暨南大学信息科学技术学院

出处《计算机工程与应用》 CSCD 北大核心 2016年第8期125-129,168,共6页 Computer Engineering and Applications

关键词高斯伯努利受限玻尔兹曼机(GRBM) 受限玻尔兹曼机并行回火语音识别 Gaussian-Bernoulli Restricted Boltzmann Machine（GRBM） restricted Boltzmann machine parallel tempering speech recognition

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献20

1Hinton G,Deng L,Yu D,et al.Deep neural networks for acoustic modeling in speech recognition:the shared views of four research groups[J].IEEE Signal Processing Magazine,2012,29(6):82-97.
2Mohamed A,Dahl G E,Hinton G,et al.Acoustic modeling using deep belief networks[J].IEEE Transactions on Audio,Speech and Language Processing,2012,20(1):14-22.
3Hinton G E,Osindero S,Teh Y W.A fast learning algorithm for deep belief nets[J].Neural Computation,2006,18(7):1527-1554.
4Mohamed A,Dahl G,Hinton G.Deep belief networks for phone recognition[C]//Proc NIPS Workshop Deep Learning for Speech Recognition and Related Applications,2009.
5Fischer A,Igel C.An introduction to restricted Boltzmann machines[M]//Progress in pattern recognition,image analysis,computer vision,and applications.Berlin/Heidelberg:Springer,2012:14-36.
6Salakhutdinov R,Mnih A,Hinton G.Restricted Boltzmann machines for collaborative filtering[C]//Proceedings of the24th International Conference on Machine Learning,2007:791-798.
7Hinton G.A practical guide to training restricted Boltzmann machines[J].Momentum,2010,9(1).
8Katzgraber H G,Trebst S,Huse D A,et al.Feedbackoptimized parallel tempering Monte Carlo[J].Journal of Statistical Mechanics:Theory and Experiment,2006,2006(3).
9Earl D J,Deem M W.Parallel tempering:theory,applications,and new perspectives[J].Physical Chemistry Chemical Physics,2005,7(23):3910-3916.
10Mingas G,Bouganis C S.Parallel tempering MCMC acceleration using reconfigurable hardware[M]//Reconfigurable computing:architectures,tools and applications.Berlin/Heidelberg:Springer,2012:227-238.

二级参考文献11

1陈平.ESTIMATORS AND SOME BEHAVIORS FORA PARTIALLY LINEAR MODEL WITH CENSORED DATA[J].Acta Mathematica Scientia,1999,19(3):321-331. 被引量：2
2孟庆芳,张强,牟文英.混沌序列自适应多步预测及在股票中的应用[J].系统工程理论与实践,2005,25(12):62-68. 被引量：8
3Altaleb A, Chauveau D. Bayesian analysis of the Logit model and comparison of two Metropolis-Hastings strategies [J]. Computational Statistics & Data Analysis, 2002,39(1) : 137 - 152.
4Roberts G O,Rosenthal J S. Optimal scaling for various Metropolis-Hastings algorlthms[J]. Statistical Science, 2001, 6(4):351 - 367.
5Geweke J, Tanizaki H. Note on the sampling distribution for the Metropolis-Hastings algorithm[J]. Communication in Statistics-Theory and Methods, 2003, 32(4) : 775 - 789.
6Sawyer S. The Metropolitan-Hastings algorithm and extensions[ J ]. Washington University, April 17, 2004.
7Chen P. Some nonparametric estimators and their properties under the competing risks case[J]. Sankhya: Indian J Statist Series A, 1998, 60(2) : 293 - 304.
8Chen P, Yan F R, Wu Y Y, et al. Detection of oufliers in ARMAX time series models [ J ]. The 5th IIGSS Workshop, Wuhan. June, 2007, to appear.
9Chen P, Chen Y. The Identification of Oufliers in ARMAX Models via Genetic Algorithm[J]. The 5th IIGSS Workshop, Wuhan June, 2007, to appear.
10陈平,达庆利.运用SAS软件系统对我国农作物受灾及成灾面积的预测分析[J].系统工程理论与实践,2001,21(4):141-144. 被引量：8

共引文献29

1陈双飞,冷丹,宁军,殷荣忠,朱永茂,刘勇,潘晓天,张骥红,李丽娟,刘小峰,范君怡,邹林.2008～2009年世界塑料工业进展[J].塑料工业,2010,38(3):1-35. 被引量：12
2王恺明,潘和平,张煜中.基于SGT分布的贝叶斯统计推断的在险价值研究[J].系统工程理论与实践,2010,30(3):419-425. 被引量：1
3张曼,唐小松,李典庆.含相关非正态变量边坡可靠度分析的子集模拟方法[J].武汉大学学报（工学版）,2012,45(1):41-45. 被引量：11
4蒋水华,李典庆,方国光.结构可靠度分析的响应面法和随机响应面法的比较[J].武汉大学学报（工学版）,2012,45(1):46-53. 被引量：22
5周林,梁彦,潘泉.基于Metropolis-Hastings抽样的系统误差配准方法[J].系统工程与电子技术,2012,34(3):433-438. 被引量：2
6郭文强,高晓光,任佳.分段平稳变结构DBN模型区域内的结构学习[J].系统工程与电子技术,2012,34(4):704-708.
7周林,潘泉,梁彦.Markov随机跳变系统的传感器系统误差估计[J].航空学报,2012,33(6):1070-1076.
8房长宇,张耀庭.无粘结全预应力砼梁预应力损失的贝叶斯估计[J].科学技术与工程,2012,20(18):4440-4446.
9房冠成,吕震宙,魏鹏飞.结构系统可靠性及可靠性灵敏度分析的改进子集模拟法[J].航空学报,2012,33(8):1440-1447. 被引量：4
10邓明,钱争鸣.我国省际知识生产及其空间溢出的动态时变特征——基于Spatial SUR模型的经验分析[J].数理统计与管理,2013,32(4):571-585. 被引量：13

同被引文献12

1黄婷,周萍,景新幸,杨青.改进型Mel混合参数应用于说话人识别[J].微电子学与计算机,2016,33(4):60-63. 被引量：2
2刘丽静.论《普通话培训与测试》教材中朗读作品的句型分析[J].学术论坛,2016,38(4):176-180. 被引量：3
3周梅.技术视角下普通话水平测试发展研究[J].语言科学,2016,15(3):332-336. 被引量：2
4齐军华.从复审看计算机辅助普通话水平测试的几个问题[J].语言文字应用,2018(3):97-105. 被引量：3
5石毓智.语言研究的系统观[J].解放军外国语学院学报,2018,41(5):39-51. 被引量：5
6李虹,徐小力,吴国新,丁春艳,赵学梅.基于MFCC的语音情感特征提取研究[J].电子测量与仪器学报,2017,31(3):448-453. 被引量：28
7王海坤,伍大勇,刘江,王士进,胡国平,胡郁.基于时域建模的自动语音识别[J].计算机工程与应用,2017,53(20):243-248. 被引量：6
8孙念,张毅,林海波,黄超.基于多特征i-vector的短语音说话人识别算法[J].计算机应用,2018,38(10):2839-2843. 被引量：6
9胡永,张旭东,赵静,吴蔚华,徐永生.智能终端语音识别用户体验测评研究[J].电视技术,2019,43(1):60-65. 被引量：3
10张立民,王彦哲,张兵强,朱念斌.基于CTC准则的普通话识别及改进[J].计算机工程,2019,45(6):249-253. 被引量：7

引证文献1

1马艳荣.复杂环境下的计算机辅助普通话测试系统设计[J].电子测量技术,2020,43(20):26-30. 被引量：2

二级引证文献2

1王晨霞.普通话计算机智能测试替代人工测试的思考[J].电子技术与软件工程,2021(13):144-145. 被引量：1
2屈晶.基于计算机辅助测试环境下的普通话应试技巧分析[J].科技资讯,2022,20(3):233-235.

1周贤娟,赵发,冷强,杨欢.具有语音识别功能的无线传感器网络节点设计[J].单片机与嵌入式系统应用,2014,14(7):57-59.
2赵彩光,张树群,雷兆宜.基于改进对比散度的GRBM语音识别[J].计算机工程,2015,41(5):213-218. 被引量：4
3Mellanox创新网络支撑科大讯飞走向前台[J].中国信息化,2016,0(12):94-94.
4姚兵.君子动口不动手——声龙语音识别系统使用手记[J].微电脑世界,2000(29):50-50.
5龙望晨.基于虚拟化技术的计算机实验室管理模型[J].工业控制计算机,2016,29(7):120-121. 被引量：4
6张戈,严欢,殷景华.基于HTK调用MatLab的语音识别的研究[J].现代计算机,2010,16(9):31-33. 被引量：2
7吴忠仪.借用QQ语音聊天实现文字快速录入[J].电脑迷,2012(2):70-70.
8陈国松,张之翼,唐美华,黄立明,王镇浦.模拟退火-回火算法在原子吸收分光光度多元测定中的应用[J].南京化工大学学报,2000,22(5):46-46. 被引量：1
9李涛,李冬梅,黄仁杰,赵雪专.基于团块分析的人数统计(英文)[J].安徽大学学报（自然科学版）,2015,39(4):57-66.
10李金厚.FEBM模型中的一点不足与改进[J].安徽工业大学学报（自然科学版）,2002,19(2):145-147.

计算机工程与应用

2016年第8期

浏览历史

内容加载中请稍等...

基于并行回火改进的GRBM的语音识别被引量：1

参考文献20

二级参考文献11

共引文献29

同被引文献12

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于并行回火改进的GRBM的语音识别 被引量：1

参考文献20

二级参考文献11

共引文献29

同被引文献12

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于并行回火改进的GRBM的语音识别被引量：1