基于自适应心理声学模型的智能语音识别系统被引量：2

Intelligent speech recognition system based on self-adaption psychoacoustic model

下载PDF

导出

摘要针对包含环境噪声和信道失真等噪声的语音处理问题,提出了一种基于自适应心理声学模型的智能语音识别系统,并建立了听觉模型.该模型将心理声学和耳声发射(OAE)合并到了自动语音识别(ASR)系统中,利用AURORA2数据库分别在清洁训练条件和多训练条件下进行试验.结果表明,所提出的特征提取方法可以显著提高词识别率,优于梅尔频率倒谱系数(MFCC)、前向掩蔽(FM)、侧向抑制(LI)和倒谱平均值及方差归一化(CMVN)算法,能够有效地提高智能语音识别系统的性能. Aiming at such noise speech processing problems as environmental noise and channel distortion,an intelligent speech recognition system based on adaptive psychoacoustic system was proposed,and an auditory model was established. In the proposed model,the psychoacoustics and otoacoustic emission（OAE） were integrated into an automatic speech recognition（ASR） system. With the AURORA2 database,the experiments were performed under both clean and multiple training conditions,respectively.The results showthat the proposed feature extraction method can significantly improve the word recognition rate,is superior to those of Mel-frequency cepstral coefficients（MFCCs）,forward masking（FM）,lateral inhibition（LI） and cepstral mean variance normalization（CMVN） algorithms,and can effectively enhance the performance of intelligent speech recognition system.

作者熊笑颜陈栩黄灿英陈艳

机构地区南昌大学科学技术学院

出处《沈阳工业大学学报》 EI CAS 北大核心 2017年第6期675-679,共5页 Journal of Shenyang University of Technology

基金江西省教育厅科学技术研究项目(GJJ151504 GJJ151505) 江西省教育改革课题资助项目(JXJG-14-28-3 JXJG-14-28-1 JXJG-14-28-6 JXJG-14-28-8)

关键词梅尔频率倒谱系数耳声发射自适应心理声学滤波器自动语音识别 AURORA2数据库前向掩蔽侧向抑制 Mel-frequency cepstral coefficient(MFCC) otoacoustic emission(OAE) self-adaption psychoacoustic filter automatic speech recognition(ASR) AURORA2 database forward masking(FM) lateral inhibition(LI)

分类号 TP511 [自动化与计算机技术]

引文网络
相关文献

同被引文献22

1朱明,郭春生.隐马尔可夫模型及其最新应用与发展[J].计算机系统应用,2010,19(7):255-259. 被引量：25
2谢蒙,易法令,杨松润,吴裕伟.一种新的基于聚类决策的码本更新算法[J].计算机技术与发展,2013,23(3):101-104. 被引量：1
3孙师尧,妙全兴.基于改进HMM的半结构化文本信息抽取算法研究[J].电子科技,2014,27(10):111-114. 被引量：5
4吴佳龙,李坤,刘中.孤立词语音识别算法研究与设计[J].电子科技,2015,28(2):22-25. 被引量：6
5张炯,陶智勇.基于deep learning的语音识别[J].电子设计工程,2015,23(18):72-73. 被引量：2
6陈雷,杨俊安,王龙,李晋徽.连续语音识别中基于Dropout修正线性深度置信网络的声学模型[J].声学技术,2016,35(2):146-154. 被引量：4
7宋青松,田正鑫,孙文磊,吴小杰,安毅生.用于孤立数字语音识别的一种组合降维方法[J].西安交通大学学报,2016,50(6):42-46. 被引量：9
8贺杰,郭慧,李琳.基于视觉颜色对比敏感度模型的动态视频压缩预处理算法[J].计算机应用研究,2016,33(8):2552-2556. 被引量：3
9努尔麦麦提.尤鲁瓦斯,张力文,吾守尔.斯拉木.说话人自适应技术在维吾尔语语音识别中的应用研究[J].中文信息学报,2016,30(3):79-84. 被引量：4
10刘金刚,周翊,马永保,刘宏清.用于自动语音识别系统的切换语音功率谱估计算法[J].计算机应用,2016,36(12):3369-3373. 被引量：4

引证文献2

1李蓉.基于语音信号识别技术的智能发音练习系统[J].电子设计工程,2019,27(15):56-60. 被引量：3
2全龙翔,阿不力克木·吾甫尔,马超,武江波.基于上下文敏感区块的模糊语音准确识别方法[J].电子设计工程,2020,28(1):32-35.

二级引证文献3

1朱龙珠,盛妍,刘鲲鹏.基于深度学习的海量语音数据识别及分类方法研究[J].电子设计工程,2021,29(9):116-120. 被引量：4
2黄小奇,范晟,陈光文,许卓伟,彭锴,方志丹,王烁.基于Viterbi解码技术的智能语音交互算法研究[J].电子设计工程,2021,29(10):37-41. 被引量：5
3张昕煜.基于语音感知的英语口语发音自动校准系统[J].自动化技术与应用,2023,42(5):44-47. 被引量：1

1施唯佳,王琳,贾立鼎.智能语音机顶盒的软硬件实现方案[J].电信科学,2017,33(10):194-200. 被引量：1
2叶锐彬,张世明.中外拳击运动员运动性疲劳的中医对比研究[J].成都体育学院学报,2001,27(6):94-96.
3王建荣,高永春,张句,魏建国,党建武.基于Kinect辅助的机器人带噪语音识别[J].清华大学学报（自然科学版）,2017,57(9):921-925. 被引量：5
4吴劲松,徐志京.基于BP_Adaboost神经网络的船舶桨叶故障预警模型[J].微型机与应用,2017,36(18):52-54. 被引量：1
5天空.骑走天下开口说话[J].中国自行车,2017,0(10):143-143.
6王海坤,伍大勇,刘江,王士进,胡国平,胡郁.基于时域建模的自动语音识别[J].计算机工程与应用,2017,53(20):243-248. 被引量：6
7张亚祥,侯亮,卜祥建,张恩来,施文懂.应用灰色系统理论对叉车声品质分析与预测建模[J].科学技术与工程,2017,17(20):129-133. 被引量：3
8高敏,尹雪飞,陈克安.时频图像特征用于声场景分类[J].声学技术,2017,36(5):399-404. 被引量：1
9佟星,王雷.再启航试驾东风启辰D60[J].汽车之友,2017,0(21):40-45.
10张建中.困境中的曙光：2017年牛津路透数字新闻报告解读[J].新闻界,2017(10):95-102. 被引量：3

沈阳工业大学学报

2017年第6期

浏览历史

内容加载中请稍等...

基于自适应心理声学模型的智能语音识别系统被引量：2

同被引文献22

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于自适应心理声学模型的智能语音识别系统 被引量：2

同被引文献22

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于自适应心理声学模型的智能语音识别系统被引量：2