听觉模型鲁棒性特征研究及应用被引量：1

Research and Application of Robust Characteristics of A uditory Models

下载PDF

导出

摘要人类的听觉系统具有非常精细而巧妙的结构,即使在嘈杂的环境中,也能准确地理解语音。采用精细的耳蜗模型作为前端处理可以实现更好的语音处理。利用快速压缩的非对称谐振器级联(CARFAC)作为人耳外周模型,结合听觉稳定图像得到精确的皮层前听觉模型。在听觉模型的基础上提取较准确的基音轮廓,利用基音信息进行声场景分析,合成鲁棒性语音特征,并将其送入神经网络进行监督训练,以实现语音增强。实验结果表明,噪声条件下,由听觉模型提取的特征在各语音评价指标下都有较好的体现,可以更好表征语音信号,具有一定的鲁棒性。 The human auditory system has a very fine and ingenious structure,and it can accurately understand speech even in a noisy environment.Using a fine cochlea model as front-end processing allows for better speech processing.In this paper,a rapidly compressed asymmetric resonator cascade(CARFAC)is used as a peripheral model of the human ear,combined with an auditory stabilization image(SAI)to obtain an accurate precortical auditory model.Based on the auditory model,a more accurate pitch contour is extracted,the pitch information is used to analyze the acoustic scene,and robust speech features are synthesized,which are sent to the neural network for supervised training to achieve speech enhancement.Experiments show that under noise conditions,the features extracted by the auditory model are better reflected in various speech evaluation indicators,which can better characterize the speech signal and have certain robustness.

作者王文华夏秀渝 WANG Wenhua;XIA Xiuyu(School of Electronic Informnation,Sichuan University,Chengdu 610064,China)

机构地区四川大学电子信息学院

出处《成都信息工程大学学报》 2024年第3期275-282,共8页 Journal of Chengdu University of Information Technology

关键词 CARFAC模型听觉稳定图像语音增强系统基音提取 CARFAC model auditory stabilization image speech enhancement system pitch extraction

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1孙林慧,王灿,梁文清,李平安.基于深度学习特征融合和联合约束的单通道语音分离方法[J].电子与信息学报,2022,44(9):3266-3276. 被引量：3
2张涛,任相赢,刘阳,耿彦章.基于自编码特征的语音增强声学特征提取[J].计算机科学与探索,2019,13(8):1341-1350. 被引量：7

二级参考文献6

1田元荣,王星,周一鹏.一种新的基于稀疏表示的单通道盲源分离算法[J].电子与信息学报,2017,39(6):1371-1378. 被引量：5
2周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1726
3路志英,任一墨,孙晓磊,贾惠珍.基于深度学习的短时强降水天气识别[J].天津大学学报（自然科学与工程技术版）,2018,51(2):111-119. 被引量：18
4付卫红,张琮.基于步长自适应的独立向量分析卷积盲分离算法[J].电子与信息学报,2018,40(9):2158-2164. 被引量：5
5陆慧娟,刘亚卿,孟亚琼,关伟,刘砚秋.面向基因数据分类的核主成分分析旋转森林算法[J].计算机科学与探索,2017,11(10):1570-1578. 被引量：6
6李红光,郭英,张东伟,杨银松,齐子森,眭萍.基于欠定盲源分离的同步跳频信号网台分选[J].电子与信息学报,2021,43(2):319-328. 被引量：10

共引文献8

1章瑾,冯平.影视动画配音节奏特征自动提取系统设计[J].现代电子技术,2020,43(18):59-63. 被引量：1
2许春冬,徐琅,周滨,凌贤鹏.单通道语音增强技术的研究现状与发展趋势[J].江西理工大学学报,2020,41(5):55-64. 被引量：1
3吴文龙,周喜,王轶,王保全.WKAG:一种针对不平衡医保数据的欺诈检测方法[J].计算机工程与应用,2021,57(9):247-254. 被引量：9
4杨磊,姚汝婧.基于Transformer的信用卡违约预测模型研究[J].计算机仿真,2021,38(8):440-444. 被引量：3
5李新.功率谱估计在舰船噪声特征提取中的应用仿真[J].舰船科学技术,2022,44(4):43-46. 被引量：1
6赵峰,李妞妞.基于混合采样和自编码器的信用卡欺诈检测应用[J].哈尔滨商业大学学报（自然科学版）,2022,38(4):420-426. 被引量：1
7孙林慧,袁硕,张蒙,梁文清,步云怡.基于强约束字典联合深度神经网络的单通道语音分离[J].南京邮电大学学报（自然科学版）,2023,43(2):1-10. 被引量：1
8赫嘉楠,栗磊,牛健,郭东霞,刘海涛,钟旭.基于最小二乘法的变电站故障录波测距系统设计[J].自动化仪表,2024,45(7):89-93.

同被引文献2

1王宁,刘剑,刘苏洋.基于时延估计改进的主动隔声耳罩语音增强算法[J].声学技术,2023,42(6):785-793. 被引量：1
2傅晓雯,李霞.基于改进NMF与相位补偿的胎心音降噪算法[J].计算机应用与软件,2024,41(4):256-261. 被引量：1

引证文献1

1朱亚峰,贾林锋,张炜.基于视觉模态尺度融合的语音分离方法[J].仪器与设备,2024,12(3):315-328.

1张文杰,孙成立.面向嵌入式系统多通道回声消除语音增强方法[J].长江信息通信,2024,37(4):64-68.
2杨政,王世博,饶柱石,杨善国,杨建华,刘送永,刘后广.基于听觉特征融合的煤矸识别方法研究[J].振动与冲击,2024,43(8):136-144.
3孙洪涛,刘春防,李望荣.一种基于K210的声音采集与识别系统设计[J].计算机应用文摘,2024,40(8):99-101.
4石庆升,陈家良,董哲.基于听觉显著性特征的发电机组主轴承性能评估[J].科学技术与工程,2024,24(1):205-214.
5毛阳,李永焯,禹丹江.基于粗糙度和调制分析的电机粗糙感排查与修改预测[J].汽车实用技术,2024,49(7):125-129.
6马静.浅析语音特征参数提取方法[J].中国科技经济新闻数据库教育,2016(10):129-129.
7金雪玲,罗五根,黄小燕△.碘伏耳毒性的相关研究进展[J].中国科技期刊数据库医药,2016(9):138-138.

成都信息工程大学学报

2024年第3期

浏览历史

内容加载中请稍等...

听觉模型鲁棒性特征研究及应用被引量：1

参考文献2

二级参考文献6

共引文献8

同被引文献2

引证文献1

相关作者

相关机构

相关主题

浏览历史

听觉模型鲁棒性特征研究及应用 被引量：1

参考文献2

二级参考文献6

共引文献8

同被引文献2

引证文献1

相关作者

相关机构

相关主题

浏览历史

听觉模型鲁棒性特征研究及应用被引量：1