基于语谱图与稠密卷积神经网络的性别与年龄识别研究被引量：3

Gender and Age Recognition Based on Spectrogram and Dense Convolutional Neural Network

下载PDF

导出

摘要针对传统的特征提取算法与分类识别模型对说话人年龄的识别精确度较低,且受外界噪声影响较大等问题,提出了一种结合改进型语谱图与自建DenseNets网络对性别与年龄识别的方法。首先制作语谱图数据集并改进语谱图的特征提取方式,然后搭建网络模型对语谱图进行分类识别,最后对算法模型的性能进行分析,并实现在线识别说话人的声纹特征。实验结果表明:该算法模型可以有效识别说话人的性别与年龄区间,具有一定的实用意义。 In view of the low accuracy of speaker age recognition by traditional feature extraction algorithms and classification recognition models,and the great influence of external noise,a method for gender and age recognition is proposed by combining the improved language spectrograph and self-built DenseNets network.Firstly,the spectrogram data set is made and the feature extraction method of spectrogram is improved.Then,a network model is built to classify and recognize the spectrogram.Finally,the performance of the algorithm model is analyzed and online recognition of the speaker’s voice print features is realized.The experimental results show that the proposed algorithm can effectively identify the speaker’s gender and age range,and has certain practical value.

作者朱梦帆汪志成戴诗柏 ZHU Mengfan;WANG Zhicheng;DAI Shibai(School of Mechanical and Electronic Engineering,East China University of Technology,Nanchang 330013,China)

机构地区东华理工大学机械与电子工程学院

出处《仪表技术》 2022年第1期66-70,73,共6页 Instrumentation Technology

关键词语谱图稠密卷积神经网络性别识别年龄识别 spectrogram dense convolutional neural network gender recognition age recognition

分类号 TN912.3 [电子电信—通信与信息系统] TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献5

1许良凤,刘泳海,胡敏,王晓华,任福继.语谱图改进完全局部二值模式的语音情感识别[J].电子测量与仪器学报,2018,32(5):25-32. 被引量：10
2陶华伟,査诚,梁瑞宇,张昕然,赵力,王青云.面向语音情感识别的语谱图特征提取算法[J].东南大学学报（自然科学版）,2015,45(5):817-821. 被引量：17
3王秀芳,郭淞赫,崔翔宇,杨丹迪.基于改进经验模态分解的语音信号特征提取法[J].吉林大学学报（信息科学版）,2021,39(3):288-294. 被引量：3
4张晓艳,张天骐,葛宛营,白杨柳.联合深度神经网络和凸优化的单通道语音增强算法[J].声学学报,2021,46(3):471-480. 被引量：4
5侯一民,周慧琼,王政一.深度学习在语音识别中的研究进展综述[J].计算机应用研究,2017,34(8):2241-2246. 被引量：81

二级参考文献44

1岳倩倩,周萍,景新幸.基于非线性幂函数的听觉特征提取算法研究[J].微电子学与计算机,2015,32(6):163-166. 被引量：5
2Attabi Y, Dumouchel P. Anchor models for emotion recognition from speech [ J ]. IEEE Transactions on Af- fective Computing, 2013, 4(3) : 280-290.
3Ramakrishnan S, E1 Emary I M M. Speech emotion recognition approaches in human computer interaction [J]. Telecommunication Systems, 2013, 52(3) : 1467 - 1478.
4Lee A K C, Larson E, Maddox R K, et al. Using neu- roimaging to understand the cortical mechanisms of au- ditory selective attention[J]. Hearing Research, 2014, 307:111 - 120.
5Minker W, Pittermann J, Pittermann A, et al. Challen- ges in speech-based human-computer interfaces [ J ]. In- ternational Journal of Speech Technology, 2007, 10 ( 2/ 3) :109- 119.
6Zhao X M, Zhang S Q, Lei B C. Robust emotion rec- ognition in noisy speech via sparse representation [ J ]. Neural Computing and Applications, 2014, 24 ( 7/8 ) : 1539 - 1553.
7Huang C W, Chen G M, Yu H, et al. Speech emotion recognition under white noise [ J ]. Archives of Acous- tics, 2013, 38(4): 457-463.
8Yan J J, Wang X L, Gu W Y, et al. Speech emotion recognition based on sparse representation[ J]. Archives of Acoustics, 2013, 38(4) : 465 -470.
9Wu C H, Liang W B. Emotion recognition of affective speech based on multiple classifiers using acoustic-pro- sodic information and semantic labels [ J ]. IEEE Trans- actions on Affective Computing, 2011,2( 1 ) : 10 - 21.
10Bozkurt E, Erzin E, Erdem C E, et al. Formant posi- tion based weighted spectral features for emotion recog- nition[ J]. Speech Communication, 2011,53(9) : 1186 - 1197.

共引文献110

1师庆科,郑涛.大型三甲医院患者智能随访语音平台设计与应用[J].中国数字医学,2021,16(8):22-27. 被引量：11
2杨秀芳,陈卓,王驰.基于隐Markov模型的齿轮箱故障识别方法研究[J].电子测量与仪器学报,2020,32(11):115-123. 被引量：6
3卢洵波,李昕.特征融合的VAD方法在语音识别系统中的应用[J].电子测量技术,2020(7):129-136. 被引量：2
4李明节,陶洪铸,许洪强,刘金波,张强,张伟.电网调控领域人工智能技术框架与应用展望[J].电网技术,2020,44(2):393-400. 被引量：77
5易雪蓉,黄巍,胡迪,蒋怡.基于HMM的声调语音模型研究[J].武汉工程大学学报,2018,40(6):691-695. 被引量：2
6秦晓慧,侯霞,赵雪.一种融合语义角色和依存句法的实体关系抽取算法[J].北京信息科技大学学报（自然科学版）,2019,34(1):64-67. 被引量：4
7陆真,裴东兴.基于连续小波阈值函数的语音增强技术[J].山西电子技术,2016(1):40-42. 被引量：1
8李姗,徐珑婷.基于语谱图提取瓶颈特征的情感识别算法研究[J].计算机技术与发展,2017,27(5):82-86. 被引量：7
9田熙燕,徐君鹏,杜留锋.基于语谱图和卷积神经网络的语音情感识别[J].河南科技学院学报（自然科学版）,2017,45(2):62-68. 被引量：8
10王永飞.基于MATLAB语音信号处理一体化方法分析构建[J].陕西学前师范学院学报,2017,33(9):135-138. 被引量：1

同被引文献20

1余建潮,张瑞林.基于MFCC和LPCC的说话人识别[J].计算机工程与设计,2009,30(5):1189-1191. 被引量：47
2陆伟,戴蓓蒨,李辉,刘青松.MFCC中的基音频率信息对说话人识别系统性能的影响[J].中国科学技术大学学报,2009,39(8):859-863. 被引量：11
3王玥,钱志鸿,王雪,程光明.基于伽马通滤波器组的听觉特征提取算法研究[J].电子学报,2010,38(3):525-528. 被引量：28
4沈瑜,党建武,王阳萍,雷涛.加权短时自相关函数的基音周期估计算法[J].计算机工程与应用,2012,48(35):1-6. 被引量：9
5郑源,潘天航,王辉斌,葛新峰,张异众.改进EMD-ICA去噪在水轮机组隐蔽碰磨诊断中的应用研究[J].振动与冲击,2017,36(6):235-240. 被引量：26
6苗晓晓,张健,索宏彬,周若华,颜永红.应用于短时语音语种识别的时长扩展方法[J].清华大学学报（自然科学版）,2018,58(3):254-259. 被引量：7
7洪礼聪,王卫玉,陈启卷.基于连续小波变换和卷积神经网络的尾水管涡带状态识别[J].广东电力,2018,31(5):1-6. 被引量：8
8金马,宋彦,戴礼荣.基于卷积神经网络的语种识别系统[J].数据采集与处理,2019,34(2):322-330. 被引量：7
9贾艳洁,陈曦,于洁琼,王连明.基于特征语谱图和自适应聚类SOM的快速说话人识别[J].科学技术与工程,2019,19(15):211-218. 被引量：5
10梁春燕,曹伟.基于邻域保持嵌入算法的语种识别[J].陕西师范大学学报（自然科学版）,2020,48(2):38-42. 被引量：3

引证文献3

1李芳芳.一种水电厂水轮机碰撞故障声音识别的研究与应用[J].电力设备管理,2022(20):292-295.
2段云,邵玉斌,刘晶,龙华,杜庆治.一种基音频率归一化的语种识别方法[J].微电子学与计算机,2023,40(5):20-28.
3马志举,杜庆治,龙华,邵玉斌.基于改进语谱图的深度学习说话人识别[J].现代电子技术,2023,46(21):32-38. 被引量：1

二级引证文献1

1钱兴维,张祥.基于深度学习的声纹识别语音唤醒技术优化研究[J].电声技术,2024,48(6):53-55.

1杨治学,黄浩,胡英,吾守尔·斯拉木.基于深度神经网络的说话人年龄分类研究[J].现代电子技术,2021,44(10):120-124.
2徐培颖.未成年人个人信息保护中监护人同意之完善[J].太原城市职业技术学院学报,2022(5):180-182. 被引量：1

仪表技术

2022年第1期

浏览历史

内容加载中请稍等...

基于语谱图与稠密卷积神经网络的性别与年龄识别研究被引量：3

参考文献5

二级参考文献44

共引文献110

同被引文献20

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于语谱图与稠密卷积神经网络的性别与年龄识别研究 被引量：3

参考文献5

二级参考文献44

共引文献110

同被引文献20

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于语谱图与稠密卷积神经网络的性别与年龄识别研究被引量：3