一种婴儿哭声识别优化算法的研究被引量：2

Research on an Infant Crying Recognition Optimization Algorithm

下载PDF

导出

摘要针对现有婴儿哭声识别方法在噪声环境下和不同婴儿间鲁棒性不足的问题,提出一种婴儿哭声识别的优化算法。利用子带谱熵法端点确定婴儿哭声信号的有效区间,增强算法在噪声环境下的鲁棒性;从有效哭声信号中提取平滑Mel频率倒谱系数(SMFCC)作为特征参数;基于SMFCC构建婴儿哭声模板,增强算法在不同婴儿间的鲁棒性;使用动态时间规整算法(DTW)计算哭声信号与模板的距离,得到识别结果。实验表明:在具有噪声的婴儿哭声测试集中,哭声识别准确率均达到72%以上,该方案在噪声环境下和不同婴儿个体的哭声识别中表现出较强的鲁棒性。 In order to overcome the shortcomings that the current infant crying recognition algorithms are not robust enough in a noisy environment and among different infants,an optimization algorithm for infant crying recognition is proposed.This method uses the subband spectral entropy method to detect the effective range of infant crying to improve the robustness of algorithm in noisy backgrounds.The smooth Mel frequency cepstrum coefficient(SMFCC)is extracted from the effective crying signals as the characteristic parameters among different infants.The infant crying template is constructed based on the SMFCC parameters to improve the robustness of the algorithm.The dynamic time warping algorithm(DTW)is used to calculate the distance between the crying signal and the template and obtain the recognition result.Experiments show that in the test set in noisy background,the crying recognition accuracy rate is more than 72%,the method shows strong robustness in the noise environment and different infants crying recognition.

作者林浩文张正道张明馨高超宏 LIN Hao-wen;ZHANG Zheng-dao;ZHANG Ming-xin;GAO Chao-hong(School of Internet of Things Engineering,Jiangnan University,Wuxi 214122,China;Key Laboratory of Advanced Process Control for Light Industry of Ministry of Education,Jiangnan University,Wuxi 214122,China)

机构地区江南大学物联网工程学院江南大学轻工过程先进控制教育部重点实验室

出处《测控技术》 2019年第12期46-51,共6页 Measurement & Control Technology

关键词婴儿哭声识别平滑Mel频率倒谱系数子带谱熵法基音频率动态时间规整 infant crying recognition smooth Mel frequency cepstrum coefficient subband spectrum entropy fundamental frequency dynamic time warping

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1顾国良,许鹏,沈晓燕.基于数字信号处理器的婴儿声音识别系统的设计与实现[J].生物医学工程研究,2018,37(3):276-280. 被引量：4
2董胡,钱盛友.改进的能量谱熵端点检测算法[J].测控技术,2016,35(6):26-29. 被引量：14
3吴尊敬,曹志刚.Improved MFCC-Based Feature for Robust Speaker Identification[J].Tsinghua Science and Technology,2005,10(2):158-161. 被引量：7
4陆伟,戴蓓蒨,李辉,刘青松.MFCC中的基音频率信息对说话人识别系统性能的影响[J].中国科学技术大学学报,2009,39(8):859-863. 被引量：11

二级参考文献23

1章熙春,曹燕,张军,韦岗.语音MFCC特征计算的改进算法[J].数据采集与处理,2005,20(2):161-165. 被引量：6
2林玮,杨莉莉,徐柏龄.基于修正MFCC参数汉语耳语音的话者识别[J].南京大学学报（自然科学版）,2006,42(1):54-62. 被引量：23
3郭武,王仁华,戴礼荣.基于基音周期与清浊音信息的梅尔倒谱参数[J].数据采集与处理,2007,22(2):229-233. 被引量：1
4Bimbot F, Bonastre J F, Fredouille C, et al. A tutorial on text-independent speaker verification[J]. EURASIP Journal on Applied Signal Processing, 2004, 4: 430-451.
5Davis S B, Mermelstein P. Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences[J]. IEEE Transactions on Acoustics, Speech Signal Process, 1980, 28(4): 357-366.
6Shannon B J, Paliwal K K. Feature extraction from higher-lag autocorrelation coefficients for robust speech recognition [J]. Speech Communication, 2006, 48 (11):1 458-1 485.
7Skowronski M D, Harris J G. Exploiting independent filter bandwidth of human factor cepstral coefficients in automatic speech recognition [J]. Journal of the Acoustical Society of America, 2004, 116(3): 1 774- 1 780.
8Shannon B J, Paliwal K K. A comparative study of filter bank spacing for speech recognition[C]// Proceedings of the Microelectronic Engineering Research Conference. Brisbane, Australia, 2003:1- 3.
9QuatieriTF.离散时间语音信号处理:原理与应用[M].赵胜辉,刘家康,谢湘,等译.北京:电子工业出版社,2004.
10Paul D. The spectral envelope estimation vocoder[J]. IEEE Transactions on Acoustics, Speech and Signal Processing, 1981, 29(4): 786-794.

共引文献31

1蒋晔,唐振民.GMM文本无关的说话人识别系统研究[J].计算机工程与应用,2010,46(11):179-182. 被引量：27
2王娜.基于MFCC的语音评分方法研究[J].中国现代教育装备,2010(15):41-44.
3方凡泉,李心广,王桂珍,林江豪.语音质量客观评价方法研究及实现[J].广州大学学报（自然科学版）,2011,10(1):65-69. 被引量：4
4余礼根,滕光辉,李保明,劳凤丹,邢永正.蛋鸡发声音频数据库的构建与应用[J].农业工程学报,2012,28(24):150-156. 被引量：20
5于震,王朝立,刘伶俐.基于减少阶数的Mel频谱倒谱系数改进[J].中国科技信息,2013(1):49-49. 被引量：1
6骆启帆,章坚武,吴震东.一种基于MFCC与韵律特征的说话人确认方法[J].杭州电子科技大学学报（自然科学版）,2013,33(5):134-137.
7兰胜坤,石翼波.说话人识别系统中MFCC参数的改进算法[J].洛阳理工学院学报（自然科学版）,2013,23(4):51-55. 被引量：1
8胡峰松,王磊.一种基于小波包分析的说话人识别算法[J].小型微型计算机系统,2014,35(7):1610-1614. 被引量：1
9张怡然,白静,王力.基于多窗频谱估计和平滑幅度谱包络的Mel频率倒谱系数(MFCC)改进算法[J].科学技术与工程,2014,22(19):253-256. 被引量：6
10张贺,沈天飞,滕秋霞.小词汇量孤立词语音识别系统多种特征组合参数的选择方法研究[J].电子测量技术,2015,38(3):48-53. 被引量：7

同被引文献3

1顾国良,许鹏,沈晓燕.基于数字信号处理器的婴儿声音识别系统的设计与实现[J].生物医学工程研究,2018,37(3):276-280. 被引量：4
2谢湘,张立强,王晶.残差网络在婴幼儿哭声识别中的应用[J].电子与信息学报,2019,41(1):233-239. 被引量：7
3李晓源.人工智能——婴儿哭声的“同声传译”（英文）[J].疯狂英语（新读写）,2019,0(12):41-42. 被引量：1

引证文献2

1文开妍,郭芷妍,彭业诚,周小茜,苏辰昊.基于声波特征提取的婴儿哭声分类算法研究[J].信息记录材料,2021,22(7):131-133.
2王汝旭,王荣燕,曾科,杨传德,刘超.基于Vision Transformer和迁移学习的家庭领域哭声识别[J].智能计算机与应用,2024,14(6):119-126.

1沈建,褚菲,代伟,贾润达,马小平.基于T-PLS的批次过程自适应优化策略研究[J].控制工程,2019,36(11):2067-2072.
2余倩,洪兆金,翟其俊,乔方圆,赵力.基于语音情感的心理咨询与性格分析算法研究[J].信息化研究,2019,45(5):27-31. 被引量：1
3郭颖奇,付佳,何飞,何凌,莫思特.基于语音情感计算的情绪识别电路研究与设计[J].现代电子技术,2019,42(22):59-62. 被引量：3
4麻利新,李萍,李芸.基于教与学算法的风力发电系统区间优化调度[J].工业控制计算机,2019,32(12):34-36. 被引量：2
5郑海青,张玉,孙晓云.卷积神经网络在锚杆锚固类型识别中的应用[J].济南大学学报（自然科学版）,2020,34(1):35-41. 被引量：2
6汪振辉,朱洪涛.轨道不平顺历史数据里程偏差修正研究[J].铁道标准设计,2019,63(12):49-53. 被引量：6
7路绍军,李红卫,郑昆,袁金琪,杨京辉,陈卫勇.缺气保用轮胎胎侧支撑胶出型破边的原因分析及改进措施[J].轮胎工业,2019,39(12):752-754.
8Lianggui Liu,Wei Li,Huiling Jia.Method of Time Series Similarity Measurement Based on Dynamic Time Warping[J].Computers, Materials & Continua,2018(10):97-106. 被引量：3
9胡星刚.基于陀螺仪的抗重放攻击语音认证方法[J].电子技术与软件工程,2019,0(24):90-91.
10闫美阳,李原.多源域混淆的双流深度迁移学习[J].中国图象图形学报,2019,24(12):2243-2254. 被引量：1

测控技术

2019年第12期

浏览历史

内容加载中请稍等...

一种婴儿哭声识别优化算法的研究被引量：2

参考文献4

二级参考文献23

共引文献31

同被引文献3

引证文献2

相关作者

相关机构

相关主题

浏览历史

一种婴儿哭声识别优化算法的研究 被引量：2

参考文献4

二级参考文献23

共引文献31

同被引文献3

引证文献2

相关作者

相关机构

相关主题

浏览历史

一种婴儿哭声识别优化算法的研究被引量：2