基于谱熵梅尔积的语音端点检测方法被引量：15

Voice Activity Detection Method Based on MFPH

导出

摘要为了克服传统语音端点检测算法在低信噪比环境下准确率低的问题,提出一种基于谱熵梅尔积(MFPH)的语音端点检测算法.首先,提取带噪语音信号的梅尔频率倒谱系数中的第一维参数MFCC0,将其与谱熵的乘积作为最终区分语音段和背景噪声段的融合特征参数;然后,结合模糊C均值聚类算法和贝叶斯信息准则(BIC)算法对MFPH特征参数门限值进行自适应估计;最后,采用双门限法进行语音端点检测.实验结果证明,与传统方法比较,该方法在-5~15 d B低信噪比环境下的语音端点检测准确率有较大提高. In order to solve the problem that the accuracy of traditional voice activity detection algorithms is low in the low signal-to-noise ratio(SNR)environment,a voice activity detection algorithm based on product of spectral entropy and Mel(MFPH)was proposed.Firstly,the first dimensional parameter MFCC0 of Mel frequency spectrum coefficient of the speech signal with noisy was extracted,and the product of MFCC0 and spectral entropy was taken as fusion characteristic parameter of finally distinguishing speech segment from background noise.Then,the threshold value of MFPH characteristic parameters was estimated adaptively based on combination of fuzzy C-means clustering algorithm(FCM)and Bayesian information criterion(BIC).Finally,the double-threshold method was adopted for the voice activity detection.Experiments show that the accuracy of the proposed method is greatly improved in the-5~15 dB low SNR environment compared with traditional methods.

作者吴新忠夏令祥张旭周成 WU Xin-zhong;XIA Ling-xiang;ZHANG Xu;ZHOU Cheng(School of Information and Control Engineering,China University of Mining and Technology,Jiangsu Xuzhou 221116,China)

机构地区中国矿业大学信息与控制工程学院

出处《北京邮电大学学报》 EI CAS CSCD 北大核心 2019年第2期83-89,共7页 Journal of Beijing University of Posts and Telecommunications

基金 “十三五”国家重点研发计划项目(2016YFC0801800) 江苏省重点研发计划项目(BE2016046)

关键词语音端点检测梅尔频率倒谱系数谱熵谱熵梅尔积双门限法低信噪比 voice activity detection Mel frequency spectrum coefficient spectral entropy spectral entropy Mel product double-threshold method low signal-to-noise ratio

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献3

1胡波,肖熙.检测语音端点及基音的概率模型及方法[J].清华大学学报（自然科学版）,2013,53(6):749-752. 被引量：4
2张毅,倪雷.基于模糊熵与改进相关向量机的语音端点检测[J].华中科技大学学报（自然科学版）,2017,45(8):15-19. 被引量：6
3张晓雷,吴及,吕萍.基于支持向量机与多观测复合特征矢量的语音端点检测[J].清华大学学报（自然科学版）,2011,51(9):1209-1214. 被引量：3

二级参考文献27

1Ramirez J, Segura J, Benitez C, et al. Efficient voice activity detection algorithms using long-term speech information [J].Speech Commun, 2004, 42(3-4) : 271 - 287.
2Sohn J, Kim N S, Sung W. A statistical model based voice activity detection [J]. IEEE Signal Process Lett, 1999, 6(1):1-3.
3Shin J, Chang J, Kim N. Voice activity detection based on statistical models and machine learning approaches [J]. Computer Speech & Language, 2010, 24(3): 515- 530.
4Jo Q, Chang J, Shin J, Kim N. Statistical model-based voice activity detection using support vector machine [J]. IET Signal Process, 2009, 3(3) : 205 - 210.
5Ramirez J, Yelamos P, Gorriz J, at al. SVM-based speech endpoint detection using contextual speech features [J]. Electron lett, 2006, 42(7): 426-428.
6Scholkopf B, Smola A J. Learning with Kernels [M]. Cambridge, MA: MIT Press, 2002.
7YU Tao, Hansen J H L. Discriminative training for multiple observation likelihood ratio based voice activity detection [J]. IEEE Signal Process Lett, 2010, 17(11): 897-900.
8Ramirez J, Segura J C, Gorriz J M, at al. Improved voice activity detection using contextual multiple hypothesis testing for robust speech recognition[J]. IEEE Trans Audio, Speech Lang Process, 2007, 15(8): 2177-2189.
9Ramirez J, Segura J C, Benitez C, et al. Statistical voice activity detection using a multiple observation likelihood ratio test [J]. IEEE Signal Process Lett, 2005, 12(10): 689 -692.
10Ephraim Y, Malah D. Speech enhancement using a minimummean square error short-time spectral amplitude estimator [J]. IEEE Trans Audio, Speech Lang Process, 1984, 32(6): 1109-1121.

共引文献10

1李正友,李天伟,黄谦.基于共振峰谐波特征和支持向量机的VDR人声检测方法[J].舰船科学技术,2013(2):99-102.
2张君昌,胡海涛,崔力.融合Burg谱估计与信号变化率测度的语音端点检测[J].西安电子科技大学学报,2014,41(3):192-195. 被引量：5
3徐昕,张天骐,石穗,张亚娟.结合语音增强的基音检测改进方法[J].计算机工程与设计,2015,36(3):699-704. 被引量：4
4李大中,赵杰.基于FOA-SVM的超声信号端点检测[J].中国测试,2016,42(5):103-106. 被引量：3
5林琴,涂铮铮,王庆伟,郭玉堂.一种基于近邻传播聚类的语音端点检测方法[J].安徽大学学报（自然科学版）,2019,43(3):27-32. 被引量：3
6唐俊龙,刘远治,禹智文,张竣.语音端点检测中能零比方法的改进[J].电子测试,2020,31(7):47-49. 被引量：7
7雷静,何培宇,徐自励.低信噪比下多参数融合的自适应语音端点检测[J].信号处理,2020,36(8):1205-1211. 被引量：4
8吕昊,章小兵,蔡诚.一种低信噪比下语音端点检测的改进算法[J].皖西学院学报,2021,37(2):45-50. 被引量：1
9柏顺,颜夕宏,张生平,陈建飞,张胜.基于梅尔频率倒谱系数与短时能量的低信噪比语音端点检测[J].南京师大学报（自然科学版）,2021,44(2):117-120. 被引量：9
10韩天,张宏国,郑重,崔扬,于晓洋.基于时序结构的听觉感知语音信号端点特征检测[J].吉林大学学报（工学版）,2019,49(1):313-318. 被引量：2

同被引文献102

1李艳生,刘园,张毅,杨美美.混响环境下移动机器人语音控制方法及系统实现[J].仪器仪表学报,2019,40(11):165-171. 被引量：14
2张重远,罗世豪,岳浩天,王博闻,刘云鹏.基于Mel时频谱-卷积神经网络的变压器铁芯声纹模式识别方法[J].高电压技术,2020,46(2):413-423. 被引量：70
3刘红星,戴蓓蒨,陆伟.基于共振峰谐波能量的语音端点检测[J].清华大学学报（自然科学版）,2008,48(S1):754-759. 被引量：11
4张卫强,刘加.基于听感知特征的语种识别[J].清华大学学报（自然科学版）,2009(1):78-81. 被引量：21
5宋倩倩,于凤芹.基于EMD和改进双门限法的语音端点检测[J].电声技术,2009,33(8):60-63. 被引量：13
6王桂芝,王广亮.改进的快速DBSCAN算法[J].计算机应用,2009,29(9):2505-2508. 被引量：24
7王志明.一种有效的音频分割算法[J].湖南理工学院学报（自然科学版）,2009,22(3):37-40. 被引量：3
8王玥,钱志鸿,王雪,程光明.基于伽马通滤波器组的听觉特征提取算法研究[J].电子学报,2010,38(3):525-528. 被引量：28
9赵欢,王纲金,赵丽霞.一种新的对数能量谱熵语音端点检测方法[J].湖南大学学报（自然科学版）,2010,37(7):72-77. 被引量：17
10汉小欢,景新幸.基于功率谱差分和TEO的语音端点检测[J].计算机应用与软件,2011,28(4):82-83. 被引量：6

引证文献15

1卢洵波,李昕.特征融合的VAD方法在语音识别系统中的应用[J].电子测量技术,2020(7):129-136. 被引量：2
2邓鑫,王岩松,杨超,郭辉.基于融合特征的汽车鸣笛声识别方法[J].智能计算机与应用,2021,11(12):197-200. 被引量：1
3赵至柔,邵玉斌,龙华,唐传林.基于能零比与峰谷点的汉语语音音节分割算法[J].电子测量技术,2020,43(6):174-178. 被引量：4
4包涵,范晓安.云计算环境下不平衡大数据动态分类仿真[J].计算机仿真,2020,37(8):311-314. 被引量：8
5吴亚文,邵睿,李淼,张锋,陶浩兵,辜丽川,焦俊.基于改进EMD-TEO倒谱距离的生猪音频信号端点检测[J].中国农业大学学报,2021,26(4):104-116. 被引量：4
6柏顺,颜夕宏,张生平,陈建飞,张胜.基于梅尔频率倒谱系数与短时能量的低信噪比语音端点检测[J].南京师大学报（自然科学版）,2021,44(2):117-120. 被引量：9
7陈爱华,张石清.基于深度神经网络和多特征融合的语音端点检测[J].台州学院学报,2021,43(3):1-6. 被引量：3
8罗思洋,龙华,邵玉斌,杜庆治.噪声环境下多特征融合的语音端点检测方法[J].云南大学学报（自然科学版）,2021,43(4):671-680. 被引量：11
9马小平,李博华,蔡蔓利,韩正化,陈泽彭.基于谱熵梅尔积和改进VMD的轴承故障预警[J].北京理工大学学报,2021,41(11):1179-1187. 被引量：8
10董小泊.基于DBSCAN的风电叶片音频分类研究[J].科技创新与应用,2022,12(4):23-25. 被引量：1

二级引证文献50

1秦亮亮.基于MMED+TQWT算法的轴承机电故障信号识别分析[J].工程机械文摘,2023(4):10-13. 被引量：1
2钟贤硕,牛泽,白文斌,李凯.射孔起爆的振动特征监测系统[J].国外电子测量技术,2021,40(2):16-20.
3张健.云计算背景下大数据自动分类处理系统设计[J].电子测试,2021,32(16):72-73. 被引量：1
4邬友朋,赵金龙,贾中营.一种基于KNN/CNN的供热客服音频分类方法[J].电力大数据,2021,24(7):56-66. 被引量：1
5周妙琪,方福海,李婷,李军成.声源定位中的一种含噪语音端点检测算法[J].电子元器件与信息技术,2021,5(10):14-16.
6林君萍.面向不平衡工业大数据集的SVM-tree分类算法研究[J].长春师范大学学报,2022,41(2):40-46.
7刘晶,邵玉斌,龙华,李一民.基于GFCC和能量算子倒谱的语种识别[J].云南大学学报（自然科学版）,2022,44(2):254-261. 被引量：3
8张海民,程菲.深度学习下盲人避撞路径导航方法研究[J].南京信息工程大学学报（自然科学版）,2022,14(2):220-226. 被引量：2
9邵睿,彭硕,查文文,陈成鹏,辜丽川,焦俊.基于BiLSTM的生猪音频识别[J].合肥学院学报（综合版）,2022,39(2):113-119. 被引量：2
10彭硕,刘东阳,时国龙,李广博,慕京生,辜丽川,焦俊.基于深度神经网络及隐马尔科夫模型的生猪状态音频识别[J].中国农业大学学报,2022,27(6):172-181. 被引量：4

1仝蕊,康建设,孙健,杨文,李宝晨.基于局部特征尺度分解与复合谱分析的齿轮性能退化特征提取[J].兵工学报,2019,40(5):1093-1102. 被引量：3
2林琴,涂铮铮,王庆伟,郭玉堂.一种基于近邻传播聚类的语音端点检测方法[J].安徽大学学报（自然科学版）,2019,43(3):27-32. 被引量：3
3张雯,何坤.基于Pair Copula和GARCH(1,1)模型的股市研究[J].理论数学,2019,9(2):129-136.
4曹冠彬,张二华,王凯龙.连续汉语语音切分技术研究[J].计算机与数字工程,2019,47(7):1667-1671. 被引量：3
5王腾.一种高动态低信噪比卫星导航信号捕获方法[J].导航定位与授时,2019,6(4):64-70. 被引量：3
6胡文斌,张婷,秦威,施健,罗晓明.ARIMA乘积季节模型分析昆山市2006—2016年脑血管病死亡率[J].江苏预防医学,2019,30(3):276-279. 被引量：1
7本刊编辑部(译).不同健康状况的基层患者医疗服务利用情况和死亡率差异的回顾性队列研究[J].中国全科医学,2019,22(17):2051-2051.
8兰素英,于敏.OPM战略、营运资本管理效率与企业价值——基于制造业上市公司供应链管理的视角[J].会计之友,2019,0(15):55-59. 被引量：17
9常思盎,刘毅,邵乐乐,惠腾,戴瑞彤.低温杀菌黄焖鸡中菌落总数生长预测模型的比较和货架期预测[J].肉类研究,2019,33(4):42-48. 被引量：4
10欧阳可良.比亚迪e5车动力电池系统的故障排查方法[J].汽车维护与修理,2019,0(10):69-75. 被引量：3

北京邮电大学学报

2019年第2期

浏览历史

内容加载中请稍等...

基于谱熵梅尔积的语音端点检测方法被引量：15

参考文献3

二级参考文献27

共引文献10

同被引文献102

引证文献15

二级引证文献50

相关作者

相关机构

相关主题

浏览历史

基于谱熵梅尔积的语音端点检测方法 被引量：15

参考文献3

二级参考文献27

共引文献10

同被引文献102

引证文献15

二级引证文献50

相关作者

相关机构

相关主题

浏览历史

基于谱熵梅尔积的语音端点检测方法被引量：15