一种稳定、精准、实时的语音信号基频的检测与提取算法

Robust, Precise and Real-Time Algorithm for Speech Signal Pitch Detection and Extraction

下载PDF

导出

摘要针对语音基频检测与提取问题,融合了频域算法和时域算法的特点,提出了针对语音基频检测与提取的两步算法,首先基于频域算法的稳定性给出基频的一个粗估计,然后根据时域算法的精确性,再给出一个精确估计。该算法达到了稳定、精准、实时的目标。实验结果表明,该算法在汉语语音基频检测与提取方面的性能优于语音分析与处理专用软件Praat和Adobe Audition的相应功能。 A new two-step algorithm was proposed for speech pitch detection and fundamental frequency extraction. This algorithm first estimates a guess of the pitch based on the frequency analysis, and then calculates an accurate solution for the pitch based on time-domain analysis. This algorithm realized the expectation of robust, accurate and real-time. The experimental results show that the performance of this algorithm is better than that of Praat and Adobe Audition in Chinese speech pitch detection and fundamental frequency extraction.

作者章森曹瑞兴邓海刚

机构地区天博电子信息科技有限公司

出处《图像与信号处理》 2020年第4期246-255,共10页 Journal of Image and Signal Processing

关键词语音信号处理基频检测特征提取基音频率 Speech Signal Processing Pitch Detection Feature Extraction Fundamental Frequency

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献3

1陈萧,徐波.改进的用于口语处理的基频提取算法[J].清华大学学报（自然科学版）,2017,57(1):95-99. 被引量：5
2张金光.语言发音模型研究综述[J].计算机工程与应用,2018,54(12):27-34. 被引量：3
3宋黎明,李明,颜永红.谐波显著度的基频提取方法[J].声学学报,2015,40(2):294-299. 被引量：5

二级参考文献29

1吴玺宏.声纹识别听声辨人[J].计算机世界,2001,(8):14.
2Ding H,Soon Y,Yeo C K.A DCT-based speech enhancement system with pitch synchronous analysis.Audio,Speech,and Language Processing,IEEE Transactions on,2011;19(8):2614-2623.
3Chen J H,Kao Y A.Pitch marking based on an adaptable filter and a peak-valley estimation method.Computational Linguistics and Chinese Language Processing,2001;6(5):1-12.
4Geckinli N,Yavuz D.Algorithm for pitch extraction using zero-crossing interval sequence.Acoustics,Speech and Signal Processing,IEEE Transactions on,1977;25(6):559-564.
5俞翠华.含噪语音信号的基音提取算法研究.南京信息工程大学,2011.
6Ahmadi S,Spanias A S.Cepstrum-based pitch detection using a new statistical V/UV classification algorithm.Speech and Audio Processing,IEEE Transactions on,1999;7(3):333-338.
7Hermes D J.Measurement of pitch by subharmonic summation.The Journal of The Acoustical Society of America,1988;83(1):257-264.
8Cao C,Li M,Liu J et al.Singing melody extraction in polyphonic music by harmonic tracking.In:Proc.8th International Conference on Music Information Retrieval(ISMIR),2007:373-374.
9Jin Z,Wang D L.HMM-based multipitch tracking for noisy and reverberant speech.Audio,Speech,and Language Processing,IEEE Transactions on,2011;19(5):1091-1102.
10Ellis D P W,Poliner G E.Classification-based melody transcription.Machine Learning,2006;65(2-3):439-456.

共引文献10

1张金光,孔江平.统计参数动态舌头调音模型[J].中国语音学报,2019(2):104-112.
2张宇,杨帅,黄楠木,李琳.高速摄影成像分析声带振动发声的前后不对称性[J].声学学报,2017,42(3):341-347. 被引量：1
3Tan Xinjie,Cui Jizhe.A Review of Audio Gene Recognition Copyright Protecting Technology[J].计算机科学与技术汇刊（中英文版）,2017,6(1):8-15.
4杨贵福,夏一鸣,冉华,冯永平,孙慧.基于优化能量值门限和增强倍频效应的抗噪基音检测算法[J].东北师大学报（自然科学版）,2019,51(1):63-70.
5后方帅,黎美琪,刘若伦.利用谐波显著度和语者音色特征的混合语音中目标人基频轨迹提取[J].声学技术,2019,38(4):408-413. 被引量：3
6杨静.基于HMM模型的多声部乐谱音符基频识别方法研究[J].科技通报,2019,35(11):109-112. 被引量：3
7薛辉.基于语音合成的智慧导游系统的研究与设计[J].信息技术,2020,44(2):112-115. 被引量：4
8柯宏宇,高奕宁,郝雪营,黄涛.基于信道信息的回放攻击检测研究[J].计算机技术与发展,2021,31(6):118-122.
9张皓斐,张皓博.基于卡尔曼滤波的乐音基频小波自相关检测法[J].电子设计工程,2022,30(7):77-81. 被引量：1
10孟雨璇,袁尉,李雯,邓丽华,何凌,李元媛.基于语音音调域动态特征的精神分裂症自动检测算法[J].计算机应用与软件,2022,39(8):171-180. 被引量：1

1陈强华,孔祥悦,刘斌超,张孟策,罗会甫,吕唯唯.基于磁光调制及基频信号检测的高精度波片测量[J].北京理工大学学报,2020,40(5):461-465. 被引量：6
2许春冬,徐琅,周滨,凌贤鹏.单通道语音增强技术的研究现状与发展趋势[J].江西理工大学学报,2020,41(5):55-64. 被引量：1
3周宁,石雯茜,朱昭昭.基于粗糙数据推理的TextRank关键词提取算法[J].中文信息学报,2020,34(9):44-52. 被引量：12
4郑清杰,龙华,邵玉斌,杜庆治.基于节拍谱的语音音乐分类模型[J].通信技术,2020,53(11):2675-2679. 被引量：1
5李文明.基于ANSYS的隔膜泵活塞杆的强度分析与结构改进[J].当代化工研究,2020(20):36-37. 被引量：2
6水生宏.基于单片机橡胶车间空气粉尘浓度检测仪的设计[J].橡塑技术与装备,2020,46(21):36-46.
7蒋进,周正华,董青,邱兆文,肖妍珊,魏鑫.土体本构模型及简化模型对基坑开挖变形数值分析结果的影响[J].震灾防御技术,2020,15(2):285-292. 被引量：4
8魏科丰,陈凯,曾秦威,罗滨杨,张颖,贺代林.BIM技术在嘉辉豪庭施工阶段的应用[J].科技风,2020(32):116-117.
9肖友刚,朱铖臻,卢浩,韩锟.一类欠驱动MIMO系统集中式自抗扰控制[J].应用数学和力学,2020,41(11):1197-1209. 被引量：1
10向筱路.于阗语《无垢净光陀罗尼》对音研究[J].语言学研究,2020(2):36-47.

图像与信号处理

2020年第4期

浏览历史

内容加载中请稍等...

一种稳定、精准、实时的语音信号基频的检测与提取算法

参考文献3

二级参考文献29

共引文献10

相关作者

相关机构

相关主题

浏览历史