基于谱特征自适应估计的激光相干语音探测信号增强方法

Enhancement of speech detected by laser coherent detection method based on spectral feature adaptation

下载PDF

导出

摘要针对激光相干语音探测引入的缓变宽带背景噪声和测振目标造成的信道作用,本文提出了基于分析-重合成框架,针对特定说话人的语音增强方法。该方法首先提取观测语音特征:基音频率、浊音概率、MCEP系数,其中,MCEP系数是能够表示谱包络形状的谱包络特征。通过观测语音的谱包络特征和预训练的对应说话人语音谱包络特征GMM,估计对应的纯净语音谱包络特征,再与观测语音的基音频率和浊音概率一起重新合成语音信号,实现语音增强。噪声和信道参数的估计通过最大化观测语音谱包络特征后验概率的自适应估计实现,然后通过MMSE估计得到纯净语音谱包络特征的估计值。合成信号实验和实际信号采集实验检验了本文提出算法在激光相干语音探测场景下的去噪和均衡能力。 To address the issue of slowly varying broadband background noise and channel effects caused by vibration of the target in laser-coherent speech detection,this paper proposes a speech enhancement method for specific speakers based on an analysis-resynthesis framework.This method first extracts the features from the observed signal:pitch,voiced speech probability,and MCEP coefficients,where MCEP coefficients represent the spectral envelope features which can capture the shape of the spectral envelope.A GMM trained by speech features of the corresponding speaker is used to help estimate the spectral envelope features of the clean speech from the spectral envelope features of the observed speech,and then the speech signal is resynthesized by combining it with pitch and voiced speech probability estimated from the observed speech to achieve speech enhancement.The estimation of noise and channel parameters is achieved by adaptation,which maximize the posterior probability of the observed speech′s spectral envelope features,and then the estimation of the clean speech spectral envelope features is obtained by MMSE estimation.Both synthesized signal experiments and actual signal acquisition experiments verify the denoising and equalization capabilities of the algorithm in laser coherent speech detection scenarios.

作者芮小博孔欣玥伍洲张文喜曾周末 Rui Xiaobo;Kong Xinyue;Wu Zhou;Zhang Wenxi;Zeng Zhoumo(State Key Laboratory of Precision Measurement Technology and Instrument,Tianjin University,Tianjin 300072,China;Aerospace Information Research Institute,Chinese Academy of Sciences,Beijing 100094,China;University of Chinese Academy of Sciences,Beijing 100049,China)

机构地区天津大学精密测试技术及仪器国家重点实验室中国科学院空天信息创新研究院中国科学院大学

出处《仪器仪表学报》 EI CAS CSCD 北大核心 2024年第8期326-335,共10页 Chinese Journal of Scientific Instrument

关键词激光相干语音探测语音增强混合高斯模型矢量泰勒级数 laser coherent speech detection speech enhancement Gaussian mixture model vector Taylor series

分类号 TH741 [机械工程—光学工程] TN911.7 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献5

1李如玮,鲍长春,窦慧晶.基于双正交小波包分解的自适应阈值语音增强[J].仪器仪表学报,2008,29(10):2135-2140. 被引量：15
2朱志宇.基于高斯粒子滤波器和TVAR模型的语音增强技术[J].仪器仪表学报,2008,29(9):1903-1907. 被引量：3
3袁文浩,屈庆洋,梁春燕,夏斌.基于感知条件网络的可控语音增强模型[J].仪器仪表学报,2023,44(5):53-60. 被引量：3
4王永彪,张文喜,王亚慧,孔新新,吕彤.拉普拉斯分布下的MMSE谱减语音增强算法[J].计算机应用,2020,40(3):878-882. 被引量：9
5LIU Tao,GUO Jin,ZHANG He-yong,YAN Chun-hui,WANG Can-jin.Acquirement and enhancement of remote speech signals[J].Optoelectronics Letters,2017,13(4):275-278. 被引量：7

二级参考文献28

1李吉祥,倪旭昇,颜上取,邹孝,钱盛友.基于A-DResUnet的语音增强方法[J].电子测量与仪器学报,2022,36(10):131-137. 被引量：3
2赵未莲.基于小波变换的阈值语音信号去噪[J].重庆科技学院学报（自然科学版）,2005,7(4):73-75. 被引量：11
3蔡铁,朱杰.小波阈值降噪算法中最优分解层数的自适应选择[J].控制与决策,2006,21(2):217-220. 被引量：44
4金乃高,殷福亮,王冬霞,陈喆.基于子带粒子滤波的一种语音增强方法[J].通信学报,2006,27(4):23-28. 被引量：5
5马晓红,宋辉,殷福亮.自适应小波阈值语音增强新方法[J].大连理工大学学报,2006,46(4):561-566. 被引量：8
6杨玺,樊晓平.基于仿生小波变换和自适应阈值的语音增强方法[J].控制与决策,2006,21(9):1033-1036. 被引量：6
7王娜,郑德忠.结点阈值小波包变换语音增强新算法[J].仪器仪表学报,2007,28(5):952-955. 被引量：14
8GABREA M. Adaptive Kalman filtering-based speech enhancement algorithm[ C]. Canadian Conference on Electrical and Computer Engineering, Toronto, 2001.
9OGATA S, SHIMAMURA T. Reinforced spectral subtraction method to enhance speech signal[ C ]. Proceedings of IFFF Region 10 International Conference on Electrical and Electronic Technology, Singapore, 2001.
10MALLAT S, HWANGWL. Singularity detection and processing with wavelets [ J ]. IEEE Transaction on Information Theory. 1992.38(2) :617-643.

共引文献32

1张飞.一种基于小波变换的语音信号去噪净化方法[J].电子测量技术,2009,32(6):68-71. 被引量：15
2张飞.基于小波变换的动态阈值法语音信号净化[J].通信技术,2009,42(10):198-200. 被引量：2
3张飞.基于小波包变换的自适应阈值语音去噪净化[J].电声技术,2009,33(10):69-72.
4蔡宇,原建平,侯朝焕.基于两级梳状滤波的语音谐波增强[J].仪器仪表学报,2010,31(1):26-31. 被引量：5
5赵贻玖,王厚军,戴志坚.基于隐马尔科夫树模型的小波域压缩采样信号重构方法[J].电子测量与仪器学报,2010,24(4):314-318. 被引量：13
6邱政权,范小春,王俊年.基于维纳滤波和子带处理的说话人识别[J].声学与电子工程,2010(2):41-43.
7邓林峰,赵荣珍,龚俊.一种改进的转子振动信号消噪方法研究[J].仪器仪表学报,2011,32(9):1961-1966. 被引量：17
8仲启媛,黄先祥,谭立龙.最大类间方差法在寻北仪信号降噪中的应用[J].计算机应用,2011,31(A02):184-186. 被引量：1
9田成来,彭敏放,宋丽伟,谭虎,沈美娥.模拟电路故障最优特征搜索与识别[J].仪器仪表学报,2012,33(7):1549-1555. 被引量：11
10邓森,景博,周宏亮.支持向量回归粒子滤波器的故障预测方法[J].计算机集成制造系统,2012,18(9):2012-2017. 被引量：3

1郑文慧,祁家琴,江文隽,谭贵元,胡奇琪,高怀恩,豆嘉真,邸江磊,秦玉文.激光相干合成系统中SPGD算法的分阶段自适应优化[J].红外与激光工程,2024,53(9):303-315.
2许春冬,王磊,胡菁兰,闵源,徐锦武.结合残差与双注意力机制的U-Net语音增强方法[J].计算机工程与设计,2024,45(11):3383-3389.
3李磐,耿靖森,孙宁,陈斐,孙鹏军,李亚东.CO_(2)激光相干汤姆逊散射测量等离子体湍流技术[J].科技成果管理与研究,2024(10):78-79.
4陈柯洁.基于深度神经网络的胚胎类器官发育过程研究[J].医用生物力学,2024,39(S01):388-388.
5李海龙,杨飞,杨诗童,路晓庆.基于SDW-MMSE的广义特征值稳健波束形成方法[J].数据采集与处理,2024,39(3):649-658.
6苏文博.面向远场语音增强的波束成形技术研究[J].电声技术,2024,48(10):104-106.
7张欣雨.基于贝叶斯网络模型的交通基础设施韧性评价——以兰州市为例[J].中国储运,2024(11):124-125.
8高国庆,袁冰峰,王莹,李垠萱.AI技术下复杂发电站运行风险视觉特征库构建[J].电子设计工程,2024,32(23):164-167.
9涂井先,冀占江,覃桂茳,蒲保兴.基于统计模型的麦克风阵列语音增强算法[J].计算机应用与软件,2024,41(11):335-340.
10何燕,张继东.模因范畴视角下的中国关键词外译研究[J].上海翻译（中英文）,2024(6):37-43.

仪器仪表学报

2024年第8期

浏览历史

内容加载中请稍等...

基于谱特征自适应估计的激光相干语音探测信号增强方法

参考文献5

二级参考文献28

共引文献32

相关作者

相关机构

相关主题

浏览历史