利用结构特征的语音压缩感知重建算法被引量：6

A Reconstruction Algorithm for Speech Compressive Sensing Using Structural Features

下载PDF

导出

摘要针对语音信号在变换域中不够稀疏使得压缩感知重建困难的问题,提出了一种利用频域结构特征的重建算法.该算法为单帧语音信号的修正离散余弦变换系数引入幅度和状态2个隐变量,并分别用高斯马尔可夫过程和马尔可夫链对幅度和状态沿频率轴的连续性建模.在此基础上用因子图表示系数及其幅度、状态的联合后验分布,在因子图上用Turbo消息传递迭代求出系数的后验均值,进而重建原始语音信号.与当前几种最新的算法相比,该算法在不同帧长、不同压缩率下均获得更高的重建精度,重建信号在时频图上的能量分布也与原始语音最为接近.可见,利用语音频域系数的连续性,以Turbo消息传递的方式可以在压缩感知中得到较高的重建精度. It is difficult to reconstruct speech signal after compressive sampling because coefficients of the signal in transforming domain aren＇t sparse enough.In this paper the speech signal was recovered from compressed samples in the frequency domain using structural features.Two hidden variables,amplitude and state,are defined for each modified discrete cosine transforming（MDCT）coefficient of the speech signal.The probability density function of the amplitude of the MDCT coefficient is represented using a Gaussian mixture model,and the continuity of the states along the frequency axis is modeled through a first order Markov chain,the continuity of the amplitude along the frequency axis is modeled through Gauss-Markov process.The joint posterior distribution of coefficient,amplitude and state is represented by the factor graph,on which the posterior mean of the coefficient is obtained using Turbo message passing method,and then the speech can be reconstructed.After compressive sampling the MDCT coefficients of a speech segment,we reconstructed the signal using our proposed algorithm and other state-of-the-art algorithms for comparison.The results showed that our proposed algorithm achieved best reconstruction quality under different frames and compressive ratios.The spectrogram showed that the energy distribution of reconstructed signal using our algorithm was the most similar to the original signal＇s energy distribution.It can be seen that better reconstruction accuracy can be obtained using the continuity along frequency axis and Turbo message passing method.

作者贾晓立江晓波蒋三新刘佩林 JIA Xiaoli JIANG Xiaobo JIANG Sanxin LIU Peilin(Shanghai Key Laboratory of Navigation and Location-Based Services, Shanghai Jiao Tong University, Shanghai 200240, Chin)

机构地区上海交通大学北斗导航与位置服务重点实验室

出处《上海交通大学学报》 EI CAS CSCD 北大核心 2017年第9期1111-1116,共6页 Journal of Shanghai Jiaotong University

基金国家自然科学基金(61171171 61401501) 华为技术有限公司研究基金资助

关键词语音信号压缩感知高斯混合模型马尔可夫链消息传递 speech signal compressive sensing Gaussian mixture model Markov chain message passing

分类号 TN912 [电子电信—通信与信息系统]

引文网络
相关文献

同被引文献56

1张震,王化清.语音信号特征提取中Mel倒谱系MFCC的改进算法[J].计算机工程与应用,2008,44(22):54-55. 被引量：29
2高翔,牟法海,卢盛阳,王文营,周殊梅,蔺跃生,赵丽华.基于小波变换的汽轮发电机组动静碰摩特征分析[J].热力发电,2011,40(8):17-21. 被引量：4
3雷颖,钱永青,孙洪.帧间自适应语音信号压缩感知[J].信号处理,2012,28(6):894-899. 被引量：9
4许志强.压缩感知[J].中国科学：数学,2012,42(9):865-877. 被引量：58
5赵力,邹采荣,吴镇扬.基于3维空间Viterbi算法的汉语连续语音识别方法[J].电子学报,2000,28(7):67-69. 被引量：5
6罗孟儒,周四望.自适应小波包图像压缩感知方法[J].电子与信息学报,2013,35(10):2371-2377. 被引量：6
7袁俊.HMM连续语音识别中Viterbi算法的优化及应用[J].电子技术（上海）,2001,28(2):48-51. 被引量：11
8张智义.英汉语情态助词违实句的生成语法分析[J].外语教学与研究,2018,50(6):863-872. 被引量：4
9张殿飞,杨震,胡海峰.含噪语音压缩感知自适应快速重构算法[J].信号处理,2016,32(9):1065-1071. 被引量：5
10李培生,孙金丛,李伟.生物质微商热重数据不同去噪方法分析[J].热力发电,2017,46(1):62-67. 被引量：1

引证文献6

1杨正理,史文,陈海霞.基于小波包的锅炉炉管声波信号自适应压缩感知[J].热力发电,2019,48(5):114-120.
2钱永青.基于混沌理论和压缩感知理论的语音加密[J].武汉轻工大学学报,2019,38(5):90-93. 被引量：1
3黎华.以压缩感知为基础的语音数字编码技术[J].无线互联科技,2019,16(21):147-148. 被引量：1
4钱永青.基于压缩感知的语音加密[J].电子测量技术,2020,43(2):139-142. 被引量：2
5朱祥.基于隐马尔可夫模型和聚类的英语语音识别混合算法[J].计算机测量与控制,2020,28(5):175-179. 被引量：14
6吕方兴,熊泽康,李飞.基于压缩感知技术的电磁脉冲信号测量方法[J].电子测量技术,2023,46(11):20-29. 被引量：1

二级引证文献19

1潘丽鹏.嵌入式英语语音识别控制系统研究[J].微型电脑应用,2021,37(6):73-75. 被引量：1
2钱永青.基于压缩感知的协作感知无线电频谱检测[J].武汉轻工大学学报,2021,40(4):60-65.
3宋晓焕,梁金伟,刘晓连.基于改进GLR算法的英语翻译智能识别模型设计[J].电子设计工程,2021,29(19):64-68. 被引量：2
4陈晓红,滕华.基于深度机器学习的英语语音识别研究[J].贵阳学院学报（自然科学版）,2021,16(3):1-4. 被引量：3
5李娅,马琳.基于机器翻译的日语识别方法研究[J].自动化与仪器仪表,2021(10):178-182. 被引量：2
6彭慧,娄颜超.基于伯努利矩阵的音频信号观测矩阵设计与仿真[J].数字技术与应用,2021,39(10):139-141. 被引量：1
7唐风扬,覃仁超,熊健.基于局部密度信息熵均值的密度峰值聚类算法[J].计算机测量与控制,2022,30(3):192-197. 被引量：5
8李小燕.智能语音代理的图书馆多媒体阅读应用探析[J].自动化与仪器仪表,2022(1):148-152.
9杨虹.基于英语智能词汇推荐系统的开发设计[J].电子设计工程,2022,30(8):180-184.
10赵力瑾,高攀.基于连续隐马尔科夫模型的英语翻译机器人语音识别系统[J].自动化与仪器仪表,2022(6):191-194. 被引量：9

1王俊,杨成龙.一种基于压缩感知的改进全变分图像去噪模型[J].计算机与数字工程,2017,45(9):1833-1836. 被引量：1
2周健伟.两指标强马尔可夫过程[J].华东师范大学学报（自然科学版）,1989(4):7-11. 被引量：4
3辛茹雪.线段图在小学应用题教学中的应用[J].吉林教育,2017,0(22):96-96.
4陈本芬,许成,刘丽丽.有向无环图结构及边缘化研究[J].青岛大学学报（自然科学版）,2017,30(3):15-18. 被引量：1
5张学典,刘晓.融合多特征的压缩感知跟踪算法研究[J].软件导刊,2017,16(10):57-60.
6周硕,吴柏生.广义双随机矩阵反问题及其应用[J].数学的实践与认识,2008,38(15):142-148. 被引量：1
7赵千川,林元烈.马尔可夫过程停留时间的分布,矩及其应用[J].运筹学杂志,1994,13(2):66-67. 被引量：1
8杨向群,向红锋.两参数单点马尔可夫过程[J].湖南师范大学自然科学学报,1994,17(1):1-6.
9陈少利,杨敏.改进变步长快速迭代收缩阈值算法[J].计算机技术与发展,2017,27(10):69-73. 被引量：2
10乱局突围[J].网球大师,2017,0(8):16-16.

上海交通大学学报

2017年第9期

浏览历史

内容加载中请稍等...

利用结构特征的语音压缩感知重建算法被引量：6

同被引文献56

引证文献6

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

利用结构特征的语音压缩感知重建算法 被引量：6

同被引文献56

引证文献6

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

利用结构特征的语音压缩感知重建算法被引量：6