基于局部最小二乘支持向量机的音频频带扩展方法被引量：3

Audio Bandwidth Extension Method Based on Local Least Square Support Vector Machine

下载PDF

导出

摘要在网络传输过程中宽带音频会由于高频信息的缺失导致音频质量下降,因此,本文提出了一种基于局部最小二乘支持向量机的宽带向超宽带音频频带扩展方法.根据音频频域序列的非线性特性,本文采用相空间重构和局部最小二乘支持向量机对音频信号的高频频谱细节进行预测,并结合高斯混合模型对高频子带能量进行估计,最后经过高频频谱包络调整,所提方法能够有效地恢复7k Hz^14k Hz频率范围内的高频成分.主客观测试结果表明,该方法改善了宽带音频的听觉质量,其性能优于参考音频频带扩展方法. The auditory quality of wideband audio is generally degraded due to the lack of the high-frequency in network transmission,so this paper presents a kind of audio bandwidth extension method from wideband to super wideband based on local least square support vector machine. In the light of the nonlinearity of audio spectrum,the high-frequency fine spectrum of audio signals is predicted by using phase space reconstruction and local least square support vector machine.Combining with the estimation of high-frequency sub-band energy based on Gaussian mixture model,the proposed method can effectively recover the high-frequency components in the frequency range 7k Hz ~ 14 k Hz through the envelope adjustment of high-frequency spectrum at last. Subjective and objective testing results indicate that the proposed method improves the auditory quality of wideband audio and outperforms the reference methods of audio bandwidth extension.

作者白海钏鲍长春刘鑫

机构地区北京工业大学电子信息与控制工程学院

出处《电子学报》 EI CAS CSCD 北大核心 2016年第9期2203-2210,共8页 Acta Electronica Sinica

基金国家自然科学基金项目(No.61072089 No.61471014)

关键词音频编码频带扩展高斯混合模型局部最小二乘支持向量机 audio coding bandwidth extension Gaussian mixture model local least square support vector machine

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献2

1张勇,胡瑞敏.基于高斯混合模型的语音带宽扩展算法的研究[J].声学学报,2009,34(5):471-480. 被引量：7
2ZHANG Yong,HU Ruimin.Speech wideband extension based on Gaussian mixture model[J].Chinese Journal of Acoustics,2009,28(4):362-377. 被引量：4

二级参考文献14

1俞一彪,王朔中.基于互信息匹配模型的说话人识别[J].声学学报,2004,29(5):462-466. 被引量：8
2郎玥,赵胜辉,匡镜明.基于矢量量化的语音信号频带扩展[J].北京理工大学学报,2005,25(3):260-264. 被引量：4
3党辰,戴葵,王苏峰,刘芸,王志英.高频重建技术SBR的研究与实现[J].电子学报,2004,32(F12):189-191. 被引量：2
4俞一彪,王朔中.文本无关说话人识别的全特征矢量集模型及互信息评估方法[J].声学学报,2005,30(6):536-541. 被引量：7
5Jax P, Vary P. Bandwidth extension of speech signals: a catalyst for the introduction of wideband speech coding. IEEE Communications Magazines, 2006; 44(5): 106--111.
6Geiser B, Jax P. Bandwidth extension for hierarchical speech and audio coding in ITU-T rec. G.729.1. IEEE Transactions on Audio, Speech and Language Processing, 2007; 15(8): 2496--2509.
7Dar Ghulam Raza, Cheung-Fat Chan. Enhancing quality of celp coded speech via wideband extension by using voic- ing GMM interpolation and HNM re-synthesis. Proceeding of IEEE International Conference on Acoustics, Speech~ Signal Processing. 2002; 4:1241--1244.
8Nakatoh Y, Tuushima M, Norimatsu T. Generation of broadband speech from narrowband speech using piecewise linear mapping. In Proceeding of EUROSPEECH, 1997; 9: 1643--1646.
9Enbom N, Klenijn W B. Bandwidth expansion of speech based on vector quantization of the reel frequency cepstral coefficients. IEEE Workshop on Speech Coding Proceedings, 1999; 2:171--173.
10Park K Y, Kim H S. Narrowband to wideband conversion of speech using GMM based transformation. Proceeding of IEEE International Conference on Acoustics, Speech, Signal Processing, 2000; 4:1843--1846.

共引文献9

1张兴涛,鲍长春,刘鑫,张丽燕.基于Volterra级数预测的音频频带扩展[J].电子学报,2012,40(12):2501-2506. 被引量：2
2邓峰,鲍长春,鲍枫.基于核Fisher判别和加权码书映射的音频信号削波修复方法[J].数据采集与处理,2014,29(2):211-221.
3ZHANG Yong,LIU Yi.Narrowband speech wideband extension algorithm research[J].Chinese Journal of Acoustics,2014,33(2):178-191.
4温涛,许枫,王梦宾,杨娟,闫路.预测特征误差映射及其在多基地水下目标识别中的应用[J].声学学报,2019,44(1):57-67. 被引量：2
5张勇,刘轶.窄带语音带宽扩展算法研究[J].声学学报,2014,39(6):764-773. 被引量：5
6王迎雪,赵胜辉,于莹莹,匡镜明.基于受限玻尔兹曼机的语音带宽扩展[J].电子与信息学报,2016,38(7):1717-1723. 被引量：3
7王迎雪,赵胜辉,匡镜明.考虑帧间信息的语音带宽扩展[J].声学学报,2017,42(3):370-376.
8郭雷勇,李宇,林胜义,谭洪舟.用于隐马尔可夫模型语音带宽扩展的激励分段扩展方法[J].计算机应用,2017,37(8):2416-2420. 被引量：5
9陈楠,鲍长春.基于双耳线索编码原理的语音增强方法[J].电子学报,2019,47(1):227-233. 被引量：3

同被引文献19

1储茂祥,王安娜,巩荣芬.一种改进的最小二乘孪生支持向量机分类算法[J].电子学报,2014,42(5):998-1003. 被引量：21
2叶春明,王珍,陈思,单洪.基于节点行为特征分析的网络流量分类方法[J].电子与信息学报,2014,36(9):2158-2165. 被引量：10
3杨勃.优化样本分布的最接近支持向量机[J].电子学报,2014,42(12):2429-2434. 被引量：2
4王卫卫,李小平,冯象初,王斯琪.稀疏子空间聚类综述[J].自动化学报,2015,41(8):1373-1384. 被引量：79
5赵永威,李弼程,柯圣财.基于弱监督E2LSH和显著图加权的目标分类方法[J].电子与信息学报,2016,38(1):38-46. 被引量：2
6陈素根,吴小俊.基于特征值分解的中心支持向量机算法[J].电子与信息学报,2016,38(3):557-564. 被引量：9
7张素莉.基于部分连接神经网络的序列数据分类算法研究[J].现代电子技术,2016,39(9):111-113. 被引量：1
8陈仁太.基于数据分类思维的网络危险信号检测系统设计与实现[J].现代电子技术,2016,39(10):142-145. 被引量：7
9杭文龙,蒋亦樟,刘解放,王士同.迁移近邻传播聚类算法[J].软件学报,2016,27(11):2796-2813. 被引量：17
10孟丽丽,宋锋.Web网络大数据分类系统的设计与改进[J].现代电子技术,2016,39(22):36-40. 被引量：10

引证文献3

1王威.高流量负荷下基于支持向量机的空间数据聚类方法[J].微电子学与计算机,2017,34(8):137-140.
2方佳艳,刘峤.具有同步化特征选择的迭代紧凑非平行支持向量聚类算法[J].电子学报,2020,48(1):44-58. 被引量：7
3李思源,姜林.基于MDCT的线性带宽扩展方法[J].智能计算机与应用,2020,10(3):69-71.

二级引证文献7

1汪宏海,吴樱.基于自表示的双图规格化特征选择聚类[J].井冈山大学学报（自然科学版）,2021,42(2):76-82.
2吴建蓉,马晓红,姜苏,彭赤.基于激光LiDAR技术的线路参数校核及耐张塔覆冰厚度计算模型效益评估研究[J].电力大数据,2021,24(8):33-39.
3路晶.基于Moreau包络与迭代重加权策略的图像深度恢复[J].科学技术与工程,2021,21(33):14227-14237.
4杨青峰,夏芳,高海燕,冯晓菊,程顺达.基于改进LS-TWIN-SVM的心律不齐异常辅助诊断[J].微型电脑应用,2023,39(1):101-103. 被引量：1
5陈婷婷,赵世忠.考虑模糊时间序列的高维大数据挖掘方法研究[J].计算机仿真,2023,40(3):467-470. 被引量：5
6罗欢,段伯隆.基于机器学习的灾害性天气多尺度预测模型[J].气象与减灾研究,2023,46(3):221-226.
7李耀波,宋旭东,孔翔宇.基于广义鲁棒距离度量的孪生支持向量机分类算法[J].计算机应用与软件,2024,41(4):262-274.

1白海钏,鲍长春,刘鑫,李红蕊.基于灰色Verhulst模型的音频频带扩展方法[J].电子学报,2014,42(8):1624-1629.
2刘鑫,鲍长春.基于回声状态网络的音频频带扩展方法[J].电子学报,2016,44(11):2758-2766. 被引量：3
3景新幸.小波变换及其在宽带音频压缩编码中的应用[J].电声技术,1999,23(6):7-8. 被引量：1
4林胜义,肖政宏.基于线性源滤波器的语音频带扩展方法研究[J].自动化与信息工程,2016,37(1):37-42.
5张丽燕,鲍长春,刘鑫,张兴涛.基于非线性音频特征分类的频带扩展方法[J].通信学报,2013,34(8):120-130. 被引量：3
6刘鑫,鲍长春.基于耳蜗滤波器倒谱参数的音频频带扩展方法[J].清华大学学报（自然科学版）,2013,53(6):913-916. 被引量：1
7赵尔沅.宽带音频压缩编码技术的新进展[J].电子科技导报,1997(8):2-6. 被引量：1
8肖清华.高频段频谱特性及利用方法探讨[J].移动通信,2017,41(3):18-21. 被引量：2
9阎宇杰,阎飞龙.电话话音和宽带音频信号的高质量编码[J].现代电信科技,1991(7):38-50.
10陈建玲,胡荣贻,韩潇,范斌.高频技术研究[J].邮电设计技术,2017(3):15-19. 被引量：1

电子学报

2016年第9期

浏览历史

内容加载中请稍等...

基于局部最小二乘支持向量机的音频频带扩展方法被引量：3

参考文献2

二级参考文献14

共引文献9

同被引文献19

引证文献3

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于局部最小二乘支持向量机的音频频带扩展方法 被引量：3

参考文献2

二级参考文献14

共引文献9

同被引文献19

引证文献3

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于局部最小二乘支持向量机的音频频带扩展方法被引量：3