期刊文献+

一种基于高斯混合模型的导谱频率参数量化算法

Quantization Approach of ISF Based on GMM
下载PDF
导出
摘要 提出了一种高效的基于高斯混合模型(GMM)的导谱频率(ISF)参数量化算法,算法的基本思想是利用高斯混合模型将导谱频率(ISF)参数发送给M个高斯簇,然后由高斯格型矢量量化器来量化相应高斯簇的导谱频率(ISF)参数,最终可以在M个量化值中选出频谱失真值最小的一个作为输出值。在设计高斯格型矢量量化器时,基于率失真理论提出了一种最佳比特分配算法。实验结果显示导谱频率(ISF)参数可以透明地压缩到42 bit/帧,与AMR-WB(G.722.2)的多级分裂矢量量化算法相比,节省了3 bit,减少了55%的存储空间。 An efficient Immittance Spectral Frequency (ISF) parameters quantization algorithm is proposed based on the Gaussian mixture model (GMM). The basic idea of the algorithm is the use of GMM to send the ISF parameters into M Gaussian clusters, and ISF parameters are quantized by a Gaussian lattice vector quantizer corresponding to that Gaussian clustering, and the minimal spectral distortion value among the M quantized values is selected at last. In the design of Gaussian lattice vector quantizer, the optimal bit allocation algorithm is proposed based on the rate-distortion theory. The results show that the ISF parameters could be transparently quantized at 42 bit/frame, which saves 3 bit and reduce 58% of the storage compared with the Split-Multi-Stage Vector Quantization (S-MSVQ) algorithm of AMR-WB( G. 722.2).
作者 王晓晨 姜林
出处 《电视技术》 北大核心 2014年第15期185-188,共4页 Video Engineering
基金 深圳市生物 互联网 新能源 新材料产业发展专项资金基础研究计划项目(JC201104220203A)
关键词 导谱参数 量化 高斯混合模型 ISF quantization GMM
  • 相关文献

参考文献5

二级参考文献53

  • 1邹霞,陈亮,张雄伟.高质量鲁棒600BPS甚低速率语音编码算法[J].信号处理,2003,19(z1):109-112. 被引量:4
  • 2孙祥娥,汪忠德.基于G.729算法的新型语音通信系统的实现[J].微计算机信息,2005,21(4):152-153. 被引量:10
  • 3高文,王强,马思伟.AVS数字音视频编解码标准[J].中兴通讯技术,2006,12(3):6-9. 被引量:23
  • 4胡瑞敏,张勇.AVS-M移动音频编码技术的研究及应用[J].电声技术,2007,31(7):65-69. 被引量:1
  • 5[1]WONG W T K,MACK B M,CHEETHM B M C,et al.Low rate speech coding for telecommunications[J].BT Technol Journal,1996,14(1):28-43.
  • 6[4]K K Paliwal,S Atal.Efficient vector quantization of LPC parameters at 24 bits/frame[J].EEE Transactions on speech and audio processing,1993,1(1):3-14.
  • 7[5]Y Hussain,Farvardin.Finite-state vector quantization over noisy channels and its application to LSP parameters[J]:IASSP'92 vol 2[C],1992:133-136
  • 8[6]ITU-T Recommendation G.729,Cding of Speech at 8kbit/s Using Conjugate-Structure Algebraic-C-Excited Linear-Prediction (CS-ACELP)[S].1996.
  • 9胡瑞敏,高戈,王晓晨,等.面向移动多媒体应用的AVS-P10移动语音和音频标准[C]//第九届全国消费电子技术年会暨数字电视研讨会论文集.云南,丽江:北京电视电声杂志社,2007:95-101.
  • 103GPP TS 26.290. Extended adaptive multi-rate-wideband (AMRWB+) codec[EB/OL].[2010-07-01], http://en.wikipedia.org/wiki/ Extended Adaptive_Multi-Rate_%E2%80%93 Wideband.

共引文献10

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部