-
题名平滑L0算法在语音压缩重构中的应用
- 1
-
-
作者
薛海双
孙林慧
欧国振
-
机构
南京邮电大学通信与信息工程学院
-
出处
《计算机技术与发展》
2017年第6期160-164,168,共6页
-
基金
国家自然科学基金资助项目(61271335)
江苏省自然科学基金项目(BK20140891)
南京邮电大学校科研基金项目(NY214038)
-
文摘
语音信号在频域和离散余弦变换域等都具有良好的稀疏特性,满足压缩感知的先验条件,因此可以基于压缩感知对语音信号进行处理。语音压缩感知主要包括三个方面:稀疏基、观测矩阵和重构算法。其中,重构算法直接影响着重构信号的质量,是最重要的一部分。传统的语音压缩感知常基于正交匹配追踪算法进行重构。正交匹配追踪算法要求已知信号稀疏度,增加了实现的难度。为了提高语音信号的重构质量、简化实现过程,提出了一种基于平滑L0算法的语音压缩重构模型。平滑L0算法是用平滑函数逼近L0范数,它不需要提前知道信号的稀疏度,具有计算量低、重构质量高等优点。此外,提出了一种新的平滑函数,并基于高斯函数和新的平滑函数来验证平滑L0算法在语音压缩重构中的优越性。实验结果表明,在相同的条件下,相比于正交匹配追踪算法,使用平滑L0算法对语音进行重构,不仅缩短了重构时间,而且大大提高了重构质量。
-
关键词
压缩感知
语音重构
重构算法
平滑L0算法
平滑函数
L0范数
-
Keywords
compressed sensing
speech reconstruction
algorithms of reconstruction
smoothed LO algorithm
smooth function
LO norm
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-
-
题名基于重组超矢量的GMM-SVM说话人辨认系统
被引量:3
- 2
-
-
作者
欧国振
孙林慧
薛海双
-
机构
南京邮电大学通信与信息工程学院
-
出处
《计算机技术与发展》
2017年第7期51-56,共6页
-
基金
国家自然科学基金资助项目(61271335)
江苏省自然科学基金项目(BK20140891)
南京邮电大学校科研基金项目(NY214038)
-
文摘
在传统的高斯混合模型-支持向量机(Gaussian Mixture Model-Support Vector Machine,GMM-SVM)说话人辨认系统中,SVM利用从GMM矢量空间中得到的超矢量(Super Vector)直接对说话人进行建模与识别,由于没有考虑到超矢量内各均值矢量之间的关联性,识别性能有限。为此,提出了基于重组超矢量构建文本无关的GMM-SVM说话人辨认系统。该系统充分利用各相邻高斯分量的均值矢量的高度关联性,保证了重组后的超矢量能充分反映说话人身份的内在细节,使得系统具有充分利用SVM处理高维小数据性能的优越特点。验证实验结果表明,与传统的GMM-SVM系统相比,重组超矢量GMM-SVM说话人辨认系统显著地缩短了系统建模的时间,同时有效地提高了说话人的辨别率。
-
关键词
说话人辨认
高斯混合模型-支持向量机
超矢量重组
辨别率
建模时间
-
Keywords
speaker identification
GMM-SVM
super vector recombination
identification rate
time of modeling
-
分类号
TP302
[自动化与计算机技术—计算机系统结构]
-