期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于字典学习与结构自相似性的码本映射超分辨率算法 被引量:7
1
作者 潘宗序 禹晶 +1 位作者 肖创柏 孙卫东 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2015年第6期1032-1038,共7页
图像的空间分辨率受成像环境、硬件制造水平和成本等多方面因素的影响,存在一定的局限性.为了提高图像的空间分辨率,提出一种基于字典学习与结构自相似性的码本映射超分辨率算法.首先利用训练集构建与图像高低频分量对应的高低频码本,... 图像的空间分辨率受成像环境、硬件制造水平和成本等多方面因素的影响,存在一定的局限性.为了提高图像的空间分辨率,提出一种基于字典学习与结构自相似性的码本映射超分辨率算法.首先利用训练集构建与图像高低频分量对应的高低频码本,将高低频码本作为训练样本获取高低频字典;然后在初始重建图像中搜索目标图像块的相似图像块,利用相似图像块构建非局部约束项;最后通过求解含有非局部约束项的l0范数最小化问题获取目标图像块的稀疏表示系数,并利用高低频字典重建高分辨率图像块.该算法利用高低频字典表示目标图像块,而不是直接采用高低频码本,提高了算法的运算效率;利用相似图像块构建正则化约束项,提高了重建图像的质量.实验结果表明,与LLE,Sc SR和NARM等算法相比,文中算法取得的超分辨率重建效果更好. 展开更多
关键词 超分辨率 码本映射 字典学习 结构自相似性
下载PDF
基于码本映射和GMM的语音带宽扩展
2
作者 王迎雪 于莹莹 +1 位作者 赵胜辉 匡镜明 《北京理工大学学报》 EI CAS CSCD 北大核心 2017年第9期970-974,共5页
采用传统的高斯混合模型(Gaussian mixture model,GMM)进行语音带宽扩展时,会出现所估计的特征参数过平滑的问题,其主要原因是协方差估计不准确而导致扩展的高频特征细节信息的丢失,因此本文提出了码本映射(codebook mapping,CM)与高斯... 采用传统的高斯混合模型(Gaussian mixture model,GMM)进行语音带宽扩展时,会出现所估计的特征参数过平滑的问题,其主要原因是协方差估计不准确而导致扩展的高频特征细节信息的丢失,因此本文提出了码本映射(codebook mapping,CM)与高斯混合模型相结合的语音带宽扩展算法.提取高、低频特征参数,并训练高斯混合模型,基于高斯混合模型参数训练偏移矢量的码本;在扩展阶段,利用偏移矢量的码本将低频偏移矢量映射为高频偏移矢量,再将高频偏移矢量与高斯混合模型估计部分相加作为估计的高频特征参数.对利用该方法进行带宽扩展后的语音质量进行主观/客观评测.实验结果表明,相比传统的GMM语音带宽方法,CM-GMM合成的高频语音更接近原始高频语音,明显消除了高频过平滑现象. 展开更多
关键词 语音带宽扩展 高斯混合模型 码本映射
下载PDF
基于码本映射的语音带宽扩展算法研究
3
作者 薛梅 周南 《电子设计工程》 2010年第11期75-77,81,共4页
在现代通信系统中,电话语音的频带被限制在300 Hz~4 kHz的范围内,带来了语音可懂度和自然度的降低。为了在不增加额外成本的前提下提高语音的可懂度和自然度,进行了电话语音频带扩展的研究。提出了一种改进的基于码本映射的语音带宽扩... 在现代通信系统中,电话语音的频带被限制在300 Hz~4 kHz的范围内,带来了语音可懂度和自然度的降低。为了在不增加额外成本的前提下提高语音的可懂度和自然度,进行了电话语音频带扩展的研究。提出了一种改进的基于码本映射的语音带宽扩展算法:在码本映射的过程中,使用加权系数来得到映射码本。客观测试结果表明,用此算法得到的宽带语音的谱失真度比用一般的码本映射降低至少2%。主观测试结果表明,用此算法得到的宽带语音具有更好的可懂度和自然度。 展开更多
关键词 语音带宽扩展 码本映射 矢量量化 谱折叠 谱平移
下载PDF
基于音素绑定码本映射的说话人声音转换方法 被引量:1
4
作者 王子祥 戴礼荣 +1 位作者 王玉平 王仁华 《模式识别与人工智能》 EI CSCD 北大核心 2006年第3期300-306,共7页
介绍说话人声音转换系统框架,并对传统的基于码本映射的说话人声音转换方法进行讨论.指出传统的码本映射方法由于对谱的转换采用所有码本加权叠加,因此会产生转换后语音频谱平滑效应过重的问题,从而使转换后语音音质较差.为了克服这种问... 介绍说话人声音转换系统框架,并对传统的基于码本映射的说话人声音转换方法进行讨论.指出传统的码本映射方法由于对谱的转换采用所有码本加权叠加,因此会产生转换后语音频谱平滑效应过重的问题,从而使转换后语音音质较差.为了克服这种问题,本文提出基于音素绑定的码本加权叠加方法来完成语音谱的转换,同时利用决策树来完成韵律的转换.实验表明,即使在数据量较少的情况下,该方法也能较好地完成说话人声音转换,并能得到较高的语音音质. 展开更多
关键词 声音转换 码本映射 决策树
原文传递
一种使用声调映射码本的汉语声音转换方法 被引量:4
5
作者 左国玉 刘文举 阮晓钢 《数据采集与处理》 CSCD 北大核心 2005年第2期144-149,共6页
在使用高斯混合模型实现说话人语音频谱包络变换的同时,提出了一种汉语声调码本映射技术来进一步提高转换语音目标说话人特征倾向性的方法。从源语音和目标语音分别提取汉语单音节的基频曲线作为基频变换单元,作预处理和聚类后分别形成... 在使用高斯混合模型实现说话人语音频谱包络变换的同时,提出了一种汉语声调码本映射技术来进一步提高转换语音目标说话人特征倾向性的方法。从源语音和目标语音分别提取汉语单音节的基频曲线作为基频变换单元,作预处理和聚类后分别形成源、目标声调码本,根据时间对准原则建立了一个由源特征空间到目标特征空间的声调模式映射码本。声音转换实验评估了声调码本映射算法的性能。实验结果表明,该算法较好地反映出源说话人与目标说话人基频曲线之间的映射关系,改善了声音转换性能。 展开更多
关键词 声音转换 声调映射码本 混合高斯映射
下载PDF
声音转换技术的研究与进展 被引量:32
6
作者 左国玉 刘文举 阮晓钢 《电子学报》 EI CAS CSCD 北大核心 2004年第7期1165-1172,共8页
声音转换是一项改变说话人声音特征的技术 ,可以将一人的语音模式转换为与其特性不同的另一人语音模式 .声音转换算法的目标是确定一个什么样的模式转换规则 ,使转换语音保持第一个说话人原有语音信息内容不变 ,而具有第二个说话人的声... 声音转换是一项改变说话人声音特征的技术 ,可以将一人的语音模式转换为与其特性不同的另一人语音模式 .声音转换算法的目标是确定一个什么样的模式转换规则 ,使转换语音保持第一个说话人原有语音信息内容不变 ,而具有第二个说话人的声音特点 .本文介绍了当前声音转换技术领域的研究状态 ,主要分析现有声音转换技术中各种转换算法的实现原理 ,描述声音转换系统性能的各种评估方法 。 展开更多
关键词 声音转换 语音频谱 基频曲线 声门激励 码本映射 人工神经网络 高斯混合模型 隐马尔科夫模型
下载PDF
一种改进高斯混合模型均值项的语音转换方法
7
作者 赵义正 《微型机与应用》 2012年第19期68-70,共3页
语音转换技术主要应用于计算机语音合成、计算机语音翻译、语音编辑、广播及多媒体等方面。高斯混合模型(GMM)是目前语音转换的主流方法,但它的最大不足是会导致转换频谱的过平滑。其中GMM转换函数中的均值项和相关项共同导致了过平滑现... 语音转换技术主要应用于计算机语音合成、计算机语音翻译、语音编辑、广播及多媒体等方面。高斯混合模型(GMM)是目前语音转换的主流方法,但它的最大不足是会导致转换频谱的过平滑。其中GMM转换函数中的均值项和相关项共同导致了过平滑现象,并且均值项的影响更大。为此提出了结合码本映射法和GMM方法的修正均值法,实验表明,使用修正均值法能够有效抑制过平滑问题,改善转换性能。 展开更多
关键词 语音转换 高斯混合模型 码本映射 过平滑
下载PDF
一种低码率移动通信音频带宽扩展方法研究
8
作者 潘磊 董智勇 《河南工程学院学报(自然科学版)》 2010年第2期47-50,共4页
在移动通信中,音频编解码器要求采用计算复杂度低、码率低并且高质量的音频编码算法.提出了一种新的低码率音频带宽扩展算法,利用码本映射法得到高频合成滤波器系数,编码端在复用码流中高频部分只传递量化的增益修正,从而只增加极少的... 在移动通信中,音频编解码器要求采用计算复杂度低、码率低并且高质量的音频编码算法.提出了一种新的低码率音频带宽扩展算法,利用码本映射法得到高频合成滤波器系数,编码端在复用码流中高频部分只传递量化的增益修正,从而只增加极少的编码比特数和运算复杂度即可重建高频分量,提高解码音质. 展开更多
关键词 带宽扩展 码本映射 增益因子
下载PDF
基于Volterra级数预测的音频频带扩展 被引量:2
9
作者 张兴涛 鲍长春 +1 位作者 刘鑫 张丽燕 《电子学报》 EI CAS CSCD 北大核心 2012年第12期2501-2506,共6页
本文采用非线性分析方法,基于Volterra级数提出了一种宽带音频信号的频带扩展方法,并利用高斯混合模型(Gaussian Mixture Model,GMM)和码本映射技术对扩展后的音频信号进行了谱包络和能量增益调整.实验表明,所提算法的性能要好于已有的... 本文采用非线性分析方法,基于Volterra级数提出了一种宽带音频信号的频带扩展方法,并利用高斯混合模型(Gaussian Mixture Model,GMM)和码本映射技术对扩展后的音频信号进行了谱包络和能量增益调整.实验表明,所提算法的性能要好于已有的非线性频带扩展算法,当用本文的方法替代ITU-T G.722.1C编码器中的噪声填充技术时,在24kbps得到了提升的超宽带音频质量. 展开更多
关键词 频带扩展 VOLTERRA级数 高斯混合模型 码本映射
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部