期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
基于信号规整和稀疏变换的语音与音频分层编码方法
1
作者 李晓明 鲍长春 贾懋珅 《电子学报》 EI CAS CSCD 北大核心 2015年第7期1286-1293,共8页
基于语音和音频信号的固有周期性特征,本文构建了一种适合语音和音频信号的统一分析/合成模型,并分别在24kbps和32kbps码率下,实现了对宽带语音和音频信号的高质量分层编码.首先,本文将具有时变周期的输入信号规整为具有固定周期的信号... 基于语音和音频信号的固有周期性特征,本文构建了一种适合语音和音频信号的统一分析/合成模型,并分别在24kbps和32kbps码率下,实现了对宽带语音和音频信号的高质量分层编码.首先,本文将具有时变周期的输入信号规整为具有固定周期的信号,并对规整后的周期信号构建规整矩阵;其次,对规整矩阵的行和列分别进行调制叠接变换(MLT)和离散余弦变换(DCT),完成规整矩阵的稀疏化;最后,利用分带量化和矢量哈夫曼编码完成稀疏矩阵元素的量化和编码.主客观测试结果表明,本文所提方法的语音、音频及其混合信号的编码质量均优于同等速率下的ITU-T G.722.1和AMR-WB编码器. 展开更多
关键词 语音编码 音频编码 信号规整 稀疏变换
下载PDF
8~64kbit/s超宽带嵌入式语音频编码方法 被引量:2
2
作者 贾懋珅 鲍长春 李锐 《通信学报》 EI CSCD 北大核心 2009年第5期27-34,共8页
基于国际电信联盟标准化组织(ITU—T)编码标准G729.1和改进的调制叠接变换(MLT,modulated lapped transform)编码技术,提出了一种码率在8-64kbit/s的超宽带嵌入式变速率语音与音频编码方法,其中,8.32kbit/s码率的码流由G729... 基于国际电信联盟标准化组织(ITU—T)编码标准G729.1和改进的调制叠接变换(MLT,modulated lapped transform)编码技术,提出了一种码率在8-64kbit/s的超宽带嵌入式变速率语音与音频编码方法,其中,8.32kbit/s码率的码流由G729.1编码算法生成,编码信号为0—7kHz频段的信息;36、40和48kbit/s码率层及56、64kbiffs码率层码流由MLT变换编码方式生成,编码信号分别为7-14kHz频段的信息和G729.1编码残差的MDCT信息。客观和主观听力测试表明本编码器的性能达到了ITU-T提出的参考指标要求。 展开更多
关键词 语音处理 语音编码 音频编码 嵌入式编码
下载PDF
采用经验模态分解的语音与音频通用编码方法
3
作者 李晓明 鲍长春 《信号处理》 CSCD 北大核心 2013年第10期1274-1282,共9页
为有效解决现有单一模型编码器无法在中低速率对语音和音频信号进行高质量通用编码的问题,本文借助语音与音频信号的谐波特性,建立了一种对语音和音频信号统一编码的方法。首先,本文利用经验模态分解(Empirical Mode Decomposition,EMD... 为有效解决现有单一模型编码器无法在中低速率对语音和音频信号进行高质量通用编码的问题,本文借助语音与音频信号的谐波特性,建立了一种对语音和音频信号统一编码的方法。首先,本文利用经验模态分解(Empirical Mode Decomposition,EMD)提取输入信号的谐波成分;其次,利用感知匹配追踪算法,并结合正弦参数建模对谐波成分进行参数提取与量化;第三,对于量化谐波后的残差进行抖动格型矢量量化,以提升重建音频的主观听觉质量,并最终实现一套包含24kbps和32kbps码率的宽带语音与音频通用编码器;最后,对所提算法进行了客观PESQ/PEAQ和主观A/B测试,并与ITU-T G.722.1和G.722.2编码器进行了比较,实验结果表明,所提编码器对语音和音频信号的编码质量均优于参考编码器。 展开更多
关键词 语音编码 音频编码 经验模态分解 感知匹配追踪 抖动格型矢量量化
下载PDF
音频信号的混沌特性分析 被引量:1
4
作者 鲍枫 刘鑫 +1 位作者 贾懋珅 鲍长春 《电讯技术》 北大核心 2011年第7期97-102,共6页
依据非线性动力学理论,在音频信号的修正离散余弦变换(MDCT)域,采用自相关法和虚假近邻法(FNN)分别计算延迟时间和嵌入维数,重构出音频信号MDCT域信息的相空间,并基于Rosen-stein小数据量法计算最大Lyapunov(李雅普诺夫)指数,依据其正... 依据非线性动力学理论,在音频信号的修正离散余弦变换(MDCT)域,采用自相关法和虚假近邻法(FNN)分别计算延迟时间和嵌入维数,重构出音频信号MDCT域信息的相空间,并基于Rosen-stein小数据量法计算最大Lyapunov(李雅普诺夫)指数,依据其正负对音频频域序列的混沌特性进行了统计分析和验证。实验表明,音频信号MDCT序列的最大Lyapunov指数皆为正,音频信号具有混沌特性。 展开更多
关键词 音频信号处理 修正离散余弦变换 相空间重构 LYAPUNOV指数 混沌特性
下载PDF
基于AAC比特流的音频信号Hiss噪声抑制方法
5
作者 邓峰 鲍长春 鲍枫 《通信学报》 EI CSCD 北大核心 2013年第5期20-30,共11页
基于AAC比特流,提出了一种压缩域音频Hiss噪声抑制方法。该方法的输入为含噪音频的AAC比特流,输出为增强音频的AAC比特流。首先,利用修正的绝对中值标准差(MMAD,modified median absolute deviation)估计Hiss噪声,其次,利用修正的离散... 基于AAC比特流,提出了一种压缩域音频Hiss噪声抑制方法。该方法的输入为含噪音频的AAC比特流,输出为增强音频的AAC比特流。首先,利用修正的绝对中值标准差(MMAD,modified median absolute deviation)估计Hiss噪声,其次,利用修正的离散傅里叶变换(MDFT,modified discrete Fourier transform)计算听觉掩蔽阈值参数,最后,根据参数软阈值方法得到增强的AAC比特流,并用于AAC解码器得到最终的增强音频信号。主观和客观测试结果表明,所提出的方法能有效去除AAC解码音频信号中的Hiss噪声,其性能明显优于现有的几种Hiss噪声消除方法。 展开更多
关键词 AAC比特流 Hiss噪声 压缩域 修正的离散傅里叶变换 噪声抑制
下载PDF
基于双正交小波包分解的自适应阈值语音增强 被引量:14
6
作者 李如玮 鲍长春 窦慧晶 《仪器仪表学报》 EI CAS CSCD 北大核心 2008年第10期2135-2140,共6页
传统的小波去噪算法是一种有效的去除白噪声的算法,为了能够去除多种有包噪声,本文提出了基于双正交小波包分解的自适应阈值语音增强方法,该方法能够自适应地跟踪噪声的水平,以此来更新所选阈值,同时采用动态阈值方法去除噪声,从而能有... 传统的小波去噪算法是一种有效的去除白噪声的算法,为了能够去除多种有包噪声,本文提出了基于双正交小波包分解的自适应阈值语音增强方法,该方法能够自适应地跟踪噪声的水平,以此来更新所选阈值,同时采用动态阈值方法去除噪声,从而能有效地去除或降低多种有色噪声,实验结果表明,该方法由于能够在处理过程中保证相位不失真,从而性能优于基于正交小波分解的去噪方法。 展开更多
关键词 语音增强 小波变换 自适应阈值
下载PDF
最新的ITU-T嵌入式变速率语音编码关键技术 被引量:9
7
作者 李海婷 范睿 +4 位作者 朱恒 刘泽新 鲍长春 贾懋珅 李锐 《电声技术》 2006年第11期50-55,58,共7页
介绍了ITU-T的新一代语音编码标准G.729.1的编码器、译码器原理,讨论了此标准实现码流嵌入式所采用的关键技术:嵌入式的码激励线性预测编码技术、时域频带扩展技术以及时域混叠抵消的预测变换编码技术,并通过客观评测验证了G.729.1语音... 介绍了ITU-T的新一代语音编码标准G.729.1的编码器、译码器原理,讨论了此标准实现码流嵌入式所采用的关键技术:嵌入式的码激励线性预测编码技术、时域频带扩展技术以及时域混叠抵消的预测变换编码技术,并通过客观评测验证了G.729.1语音编码标准的高性能。 展开更多
关键词 语音编码 音频编码 嵌入式编解码器
下载PDF
说话人分割聚类研究进展 被引量:7
8
作者 马勇 鲍长春 《信号处理》 CSCD 北大核心 2013年第9期1190-1199,共10页
说话人分割聚类是近几年新兴起的语音信号处理研究方向,它主要研究如何确定连续语流中多说话人起止时间的位置,并标出每个语音段对应的说话人。这项研究对自动语音识别、多说话人识别和基于内容的音频分析等都具有重要的意义。根据说话... 说话人分割聚类是近几年新兴起的语音信号处理研究方向,它主要研究如何确定连续语流中多说话人起止时间的位置,并标出每个语音段对应的说话人。这项研究对自动语音识别、多说话人识别和基于内容的音频分析等都具有重要的意义。根据说话人分割和聚类实现过程不同,本文从异步策略和同步策略的角度回顾了十年来国内外研究的主流算法、技术和代表系统,对比了不同代表系统在近几年NIST富信息转写评测的结果,最后讨论了目前还存在的问题,并对未来的发展进行了展望。 展开更多
关键词 说话人分割聚类 异步策略 同步策略 贝叶斯信息判决
下载PDF
宽带嵌入式语音编解码的帧擦除隐藏方法 被引量:1
9
作者 朱恒 鲍长春 李锐 《通信学报》 EI CSCD 北大核心 2008年第6期1-7,共7页
提出了一种宽带嵌入式编解码器的帧擦除隐藏方法。该方法在解码端将丢失帧分为静音、浊音、清音、清音向浊音的过渡、浊音向清音的过渡的语音类型,并根据语音类型对激励信号的能量采取对应的控制和调整。为了和宽带嵌入式编码器的结构... 提出了一种宽带嵌入式编解码器的帧擦除隐藏方法。该方法在解码端将丢失帧分为静音、浊音、清音、清音向浊音的过渡、浊音向清音的过渡的语音类型,并根据语音类型对激励信号的能量采取对应的控制和调整。为了和宽带嵌入式编码器的结构相匹配,丢失帧的自适应码书根据前一帧的码流来恢复。为了增强编解码器的顽健性,在编码端采取了控制自适应码书贡献的技术。所建议的帧擦除隐藏技术不需要额外的比特和延迟,方法简单,恢复效果好,在提交给ITU-T的嵌入式变速率候选编码方案中得到使用。 展开更多
关键词 语音编码 嵌入式编码 帧擦除隐藏 VOIP
下载PDF
ITU-T嵌入式变速率语音编码的帧擦除掩蔽技术
10
作者 朱恒 范睿 +4 位作者 李海婷 刘泽新 鲍长春 李锐 贾懋珅 《电声技术》 2007年第4期49-52,共4页
介绍了ITU-T新一代语音编码标准G.729.1的帧擦除掩蔽技术,它是一种针对具有嵌入式结构编码器的帧擦除掩蔽技术。利用编码端得到的掩蔽参数以及其他有效的掩蔽恢复技术,其中包括声门脉冲同步、能量控制和人造语音起始帧技术,测试表明:该... 介绍了ITU-T新一代语音编码标准G.729.1的帧擦除掩蔽技术,它是一种针对具有嵌入式结构编码器的帧擦除掩蔽技术。利用编码端得到的掩蔽参数以及其他有效的掩蔽恢复技术,其中包括声门脉冲同步、能量控制和人造语音起始帧技术,测试表明:该帧擦除掩蔽技术是一种有效的方法,能较好地消除帧丢失造成的不良影响。 展开更多
关键词 语音编码 音频编码 帧擦除掩蔽 VOIP
下载PDF
基于离散余弦变换的波形内插语音编码算法 被引量:4
11
作者 刘靖宇 鲍长春 李如玮 《电子学报》 EI CAS CSCD 北大核心 2009年第7期1599-1605,共7页
针对波形内插(Waveform Interpolation,WI)语音编码的特征波形分解问题,本文首先提出了基于离散余弦变换(Discrete Cosine Transform,DCT)的特征波形分解方法,避免了复杂的特征波形对齐运算;其次,针对WI的相位重建问题,提出了清/浊音相... 针对波形内插(Waveform Interpolation,WI)语音编码的特征波形分解问题,本文首先提出了基于离散余弦变换(Discrete Cosine Transform,DCT)的特征波形分解方法,避免了复杂的特征波形对齐运算;其次,针对WI的相位重建问题,提出了清/浊音相位判决和浊音相位分类的方法,提高了重建语音质量;最后,分别构建了速率为2.0kbps和1.6kbps的DCT-WI声码器.主观MOS分表明,2.0kbps的DCT-WI声码器质量优于2.4kbps MELP声码器,1.6kbps的DCT-WI声码器亦取得了良好的听觉效果. 展开更多
关键词 语音编码 波形内插 特征波形 离散余弦变换 特征波形对齐 相位重建
下载PDF
基于二维非负矩阵分解的1kb/s WI语音编码算法 被引量:3
12
作者 薛二娟 鲍长春 李如玮 《电子学报》 EI CAS CSCD 北大核心 2010年第7期1574-1579,共6页
本文针对波形内插(WI)语音编码模型和参数量化等技术进行了研究,并最终提出了一种基于二维非负矩阵分解的1kb/s波形内插(2DNMF-WI)语音编码算法.文中采用二维非负矩阵分解(2D-NMF)方法来分解语音特征波形(CW),该分解方法在行和列两个方... 本文针对波形内插(WI)语音编码模型和参数量化等技术进行了研究,并最终提出了一种基于二维非负矩阵分解的1kb/s波形内插(2DNMF-WI)语音编码算法.文中采用二维非负矩阵分解(2D-NMF)方法来分解语音特征波形(CW),该分解方法在行和列两个方向上同时压缩CW幅度谱矩阵的维数,使得CW幅度谱矩阵降维后得到的编码矩阵维数较小,易于量化.此外,在甚低速率语音编码中,由于没有足够的比特数来描述编码参数,往往很难得到高质量的合成语音.本算法采用两帧联合编码、帧间后向预测三级矢量量化、离散余弦变换(DCT)和分裂式矩阵量化等技术来降低编码速率和改善音质.非正式主观听觉测试显示,1kb/s 2DNMF-WI编码器合成语音的质量稍差于2kb/s的NMF-WI语音编码算法. 展开更多
关键词 语音编码 波形内插 特征波形 二维非负矩阵分解 两帧联合
下载PDF
音频带宽扩展技术分析与展望 被引量:3
13
作者 鲍枫 刘鑫 +1 位作者 贾懋珅 鲍长春 《电讯技术》 北大核心 2011年第2期122-126,共5页
对音频带宽扩展中的非盲目式和盲目式高频重建技术进行了分析、对比,给出了非盲目式高频重建中的6种技术及盲目式高频重建中的4种技术的基本原理,并对它们各自的优劣性进行了评价,指出盲目式高频重建法将是未来频带扩展技术发展中关注... 对音频带宽扩展中的非盲目式和盲目式高频重建技术进行了分析、对比,给出了非盲目式高频重建中的6种技术及盲目式高频重建中的4种技术的基本原理,并对它们各自的优劣性进行了评价,指出盲目式高频重建法将是未来频带扩展技术发展中关注和研究的热点。 展开更多
关键词 音频信号处理 音频编码 带宽扩展 高频重建
下载PDF
基于非线性音频特征分类的频带扩展方法 被引量:2
14
作者 张丽燕 鲍长春 +1 位作者 刘鑫 张兴涛 《通信学报》 EI CSCD 北大核心 2013年第8期120-130,139,共12页
提出了一种基于非线性音频分类的频带扩展方法,即利用递归图和定量递归分析将音频信号的时间序列分成4类,并分别采用4种方法恢复高频频谱细节,最终利用高斯混合模型和基于软判决的码书映射调整频谱包络和能量增益。主客观测试表明,该方... 提出了一种基于非线性音频分类的频带扩展方法,即利用递归图和定量递归分析将音频信号的时间序列分成4类,并分别采用4种方法恢复高频频谱细节,最终利用高斯混合模型和基于软判决的码书映射调整频谱包络和能量增益。主客观测试表明,该方法优于传统的盲目式频带扩展方法,且应用到ITU-T G.722.1编解码器时,音频质量优于同码率下的G.722.1C编解码器。 展开更多
关键词 音频编码 频带扩展 音频分类 递归图 定量递归分析
下载PDF
基于分形的音频频带盲扩展方法 被引量:2
15
作者 李红蕊 鲍长春 +1 位作者 刘鑫 白海钏 《信号处理》 CSCD 北大核心 2013年第9期1127-1133,共7页
本文提出了一种基于分形理论的音频频带盲扩展方法。首先,借助重标极差分析法估计频谱细节序列的Hurst指数,对不同音频信号谱细节序列的Hurst指数进行统计分析,验证了音频信号频域序列具有长相关特性。然后,运用坐标延迟法对谱细节序列... 本文提出了一种基于分形理论的音频频带盲扩展方法。首先,借助重标极差分析法估计频谱细节序列的Hurst指数,对不同音频信号谱细节序列的Hurst指数进行统计分析,验证了音频信号频域序列具有长相关特性。然后,运用坐标延迟法对谱细节序列进行相空间重构,基于夹角余弦选取预测中心相点的近邻点,根据预测中心相点和近邻相点的相关性,求取一个吸引子与预测中心相点相近的迭代函数系统,实现对高频谱细节的分形预测。最后,结合高斯混合模型的高频能量估计算法,实现宽带向超宽带的扩展算法。主、客观质量评测均表明本文算法优于传统的频带盲扩展方法。 展开更多
关键词 频带扩展 相空间 分形 HURST指数
下载PDF
基于贝叶斯阴阳机的2kb/s NMF-WI语音编码算法 被引量:3
16
作者 郭莉莉 鲍长春 《电子学报》 EI CAS CSCD 北大核心 2009年第5期1146-1152,F0003,共8页
本文提出了一种改进型的基于非负矩阵分解(Nonnegative Matrix Factorization,NMF)的特征波形(Charac-teristic Waveform,CW)分解算法,一方面应用惩罚次胜者竞争学习算法(Rival Penalized Competitive Learning,RPCL)和贝叶斯阴阳机(Bay... 本文提出了一种改进型的基于非负矩阵分解(Nonnegative Matrix Factorization,NMF)的特征波形(Charac-teristic Waveform,CW)分解算法,一方面应用惩罚次胜者竞争学习算法(Rival Penalized Competitive Learning,RPCL)和贝叶斯阴阳机(Bayesian Ying-Yang,BYY)和谐学习算法,来计算NMF分解阶数,在没有明显降低语音质量的前提下,降低了编码器的复杂度;另一方面根据CW的能量与编码矩阵的能量间的变化关系,提出了相位谱的混合自回归合成方法,提高了语音的自然度.最后,开发出一套改进型2kb/s NMF-WI低复杂度语音编码方法,采用基于K-L散度的NMF迭代算法和收敛速度更快的基矢量Mel刻度分带初始化方法,按照基音周期的统计分布将特征波形分为6类,在CW分解模块,复杂度下降了10MOPS,语音质量提高,与采用4bit散布矢量量化相位谱的2.16kb/s NMF-WI语音编码器的语音质量相当. 展开更多
关键词 语音编码 波形内插 特征波形 非负矩阵分解
下载PDF
适应噪声强度突变的噪声估计加速方法 被引量:3
17
作者 夏丙寅 鲍长春 《信号处理》 CSCD 北大核心 2013年第10期1336-1345,共10页
为提高传统噪声估计方法对噪声强度突变的跟踪能力,本文在最小值控制递归平均(MCRA)方法基础上提出了噪声估计加速方法。该方法首先检测功率谱的突变,在检测到突变后设定具有自适应长度的拖尾段,并在拖尾段中利用对数似然比、谱熵和平... 为提高传统噪声估计方法对噪声强度突变的跟踪能力,本文在最小值控制递归平均(MCRA)方法基础上提出了噪声估计加速方法。该方法首先检测功率谱的突变,在检测到突变后设定具有自适应长度的拖尾段,并在拖尾段中利用对数似然比、谱熵和平均幅度差函数进行话音活动性检测(VAD),而后结合噪声估计与功率谱最小值比例等辅助参数判定是否对噪声估计进行强制更新。ITU-T G.160测试结果表明,噪声估计加速算法的引入未对噪声强度平稳情况下的语音增强算法性能产生影响,但显著降低了噪声强度突变时的收敛时间,并在很大程度上抑制了噪声估计收敛段中的音乐噪声。 展开更多
关键词 语音增强 噪声估计 话音活动性检测 谱熵 对数似然比 平均幅度差函数
下载PDF
宽带ISF参数的非等系数帧间预测分裂矢量量化方法 被引量:1
18
作者 李海婷 鲍长春 《电子学报》 EI CAS CSCD 北大核心 2008年第6期1214-1217,共4页
本文提出了一种新的适用于宽带语音编码ISF参数量化的非等系数帧间预测分裂矢量量化方案.该量化方案利用ISF参数的帧间相关性,基于预测分裂矢量量化原理,首先对待量化的ISF参数矢量进行去均值和非等系数帧间预测,然后对去均值后的ISF参... 本文提出了一种新的适用于宽带语音编码ISF参数量化的非等系数帧间预测分裂矢量量化方案.该量化方案利用ISF参数的帧间相关性,基于预测分裂矢量量化原理,首先对待量化的ISF参数矢量进行去均值和非等系数帧间预测,然后对去均值后的ISF参数的预测残差进行分裂矢量量化.实验表明,该算法在每帧编码比特数为46bits时达到了透明量化,且平均谱失真比G.722.2中ISF参数量化的平均谱失真小. 展开更多
关键词 语音编码 矢量量化 导抗谱频率 非等系数帧间预测
下载PDF
基于非线性动力学的乐器分类方法 被引量:2
19
作者 芮瑞 鲍长春 《电子学报》 EI CAS CSCD 北大核心 2012年第7期1481-1488,共8页
本文基于非线性动力学理论,对不同乐器产生的音频时间序列进行了相空间重构,通过分析各类乐器的递归特性,提出了一个新的定量递归参数——密集度,它能够描述管乐器、弦乐器和键盘乐器在相空间中的差异,然后将密集度与传统的音色特征相结... 本文基于非线性动力学理论,对不同乐器产生的音频时间序列进行了相空间重构,通过分析各类乐器的递归特性,提出了一个新的定量递归参数——密集度,它能够描述管乐器、弦乐器和键盘乐器在相空间中的差异,然后将密集度与传统的音色特征相结合,提出一种乐器分类方法,并将其应用于不同的分类模型.实验表明,本文所提的方法使三类乐器家族的分类准确率提高了4%~7%,单个乐器的分类准确率提高了3%左右. 展开更多
关键词 乐器分类 非线性动力学 相空间重构 密集度 递归图
下载PDF
双麦克风噪声消除的高斯混合模型法 被引量:1
20
作者 陈浩 鲍长春 夏丙寅 《信号处理》 CSCD 北大核心 2014年第7期813-821,共9页
为了解决基于相位差滤波器(PBF)双麦克风方法残留噪声较多的问题,本文在PBF方法基础上提出一种基于高斯混合模型的双麦克风噪声消除方法。该方法首先采用高斯混合模型(GMM)对目标语音存在(l1)与目标语音不存(l0)在这两种情况进行建模。... 为了解决基于相位差滤波器(PBF)双麦克风方法残留噪声较多的问题,本文在PBF方法基础上提出一种基于高斯混合模型的双麦克风噪声消除方法。该方法首先采用高斯混合模型(GMM)对目标语音存在(l1)与目标语音不存(l0)在这两种情况进行建模。其次,在实时增强阶段,根据贝叶斯分类器计算每帧的目标语音存在概率(TSPP),随后根据噪声抑制最大化准则修正PBF的增益函数并得到改进的相位差滤波器(IPBF),最后将TSPP与IPBF的增益函数相结合,进而得到一种用于双麦克风噪声消除的掩蔽滤波器。实验结果表明:本文提出算法可有效抑制残留噪声,尤其是在目标语音不存在的时间段。 展开更多
关键词 噪声消除 双麦克风 相位差 高斯混合模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部