-
题名基于小波及能量熵的带噪语音端点检测算法
被引量:3
- 1
-
-
作者
张婷
何凌
黄华
刘肖珩
-
机构
四川大学电气信息学院
四川大学华西基础医学与法医学院生物医学工程研究室
-
出处
《计算机工程与设计》
CSCD
北大核心
2013年第4期1331-1335,共5页
-
基金
国家自然科学基金项目(10972148)
-
文摘
为了在复杂的噪声环境中区分出语音信号和非语音信号(噪声),提出了一种基于小波及能量熵的带噪语音端点检测方法。该方法利用小波的多分辨率特性以及它对非平稳信号局部特征的表现能力,对含噪语音信号进行小波变换,用各层能量熵值的平均值来有效地区分语音段和非语音段。不同背景噪声及不同信噪比下的实验结果表明,提出的带噪语音端点检测算法获得了较高的检测正确率。
-
关键词
小波变换
小波降噪
能量熵
自适应阈值
带噪语音端点检测
-
Keywords
wavelet transform
wavelet denoising
energy entropy
adaptive threshold
noisy speech endpoint detection
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种增强带噪语音可懂度的新算法
被引量:1
- 2
-
-
作者
姚峰英
张敏
-
机构
中国科学院上海冶金研究所微电子学分部
-
出处
《声学学报》
EI
CSCD
北大核心
2002年第6期529-530,共2页
-
文摘
一般的语音增强算法在强噪声环境中只能提高信噪比,不能提高可懂度。本文提出用可调节白噪声代替信号中非语音部分的语音可懂度增强处理新算法。实验证明此方法能明显改善强噪声时的语音可懂度,能对低至-10dB的带噪语音信号进行有效的可懂度增强。
-
关键词
带噪语音
算法
语音增强
可懂度
语音信号处理
-
Keywords
Algorithms
Amplitude modulation
Signal to noise ratio
White noise
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名应用谱减法处理带噪语音信号的研究
被引量:2
- 3
-
-
作者
崔周培
戴冬原
-
机构
江苏自动化研究所
-
出处
《仪表技术》
2011年第6期46-49,共4页
-
文摘
语音信号经常会受到环境噪声的干扰,而噪声会影响语音通信的质量甚至是语音处理系统地运行。对于带噪语音信号的处理,主要目的是提取出尽可能纯净的原始语音。文章研究了基于功率谱的语音处理方法,主要包括功率谱相减算法和改进算法两种;给出了谱减法算法及其改进形式的基本原理、实现方法,并且运用MATLAB软件仿真得出了两种算法的语音处理效果。实验表明,在加性平稳噪声条件下,与常用谱减法算法相比,改进算法能更好地抑制噪声,从而提高了语音质量和信噪比。
-
关键词
带噪语音信号
谱减法
改进算法
MATLAB仿真
信噪比
-
Keywords
speech signal with noise
spectral subtraction
improving algorithm
MATLAB simulation
SNR
-
分类号
TN912
[电子电信—通信与信息系统]
-
-
题名基于分形维数的带噪语音端点检测
被引量:5
- 4
-
-
作者
贾亮
尹伊
杨慧超
-
机构
沈阳航空航天大学电子信息工程学院
-
出处
《沈阳航空航天大学学报》
2017年第5期63-67,共5页
-
文摘
噪声环境下语音端点检测的难度会大大提高,应用分形维数法对带噪语音进行了分析,利用分形的性质,可以更好地分析语音特性,根据分形维数的不同可以实现语音段与噪音段的分割,实现带噪语音的起止点检测。通过对比分形维数的端点检测法与传统的谱熵端点检测法,针对在信噪比为0d B与5d B的语音信号进行仿真,结果表明,分形维数的方法能更好地分割语音段与噪声段。
-
关键词
分形维数
语音端点检测
谱熵
带噪语音
-
Keywords
fractal dimension
speech endpoint detection
spectrum entropy
noisy speech
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名递归分析在带噪语音端点检测中的应用
被引量:1
- 5
-
-
作者
贾亮
尹伊
杨慧超
-
机构
沈阳航空航天大学电子信息工程学院
-
出处
《沈阳航空航天大学学报》
2017年第6期83-86,共4页
-
文摘
噪声环境下语音端点检测的难度会大大提高,递归分析是一种非线性动力学分析方法,可以更好地表示语音特征,应用消除趋势项的递归分析法对带噪语音进行分析,实现带噪语音的起止点检测。通过对比传统的谱熵端点检测法,针对在信噪比为0d B与-5d B的语音信号进行仿真,结果表明,递归分析端点检测法能更好地分割语音段与噪声段。
-
关键词
谱熵
递归度
端点检测
带噪语音
-
Keywords
spectral entropy
recursive degree
endpoint detection
noisy speech
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于自适应门限融合策略的语音去噪算法
- 6
-
-
作者
薛珮芸
师晨康
白静
赵建星
汪思斌
-
机构
太原理工大学电子信息与光学工程学院
山西高等创新研究院博士后科研工作站
-
出处
《无线电工程》
2024年第4期1026-1033,共8页
-
基金
山西省应用基础研究计划项目(201901D111094)
山西省基础研究计划(20210302124544)。
-
文摘
针对单个语音去噪算法在去噪过程中关注点较为单一,而多个语音去噪算法在融合时存在细节信息被削弱、融合效果不理想的问题,提出一种多个语音去噪算法下的自适应门限融合策略,将带噪信号分别经过3种不同的去噪算法得到3个去噪信号;根据自适应门限值以帧为单位进行帧筛选,得到自适应门限融合策略下的去噪信号;为提高识别效果,采用倒谱提升器对Gammatone频率倒谱系数(Gammatone Frequency Cepstrum Coefficient, GFCC)进行改进,并联合支持向量机进行噪声环境下的语音识别。实验结果表明,在5、10、15、20 dB四种信噪比下,通过该融合策略所得到的去噪信号与目前主流的顺序融合及多级融合方式相比,在语音识别率方面平均提高3.6%,融合倒谱提升器的GFCC特征相比于GFCC特征平均提高了2.2%。
-
关键词
语音去噪
自适应门限融合
带噪语音
帧筛选
Gammatone滤波器
-
Keywords
speech denoising
adaptive threshold fusion
noisy speech
frame filtering
Gammatone filter
-
分类号
TN912.35
[电子电信—通信与信息系统]
-
-
题名一种改进的基于倒谱特征的带噪语音端点检测方法
被引量:8
- 7
-
-
作者
沈红丽
曾毓敏
王鹏
-
机构
南京师范大学物理科学与技术学院
-
出处
《通信技术》
2009年第2期156-158,共3页
-
文摘
环境噪声是语音识别和说话人识别性能下降的原因之一,端点检测作为其关键技术之一,性能优劣在某种程度上决定了识别率的高低。文章提出一种改进的基于倒谱特征的带噪语音端点检测方法。在传统基于倒谱距离的算法基础上,该算法进一步综合利用短时过零率和短时能量作为最终判决的门限。实验结果表明,该方法计算效率较高,低信噪比下有较好的检测性能。
-
关键词
端点检测
倒谱距离
带噪语音
-
Keywords
endpoint detection
cepstral distance
noisy speech
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名压缩感知与EMD相结合的带噪面罩语音增强
被引量:1
- 8
-
-
作者
王霞
王丹
王光艳
张艳
-
机构
河北工业大学电子信息工程学院
天津商业大学信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2017年第18期137-140,256,共5页
-
基金
天津市自然科学基金重点项目(No.14JCZDJC32600)
-
文摘
针对带噪面罩语音清晰度和可懂度低的问题,提出了一种将压缩感知和经验模式分解(Empirical Mode Decomposition,EMD)相结合的方法来对带噪面罩语音进行增强。首先对带噪面罩语音进行EMD分解得到其本征模式函数信号分量,对其特定本征模式分量进行小波阈值去噪;然后对全部信号分量进行压缩感知,最后重构信号分量得到增强后面罩语音。由实验结果可知,文中提出的方法去噪效果较好,重构误差较小,稳定性较高,有效地实现了面罩语音的增强。
-
关键词
带噪面罩语音增强
压缩感知
经验模式分解
小波阈值
-
Keywords
noisy mask speech enhancement
compressed sensing
Empirical Mode Decomposition(EMD)
wavelet threshold
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名稀疏低秩噪声模型下无监督实时单通道语音增强算法
被引量:8
- 9
-
-
作者
李轶南
张雄伟
贾冲
陈亮
曾理
-
机构
解放军理工大学指挥信息系统学院
解放军理工大学通信工程学院
-
出处
《声学学报》
EI
CSCD
北大核心
2015年第4期607-614,共8页
-
基金
国家自然科学基金(61072042
61402519
+3 种基金
61471394)
江苏省自然科学基金(BK2012510
BK20140071
BK20140074)资助
-
文摘
针对现有基于字典学习的增强算法需要先验信息、不易实时处理的问题,提出一种便于实时处理的无监督的单通道语音增强算法。首先,该算法将无监督条件下背景噪声的建模问题转化为带噪语音幅度谱的稀疏低秩噪声分解;然后,采用增量非负子空间方法对背景噪声进行在线字典学习,获得能够体现背景噪声时变特性的自适应噪声字典;最后,利用所得的噪声字典,采用易于实时处理的逐帧迭代方式,对带噪语音进行处理。实验结果表明:相较于多带谱减法和基于低秩稀疏矩阵分解的增强算法,所提算法在噪声抑制方面的性能尤为显著,在多项性能评价指标上,均表现出更好的结果。
-
关键词
语音增强
无监督
算法处理
带噪语音
噪声模型
实时处理
背景噪声
矩阵分解
幅度谱
迭代方式
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于小波变换系数自适应阈值法在语音去噪中的应用
被引量:2
- 10
-
-
作者
孙炯宁
傅德胜
徐永华
-
机构
南京信息工程大学计算机科学与技术系
-
出处
《南京气象学院学报》
CSCD
北大核心
2005年第1期133-137,共5页
-
文摘
在软阈值去噪算法基础上,根据小波变换后信号与噪音具有的奇异性,提出无偏风险自适应阈值估计算法,并应用于语音信号的去噪处理,实验结果表明该算法的最小均方误差低于其他的去噪算法。
-
关键词
带噪语音
小波变换
去噪
自适应阈值
-
Keywords
noisy speech
wavelet transform
de-noising
adaptive thresholding
-
分类号
TN912.35
[电子电信—通信与信息系统]
-
-
题名一个基于谱熵的语音端点检测改进方法
被引量:27
- 11
-
-
作者
王让定
柴佩琪
-
机构
宁波大学纵横智能软件研究所
同济大学人工智能研究室
-
出处
《信息与控制》
CSCD
北大核心
2004年第1期77-81,共5页
-
文摘
本文提出了基于谱熵和谱减法相结合的带噪语音端点检测改进算法以及端点检测的判决准则 .仿真实验表明 ,在语音信号受到强噪声的干扰后 (5dB≤SNR≤ 15dB) ,所提方法可检测到准确的语音端点 .
-
关键词
谱熵
谱减法
端点检测
判决准则
带噪语音
自动语音识别
语音编码
-
Keywords
noisy speech
endpoint detection
spectral entropy
discriminant rules
-
分类号
TN912.34
[电子电信—通信与信息系统]
O236
[理学—运筹学与控制论]
-
-
题名基于改进HHT的语音端点检测
被引量:4
- 12
-
-
作者
章小兵
李燕萍
王双杰
-
机构
安徽工业大学电气与信息工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2016年第6期171-174,共4页
-
基金
安徽工业大学产学研基金资助重大项目(RD14206003)
-
文摘
针对带噪语音在不同噪声环境下,尤其是非平稳噪声下难以判断语音段端点的问题,提出一种基于改进的希尔伯特-黄变换(HHT)瞬时能量的端点检测方法。对每帧带噪信号进行经验模式分解得到固有模态函数(IMF),选取分量IMF1,将其作为本底噪声并进行HHT得到噪声的瞬时能量,设置门限阈值,结合分量IMF3对带噪信号进行端点检测。该方法可提取非平稳噪声下带噪语音中的噪声成分,避免传统方法中选取前几帧信号作为噪声的局限性,同时利用分量IMF3进行端点检测达到滤波的效果。实验结果表明,该方法在不同噪声环境和低信噪比条件下提高了带噪语音端点检测的准确率。
-
关键词
带噪语音
端点检测
希尔伯特-黄变换
瞬时能量
本底噪声
门限阈值
-
Keywords
speech with noise
endpoint detection
Hilbert-Huang Transform(HHT)
instantaneous energy
ground noise
threshold
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名改进的基于多特征的语音端点检测方法
被引量:1
- 13
-
-
作者
沈红丽
曾毓敏
李平
王鹏
-
机构
南京师范大学物理系
-
出处
《电子工程师》
2008年第9期4-6,共3页
-
基金
江苏省普通高校自然科学研究计划基金资助项目(07KJD510110)
-
文摘
噪声环境是语音识别性能下降的原因之一,端点检测作为其关键技术,其性能优劣在某种程度上决定了识别率的高低。提出一种改进的基于倒谱特征的带噪端点检测方法。在传统基于倒谱距离的算法上综合利用短时过零率和短时能量多特征作为最终判决的门限。实验结果表明,该方法计算效率较高,低信噪比下有较好的检测性能。
-
关键词
语音识别
端点检测
倒谱距离
带噪语音
-
Keywords
speech recognition
endpoint detection
cepstral distance
noisy speech
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于PSO-BP的语音增强方法研究
- 14
-
-
作者
张娓娓
陈乐瑞
-
机构
河南工业职业技术学院电气工程系
郑州铁路职业技术学院
-
出处
《创新科技》
2014年第8期60-61,共2页
-
文摘
针对一些常用语音增强方法的特点和不足,本文提出将改进粒子群优化BP网络算法用于语音增强,仿真结果表明:基于PSO-BP神经网络的语音增强方法可以较大幅度的提升带噪语音信号的信噪比,效果明显。
-
关键词
语音增强
带噪语音信号
信噪比
-
分类号
TN912
[电子电信—通信与信息系统]
-
-
题名基于改进小波变换的语音基音周期检测
被引量:7
- 15
-
-
作者
吴兴铨
周金治
-
机构
西南科技大学信息工程学院
西南科技大学特殊环境机器人技术四川省重点实验室
-
出处
《自动化仪表》
CAS
2017年第6期67-70,74,共5页
-
基金
特殊环境机器人技术四川省重点实验室基金资助项目(13ZXTK07)
-
文摘
基音在许多方面都有比较广泛的应用,比如语音编码、语音识别、语音转换、音乐检索以及发声系统疾病诊断等。针对目前很多小波变换方法在测量基音周期时存在的准确度低、复杂度高、鲁棒性差等缺点,以及在带噪语音环境下,特别是在非平稳噪声下比较难判断语音基音周期的问题,提出了一种基于改进小波变换的语音基音检测方法。首先将每帧带噪信号进行预处理,提取出有话段的信息,消除直流分量;然后在加窗分帧后先进行端点检测,滤波后再分帧;接着再利用小波分解后取低频系数重构信号;最后结合四阶累积法对重构信号进行基音检测。试验结果表明,该方法在不同带噪语音环境下和低信噪比条件下,提高了带噪语音基音检测的准确性。与传统的小波变换法相比,该方法鲁棒性好且计算复杂度低,有利于语音基音周期检测。
-
关键词
带噪语音
基音检测
小波变换
重构信号
三电平中心削波
端点检测
信噪比
-
Keywords
Noisy speech
Pitch detection
Wavelet transform
Restructured signal
Three - level center clipping
Endpoint detection
SNR
-
分类号
TH-3
[机械工程]
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名联合深度神经网络和凸优化的单通道语音增强算法
被引量:4
- 16
-
-
作者
张晓艳
张天骐
葛宛营
白杨柳
-
机构
重庆邮电大学通信与信息工程学院/信号与信息处理重庆市重点实验室
-
出处
《声学学报》
EI
CAS
CSCD
北大核心
2021年第3期471-480,共10页
-
基金
国家自然科学基金项目(61671095,61702065,61701067,61771085)
信号与信息处理重庆市市级重点实验室建设项目(CSTC2009CA2003)
+1 种基金
重庆市研究生科研创新项目(CYS19248)
重庆市教育委员会科研项目(KJ1600427,KJ1600429)的资助。
-
文摘
噪声估计的准确性直接影响语音增强算法的好坏,为提升当前语音增强算法的噪声抑制效果,有效求解无约束优化问题,提出一种联合深度神经网络(DNN)和凸优化的时频掩蔽优化算法进行单通道语音增强。首先,提取带噪语音的能量谱作为DNN的输入特征;接着,将噪声与带噪语音的频带内互相关系数(ICC Factor)作为DNN的训练目标;然后,利用DNN模型得到的互相关系数构造凸优化的目标函数;最后,联合DNN和凸优化,利用新混合共轭梯度法迭代处理初始掩蔽,通过新的掩蔽合成增强语音。仿真实验表明,在不同背景噪声的低信噪比下,相比改进前,新的掩蔽使增强语音获得了更好的对数谱距离(LSD)、主观语音质量(PESQ)、短时客观可懂度(STOI)和分段信噪比(segSNR)指标,提升了语音的整体质量并且可以有效抑制噪声。
-
关键词
带噪语音
梯度下降法
DNN
抑制噪声
互相关系数
低信噪比
增强算法
凸优化
深度神经网络
-
分类号
TN912.35
[电子电信—通信与信息系统]
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名联合深度编解码网络和时频掩蔽估计的单通道语音增强
被引量:11
- 17
-
-
作者
时文华
张雄伟
邹霞
孙蒙
李莉
-
机构
陆军工程大学
北京航空工程技术研究中心
-
出处
《声学学报》
EI
CSCD
北大核心
2020年第3期299-307,共9页
-
基金
国家自然科学基金项目(61471394)
江苏省优秀青年基金项目(BK20180080)资助。
-
文摘
提出了一种联合深度编解码神经网络和时频掩蔽估计的语音增强方法。该方法利用深度编解码网络估计时频掩蔽表示,并联合带噪语音的幅度谱学习带噪语音与纯净语音幅度谱之间的非线性映射关系。深度编解码网络采用卷积-反卷积网络结构。在编码端,利用卷积网络的局部感知特性,对带噪语音的时频域结构特征进行建模,提取语音特征,同时抑制背景噪声。在解码端,利用编码端提取到的语音特征逐层恢复局部细节信息并重构语音信号。同时,在编解码端对应层之间引入跳跃连接,以减少由于池化和全连接操作导致的低层细节信息丢失的问题。在TIMIT语音库和不完全匹配噪声集下进行仿真实验,实验结果表明,该方法可以有效抑制噪声,且能较好地恢复出语音细节成分。
-
关键词
增强方法
神经网络
编解码
幅度谱
带噪语音
反卷积网络
时频掩蔽
-
分类号
TN912.35
[电子电信—通信与信息系统]
-
-
题名基于条件深度卷积生成对抗网络的语音增强研究
被引量:2
- 18
-
-
作者
褚伟
-
机构
华东交通大学电气与自动化工程学院
-
出处
《智能计算机与应用》
2019年第4期82-86,共5页
-
文摘
语音交互技术日益在现实生活中得到广泛的应用,由于干扰的存在,现实环境中的语音交互技术远没有达到令人满意的程度.为了提高现实环境中语音交互性能,本文提出了一种基于条件深度卷积生成对抗网络(C-DCGAN)的语音增强模型,这是在GAN的基础上加入卷积层和条件信息.C-DCGAN利用卷积层提取语音特征,同时利用条件信息,生成高质量的语音.通过TIMIT数据集、NOISEX-92噪声库、Aurora2噪声库及环境噪声数据集对所提出的语音增强模型进行验证.结果表明,与谱减法、DNN等语音增强方法相比,C-DCGAN模型在PESQ和STOI指标上均有提高,表明本文提出的模型能取得良好的语音增强效果.
-
关键词
语音增强
条件卷积生成对抗网络
深度学习
带噪语音
-
Keywords
speech enhancement
conditional deep convolutional generative adversarial networks
deep neural networks
noisy speech
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-