期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
语种识别技术在中短波广播强噪声语音音频识别中的应用
1
作者 刘琪 莫东林 《电声技术》 2024年第5期49-51,共3页
在中短波广播中,语音信号经常受到各种噪声的影响,如电磁干扰和环境噪声,增加了语音识别的难度。基于此,全面探讨语种识别技术在中短波广播强噪声环境中的应用,详细介绍特征提取技术、模型适应策略、语言特征库的构建与模型调整方法,旨... 在中短波广播中,语音信号经常受到各种噪声的影响,如电磁干扰和环境噪声,增加了语音识别的难度。基于此,全面探讨语种识别技术在中短波广播强噪声环境中的应用,详细介绍特征提取技术、模型适应策略、语言特征库的构建与模型调整方法,旨在提高中短波广播中语种识别的准确率和效率。 展开更多
关键词 语种识别技术 中短波广播 噪声语音音频识别
下载PDF
基于动态单边自相关序列和频率规整线性预测的抗噪声语音识别 被引量:5
2
作者 刘海滨 吴镇扬 +1 位作者 赵力 曾毓敏 《声学学报》 EI CSCD 北大核心 2004年第2期182-186,共5页
提出了一种既符合人耳听觉特性又具有良好抗噪性的语音特征分析方法。首先将单边自相关函数序列进行时间方向的平滑处理,提高单边自相关函数的抗噪性,然后用平滑后的单边自相关函数序列代替原信号进行频率规整的LPC分析,最后经倒谱变换... 提出了一种既符合人耳听觉特性又具有良好抗噪性的语音特征分析方法。首先将单边自相关函数序列进行时间方向的平滑处理,提高单边自相关函数的抗噪性,然后用平滑后的单边自相关函数序列代替原信号进行频率规整的LPC分析,最后经倒谱变换得到该特征参数。数字语音识别实验证明:利用该特征参数的语音识别系统的识别性能优于MEL倒谱系数、LPC倒谱系数等传统的语音特征参数。 展开更多
关键词 动态单边自相关序列 频率规整线性预测 噪声语音识别 语音特征分析 自相关函数 倒谱变换 语音识别系统
下载PDF
由局部能量确定可靠性加权的抗噪声语音识别方法
3
作者 许超 曹志刚 《信号处理》 CSCD 2003年第3期262-265,共4页
噪声情况下的语音识别是个挑战性的问题。目前的处理方法普遍需要估计噪声或者信噪比,从而其性能依赖于噪声估计的好坏。本文提出了一种基于语音信号局部能量的可靠性加权方法,该方法着眼于语音本身的结构,避免了对噪声的估计。另外,带... 噪声情况下的语音识别是个挑战性的问题。目前的处理方法普遍需要估计噪声或者信噪比,从而其性能依赖于噪声估计的好坏。本文提出了一种基于语音信号局部能量的可靠性加权方法,该方法着眼于语音本身的结构,避免了对噪声的估计。另外,带噪语音识别的实验结果证明该方法能很好的提高识别系统的抗噪声性能。 展开更多
关键词 语音识别系统 噪声语音识别方法 可靠性加权 局部能量 局部信噪比
下载PDF
基于卷积盲源分离的噪声鲁棒性语音识别的研究 被引量:3
4
作者 王振力 刘志华 白志强 《声学技术》 CSCD 2009年第3期276-279,共4页
研究了一种基于卷积盲分离算法与MFCC(Mel-Frequency Cepstral Coefficient)特征相结合的噪声鲁棒语音识别方法。该方法在预处理阶段,首先计算预白化观测数据的多阶自相关协方差矩阵,以获得多时延处理的二阶解相关统计信息。然后利用得... 研究了一种基于卷积盲分离算法与MFCC(Mel-Frequency Cepstral Coefficient)特征相结合的噪声鲁棒语音识别方法。该方法在预处理阶段,首先计算预白化观测数据的多阶自相关协方差矩阵,以获得多时延处理的二阶解相关统计信息。然后利用得到的二阶统计信息构建两个对称正定矩阵,通过Cholesky因式分解等一系列变换获得唯一存在的矩阵,根据此矩阵估算语音信号并提取MFCC特征用于后续识别。实验结果表明,在低信噪比条件下,该方法对于数字语音的识别性能优于基本的MFCC识别器和文献中已有的卷积分离算法。 展开更多
关键词 噪声鲁棒语音识别 盲信号分离 MFCC 解相关
下载PDF
基于FSS与PLP的噪声鲁棒语音识别 被引量:4
5
作者 王振力 白志强 朱江 《南京邮电大学学报(自然科学版)》 EI 2008年第4期12-15,21,共5页
提出了一种基于分数阶谱相减(FSS)与感知线性预测(PLP)相结合的噪声鲁棒语音识别方法,记为FSS+PLPC。该方法首先通过FSS在分数阶Fourier域对带噪语音进行降噪处理,然后计算增强语音的均方误差和Itakura距离并进行比较,以获得FSS的近似... 提出了一种基于分数阶谱相减(FSS)与感知线性预测(PLP)相结合的噪声鲁棒语音识别方法,记为FSS+PLPC。该方法首先通过FSS在分数阶Fourier域对带噪语音进行降噪处理,然后计算增强语音的均方误差和Itakura距离并进行比较,以获得FSS的近似最优分数阶阶数。最后对根据此阶数得到的增强语音提取感知线性预测倒谱(PLPC)。实验结果表明,FSS+PLPC对于数字语音的识别性能优于传统的谱减法(SS+PLPC)和感知线性预测倒谱(PLPC)法,并且随着信噪比的降低FSS+PLPC表现出较好的噪声鲁棒性。 展开更多
关键词 噪声鲁棒语音识别 语音增强 谱减法 分数阶FOURIER变换 感知线性预测
下载PDF
一种基于噪声对消与倒谱均值相减的鲁棒语音识别方法 被引量:3
6
作者 王振力 裴凌波 于元斌 《智能系统学报》 2008年第6期552-556,共5页
提出一种基于语音增强算法的噪声鲁棒语音识别方法.在语音识别预处理阶段,通过噪声对消语音增强法来抑制噪声提高信噪比.然后对增强语音提取Mel频段倒谱特征参数,并在倒谱域应用倒谱均值相减处理来补偿增强语音中的失真成分和剩余噪声.... 提出一种基于语音增强算法的噪声鲁棒语音识别方法.在语音识别预处理阶段,通过噪声对消语音增强法来抑制噪声提高信噪比.然后对增强语音提取Mel频段倒谱特征参数,并在倒谱域应用倒谱均值相减处理来补偿增强语音中的失真成分和剩余噪声.实验结果表明,在低信噪比(-12~0 dB)条件下,该方法对于数字语音识别具有较好的识别率,其性能明显优于基本的Mel频段倒谱参数识别器、传统的谱减法和噪声对消语音增强法. 展开更多
关键词 自适应噪声对消 语音增强 谱减法 噪声鲁棒语音识别 倒谱均值相减法
下载PDF
一种基于噪声模型的语音/噪声分类方法
7
作者 吴边 任晓林 +1 位作者 刘重庆 张亚昕 《上海交通大学学报》 EI CAS CSCD 北大核心 2004年第9期1528-1531,共4页
提出了一种可用于嵌入式ASR系统的语音/噪声分类的新方法,该方法利用一个噪声模型,对每帧信号的评价值进行语音/噪声分类.实验表明,该方法可以有效地区分语音和噪声,并表现出在各种噪声环境和不同信噪比条件下的鲁棒性.该算法已经集成... 提出了一种可用于嵌入式ASR系统的语音/噪声分类的新方法,该方法利用一个噪声模型,对每帧信号的评价值进行语音/噪声分类.实验表明,该方法可以有效地区分语音和噪声,并表现出在各种噪声环境和不同信噪比条件下的鲁棒性.该算法已经集成进一个ASR系统,并在Com-paqiPAQ上进行了测试,其计算代价不到整个系统代价的10%. 展开更多
关键词 语音识别 语音/噪声分类 噪声鲁棒性
下载PDF
基于LabVIEW的语音噪声数字滤波器的设计 被引量:3
8
作者 王恺 吕英俊 亓学广 《工矿自动化》 2011年第8期26-28,共3页
针对传统的数字滤波器所采用的编程方法存在编写代码复杂、可移植性差等问题,提出了一种基于LabVIEW的语音噪声数字滤波器的设计方案。该滤波器采用图形化编程语言LabVIEW 8.6实现语音信号的滤波、实时测量与保存、报警等功能,与传统的... 针对传统的数字滤波器所采用的编程方法存在编写代码复杂、可移植性差等问题,提出了一种基于LabVIEW的语音噪声数字滤波器的设计方案。该滤波器采用图形化编程语言LabVIEW 8.6实现语音信号的滤波、实时测量与保存、报警等功能,与传统的滤波器相比,具有开发经费节省、开发过程简单、扩展功能方便和操作使用便易等优点。 展开更多
关键词 数字滤波器 语音噪声滤波 虚拟仪器 LABVIEW
下载PDF
一种基于小波变换的语音噪声消除算法 被引量:2
9
作者 夏志达 苏凯 宋凯 《无线通信技术》 2012年第1期22-25,共4页
接收机上接收到的信号容易被广播电台的语音噪声所干扰。而且随着广播电台的繁荣发展,语音干扰的能量越来越大,易造成误码从而严重影响信号的传输速度和质量。由于语音噪声的非平稳性,传统的消噪方法难以取得较好的效果。本文提出一种... 接收机上接收到的信号容易被广播电台的语音噪声所干扰。而且随着广播电台的繁荣发展,语音干扰的能量越来越大,易造成误码从而严重影响信号的传输速度和质量。由于语音噪声的非平稳性,传统的消噪方法难以取得较好的效果。本文提出一种基于小波变换的语音噪声消除算法,对短波信道上的实际接收到的BPSK信号进行消噪处理。接收信号上的加性语音噪声被大幅度削减,系统的误码率性能得到很大提升,验证了算法具有良好的消噪能力。 展开更多
关键词 语音噪声 非平稳性 消噪 小波变换
下载PDF
噪声环境下语音增强的算法分析与研究
10
作者 程嫚嫚 顾明亮 张浩 《信息化研究》 2015年第1期29-34,共6页
文章首先在谱减法的基础上提出了一种改进的加权幅度谱估计多带谱减法,改进的算法能够更好地抑制"音乐噪声",减少了语音谱的波动并提高了语音质量;其次从噪声类型、信噪比大小等方面分析比较改进的加权幅度谱估计多带谱减法(M... 文章首先在谱减法的基础上提出了一种改进的加权幅度谱估计多带谱减法,改进的算法能够更好地抑制"音乐噪声",减少了语音谱的波动并提高了语音质量;其次从噪声类型、信噪比大小等方面分析比较改进的加权幅度谱估计多带谱减法(Mband)、最小均方误差对数幅度谱估计(MMSELSA)、维纳滤波法(Wiener)和最小值控制的递归平均算法(MCRA)4种语音增强效果。实验结果表明:在处理类语音噪声且在低信噪比环境下,有效性由高到低依次为:Mband、MMSE-LSA、Wiener、MCRA;在高信噪比条件下,MMSE-LSA增强效果较好。在处理低频带噪声时,有效性由高到低依次为:MMSE-LSA、Wiener、Mband、MCRA。MCRA对噪声的能量大小非常敏感,因此在处理非平稳噪声时增强效果相对较差。 展开更多
关键词 语音增强 语音噪声 低频带噪声 信噪比
下载PDF
基于可变窗短时互相关特性的语音信号处理 被引量:1
11
作者 王继祥 《仪器仪表学报》 EI CAS CSCD 北大核心 2006年第z2期1381-1383,共3页
将语音信号分为有音与无音段是语音信号处理的基础,但是常用的分段方法已无法将强噪声语音信号进行有效的分段,这对强噪声语音信号的进一步处理带来了困难,在基于输入输出信号的前提下,提出了利用短时互相关技术,通过合理的选择可变短... 将语音信号分为有音与无音段是语音信号处理的基础,但是常用的分段方法已无法将强噪声语音信号进行有效的分段,这对强噪声语音信号的进一步处理带来了困难,在基于输入输出信号的前提下,提出了利用短时互相关技术,通过合理的选择可变短时互相关的窗长度,将强噪声语音信号进行了分段处理。仿真实验结果表明此方法可行有效。 展开更多
关键词 噪声语音信号 可变窗 短时互相关
下载PDF
麦克风自适应算法在鲁棒语音合成中的应用研究 被引量:1
12
作者 李娜 李琳琳 王永远 《中国科技信息》 2013年第11期127-127,130,共2页
随着语音合成技术的迅速发展,如何利用网络上易获取的语音代替高成本的纯净语料库,成为了当下降低语音合成成本的关键问题。然而这些网络语音极有可能包含由未知麦克风变化所带来的噪声或者波动情况。为了解决这个问题,本文针对网络语... 随着语音合成技术的迅速发展,如何利用网络上易获取的语音代替高成本的纯净语料库,成为了当下降低语音合成成本的关键问题。然而这些网络语音极有可能包含由未知麦克风变化所带来的噪声或者波动情况。为了解决这个问题,本文针对网络语音麦克风因素多变性所引起的噪声情况进行了分析,并且比较了三种麦克风自适应方法对于降低麦克风噪声因素对合成语音的效果。实验结果表明,对含噪声语音库进行麦克风自适应处理后,其合成语音的自然度有了明显提升。 展开更多
关键词 鲁棒语音合成 噪声语音 麦克风因素 麦克风自适应算法
下载PDF
采用小波变换的均方值滤波和门限值编码的语音端点检测 被引量:1
13
作者 张杰 谢明 吴晓红 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2007年第2期324-328,共5页
语音通信中语音-噪声分离是一项艰巨而热门的研究课题.其中语音端点检测是最流行的方法之一.目前一种方法是检测短时平均幅度Mn和短时平均过门限率Zn.该方法的Mn和Zn参数检测不太准确.另一种是基于分形理论的检测方法.此方法要设置一个... 语音通信中语音-噪声分离是一项艰巨而热门的研究课题.其中语音端点检测是最流行的方法之一.目前一种方法是检测短时平均幅度Mn和短时平均过门限率Zn.该方法的Mn和Zn参数检测不太准确.另一种是基于分形理论的检测方法.此方法要设置一个较佳的门限值通常比较困难.还有一种是基于DWT变换的方法.这种方法的互相关系数包络不能准确地表现原始语音信号的包络.为此,本文提出一种基于小波变换的均方值滤波和门限值编码的方法.本方法先对语音信号进行小尺度小波变换,然后进行均方值滤波,再进行门限值编码去确定语音端点.该方法的优点是语音端点检测比较准确. 展开更多
关键词 语音通信 语音-噪声分离 语音端点检测 小波变换 均方值滤波 门限编码
下载PDF
适用于Chirp信号的语音消噪改进算法
14
作者 马立新 侯楚林 《计算机工程与应用》 CSCD 2014年第1期203-205,226,共4页
采用Chirp信号为载波与各种数字调制方式相结合的Chirp调制信号作为一种数传工具,具有很强的可靠性和鲁棒性。然而接收机上的Chirp接收信号常常伴有周边广播电台发射出的语音噪声干扰。随着广播电台的发展,语音噪声的能量有逐渐变强的趋... 采用Chirp信号为载波与各种数字调制方式相结合的Chirp调制信号作为一种数传工具,具有很强的可靠性和鲁棒性。然而接收机上的Chirp接收信号常常伴有周边广播电台发射出的语音噪声干扰。随着广播电台的发展,语音噪声的能量有逐渐变强的趋势,严重影响Chirp信号传输的可靠性和有效性。由于语音噪声的非平稳性,传统的消噪方法难以取得较好的效果。提出一种适用于Chirp信号的语音消噪算法,对短波接收机上的Chirp-BPSK信号进行消噪处理。接收信号上的加性语音噪声被大幅度削减,系统的误码率性能得到很大提升,验证了该消噪算法的有效性。 展开更多
关键词 CHIRP信号 语音噪声 非平稳性 线性预测 消噪
下载PDF
Head Fusion:一种提高语音情绪识别的准确性和鲁棒性的方法
15
作者 徐鸣珂 张帆 《计算机科学》 CSCD 北大核心 2022年第7期132-141,共10页
语音情绪识别指使用机器从说话人的语音中识别说话人的情绪。语音情绪识别是人机交互的重要环节,但是目前的研究中仍然存在很多问题,例如,缺乏高质量的数据、模型准确性不足、在嘈杂的环境下进行的研究很少等。文中提出了一种基于多头... 语音情绪识别指使用机器从说话人的语音中识别说话人的情绪。语音情绪识别是人机交互的重要环节,但是目前的研究中仍然存在很多问题,例如,缺乏高质量的数据、模型准确性不足、在嘈杂的环境下进行的研究很少等。文中提出了一种基于多头注意力机制的Head Fusion方法,提高了语音情绪识别在相应数据集上的准确性。文中还实现了一个基于注意力的卷积神经网络模型,并在IEMOCAP数据集上进行了实验。语音情绪识别在该数据集上的准确度提高到76.18%(Weighted Accuracy,WA)和76.36%(Unweighted Accuracy,UA)。根据调研,该结果与该数据集上的最新结果(76.4%的WA和70.1%的UA)相比,在保持WA的同时提高了约6%的UA。此外,还使用了混入50种常见噪声的语音数据进行了实验,通过改变噪声强度、对噪声进行时域平移、混合不同的噪声类型,以识别它们对语音情绪识别(Speech Emotion Recognition)准确度的不同影响并验证模型的鲁棒性。文中还将帮助研究人员和工程师通过使用带有适当类型噪声的语音数据来增加其训练数据,从而缓解语音情绪识别研究中高质量数据不足的问题。 展开更多
关键词 语音情绪识别 注意力机制 卷积神经网络 噪声语音 语音识别
下载PDF
改进的减谱法在语音增强中的应用
16
作者 黄亚娟 郑林 《计算机与现代化》 2011年第10期31-33,36,共4页
为消除语音信号中噪声,改善语音质量,本文提出一种改进的减谱法。首先根据每帧的功率谱动态调整谱减系数,然后通过维纳滤波法把各种噪声变换为类似白噪声的噪声,最后用原减谱法把该噪声去除。实验证明,该方法有较好的去噪效果。
关键词 语音噪声 信噪比 语音增强 减谱法 维纳滤波
下载PDF
基于幅度压缩滤波的清浊音分类及基音估计 被引量:4
17
作者 徐静云 赵晓群 +1 位作者 王峤 王缔罡 《电子与信息学报》 EI CSCD 北大核心 2016年第3期586-593,共8页
该文针对传统算法在实环境(不同噪声类型和信噪比)下容易发生清浊误判和基音估计错误问题,提出一种基于幅度压缩基音估计滤波(PEFAC)的清浊音分类及基音估计方法。首先,通过PEFAC削弱语音的低频噪声,提取出基音谐波;然后,采用基于对称... 该文针对传统算法在实环境(不同噪声类型和信噪比)下容易发生清浊误判和基音估计错误问题,提出一种基于幅度压缩基音估计滤波(PEFAC)的清浊音分类及基音估计方法。首先,通过PEFAC削弱语音的低频噪声,提取出基音谐波;然后,采用基于对称平均幅度和函数的脉冲序列加权算法(SIM)确定谐波数目;最后,利用动态规划估计出基音,用基于3元素特征矢量的高斯混合模型对清浊音进行分类。仿真结果表明,在实环境下,所提方法能有效抑制清浊误判及基音估计错误现象的发生,性能优于传统方法。 展开更多
关键词 语音信号处理 基音 幅度压缩基音估计滤波 对称平均幅度和函数 高斯混合模型 噪声语音
下载PDF
基于小波变换的列车广播声压自适应调整算法 被引量:1
18
作者 张健 邓志勇 《电声技术》 2012年第5期85-88,92,共5页
随着社会交通水平的日益提高,对列车广播质量与稳定性要求也越来越高。列车噪声包括列车的振动噪声与乘客的语音噪声,由于乘客语音噪声特性与广播本身类似,因此在该噪声背景下采用传统信号处理方法进行去噪遇到很大困难。采用改进的自... 随着社会交通水平的日益提高,对列车广播质量与稳定性要求也越来越高。列车噪声包括列车的振动噪声与乘客的语音噪声,由于乘客语音噪声特性与广播本身类似,因此在该噪声背景下采用传统信号处理方法进行去噪遇到很大困难。采用改进的自适应小波滤波器,对列车广播时的实际环境所采集的信号进行小波分解与重构,然后用一个以人耳主观舒适度为基础的SVM声功率参考模型,再通过前一时刻的广播、噪声声压级来修正当前时刻的广播声压级,在列车环境下达到了良好的语音去噪效果。 展开更多
关键词 小波变换 列车广播 语音噪声 自适应
下载PDF
Whisper intelligibility enhancement based on noise robust feature and SVM 被引量:2
19
作者 周健 赵力 +1 位作者 梁瑞宇 方贤勇 《Journal of Southeast University(English Edition)》 EI CAS 2012年第3期261-265,共5页
A machine learning based speech enhancement method is proposed to improve the intelligibility of whispered speech. A binary mask estimated by a two-class support vector machine (SVM) classifier is used to synthesize... A machine learning based speech enhancement method is proposed to improve the intelligibility of whispered speech. A binary mask estimated by a two-class support vector machine (SVM) classifier is used to synthesize the enhanced whisper. A novel noise robust feature called Gammatone feature cosine coefficients (GFCCs) extracted by an auditory periphery model is derived and used for the binary mask estimation. The intelligibility performance of the proposed method is evaluated and compared with the traditional speech enhancement methods. Objective and subjective evaluation results indicate that the proposed method can effectively improve the intelligibility of whispered speech which is contaminated by noise. Compared with the power subtract algorithm and the log-MMSE algorithm, both of which do not improve the intelligibility in lower signal-to-noise ratio (SNR) environments, the proposed method has good performance in improving the intelligibility of noisy whisper. Additionally, the intelligibility of the enhanced whispered speech using the proposed method also outperforms that of the corresponding unprocessed noisy whispered speech. 展开更多
关键词 whispered speech intelligibility enhancement noise robust feature machine learning
下载PDF
SPEECH ENHANCEMENT METHOD FOR LPC AUTOREGRESSIVE MODEL AND SYSTEM IMPLEMENTATION OF COMMAND WORD RECOGNITION USED IN NOISY ENVIRONMENT
20
作者 王承发 吕成国 +1 位作者 孙立新 李俊庆 《Transactions of Nanjing University of Aeronautics and Astronautics》 EI 1998年第2期113-120,共8页
At present, almost all the systems and products for speech recognition are working in quiet environment and their performances are degraded or even can′t work when they are operated in high noisy environment. In this... At present, almost all the systems and products for speech recognition are working in quiet environment and their performances are degraded or even can′t work when they are operated in high noisy environment. In this paper, after analyzing the features of speech and noise, a speech enhancement method for LPC autoregressive model for command words recognition used in noisy environment is proposed, and an experimental system is realized. In different background noisy environments, we conduct experiments about SNR, basic accuracy, noise resistant ability and system environment adaptability with different microphones. The experimental results show that the system has good recognition performance in high noisy environments. The system can resist many kinds of noises and meet the needs of application areas on the whole such as military, traffic, marketplace and factory etc. 展开更多
关键词 speech recognition noisy environment Wiener filter
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部