-
题名优化正交匹配追踪和短时谱估计用于声音识别
被引量:3
- 1
-
-
作者
陈秋菊
徐建国
-
机构
茅台学院酿酒工程自动化系
国防科学技术大学系统工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2020年第7期162-169,共8页
-
基金
国家自然科学基金(No.71671186)。
-
文摘
声音事件识别时受到各种环境声的影响,采用优化正交匹配跟踪(Orthogonal Matching Pursuit,OMP)和短时谱估计对声音信号进行二次重构,能有效提高识别性能。采用粒子群算法(Particle Swarm Optimization,PSO)优化OMP稀疏分解作首次重构,保留声音信号的主体;采用短时谱估计对首次重构后的残余信号作声音增强处理,完成二次重构,去除非平稳噪声和提高重构声音信号的精度;对重构信号提取梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)特征、优化OMP时-频特征和基频(Pitch)特征,组成复合抗噪特征集OOMP;使用深度置信网络(Deep Belief Network,DBN)对OOMP特征进行学习,并对40种声音事件在不同环境不同信噪比下进行识别。实验结果表明,该方法在不同信噪比的各种环境声中平均识别率为70.44%,且在-5 dB的情况下仍然可以达到49.90%的识别率,从而说明所提方法能有效地识别各种环境下的声音事件。
-
关键词
声音事件识别
正交匹配追踪
粒子群优化
短时谱估计
深度置信网
-
Keywords
sound event recognition
Orthogonal Matching Pursuit(OMP)
Particle Swarm Optimization(PSO)
short-time spectrum estimation
Deep Belief Networks(DBN)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于短时对数谱估计MMSE的语音增强算法研究
被引量:4
- 2
-
-
作者
袁伟军
刘珩
-
机构
中国农业大学信息与电气工程学院
-
出处
《电声技术》
2007年第10期59-62,65,共5页
-
文摘
结合语音激活检测(VAD)技术对短时对数谱估计最小均方误差(LSA-MMSE)语音增强算法进行了改进。通过实验表明,LSA-MMSE增强算法在消除背景噪声、增加语音清晰度和提高语音自然度等方面比谱减法更加有效。
-
关键词
语音增强
短时谱估计
最小均方误差
-
Keywords
speech enhancement
short-time spectrum analysis
MMSE
-
分类号
TN912.35
[电子电信—通信与信息系统]
-
-
题名基于噪声短时谱动态估计的语音增强谱减算法
被引量:7
- 3
-
-
作者
李银国
薛雯
徐洋
-
机构
重庆邮电大学自动化学院
-
出处
《重庆邮电大学学报(自然科学版)》
北大核心
2010年第2期127-130,共4页
-
基金
重庆市科委重大科技攻关项目(2008AA6002)
电子信息产业化发展基金(工信部财[2008]355号)~~
-
文摘
针对谱减法增强语音后残留"音乐噪声"明显,影响语音清晰度的问题,在分析现有的噪声谱减算法基本特性的基础上,提出一种基于噪声短时谱动态估计的语音降噪方法。通过估计噪声短时功率谱及其变化趋势,动态调整谱减法中的过减系数,有效抑制残留噪声。仿真实验表明,新的谱减算法在提高语音信噪比的同时保持较小的失真度,具有较好的增强效果。
-
关键词
语音识别
语音增强算法
噪声短时谱估计
谱减法
过减系数
-
Keywords
speech recognition
speech enhancement algorithm
noise short-time spectrum estimation
spectral subtraction method
over-subtraction factor
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名飞机舱音背景声下语音增强技术
- 4
-
-
作者
雷鸣
程洪炳
李学仁
-
机构
空军
空军工程大学工程学院
空军工程大学科研部
-
出处
《振动与冲击》
EI
CSCD
北大核心
2010年第3期63-66,共4页
-
基金
总装预研基金(9140A27020308JB3201)
国家高技术研究发展计划(863计划)(2007BJ131)
-
文摘
有效提取飞机舱音背景声下的语音信息对飞行事故调查十分重要。提出一种适用于飞机座舱噪声环境下的语音增强方法。以卡方分布作为纯语音谱幅值的先验模型,采用最小均方误差短时谱估计法对带噪语音中的纯语音谱进行估计,误差估计方程中采用权值函数对估计值进行非线性加权。在仿真试验中利用语音质量的客观评价标准选取适合于舱音背景声下的纯语音谱估计参数,使增强语音中噪声抑制和语音失真之间达到平衡。最后将提出的语音增强方法与目前典型方法进行了对比实验,验证算法的有效性。
-
关键词
舱音
语音增强
最小均方误差
短时谱估计
-
Keywords
cockpit voice
speech enhancement
minimum mean-square error
short time spectral amplitude
-
分类号
O423
[理学—声学]
-
-
题名语音增强技术的对比研究
被引量:2
- 5
-
-
作者
张达敏
-
机构
贵州大学信息工程学院
-
出处
《现代机械》
2005年第6期83-84,共2页
-
基金
贵州省教育厅自然科学基金支助项目
-
文摘
语音增强技术一直是语音信号处理中的重要课题之一,语音增强的目的是从有噪声的信号中尽可能完好地恢复原始声音。目前常用的增强算法很多,本文对传统的基于短时谱估计的增强算法和近年来发展起来的基于小波变换的增强算法进行仿真实验比较研究。
-
关键词
语音增强
短时谱估计
小波变换
仿真实验
-
Keywords
speech intensified technique
short time spectrum
wavelet transform
imitate experimen
-
分类号
TN912.34
[电子电信—通信与信息系统]
TN912.3
[电子电信—通信与信息系统]
-
-
题名利用抗噪纹理特征的快速鸟鸣声识别
被引量:16
- 6
-
-
作者
魏静明
李应
-
机构
福州大学数学与计算机科学学院
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2015年第1期185-190,共6页
-
基金
国家自然科学基金(No.61075022)
-
文摘
针对非平稳噪声下的鸟鸣声识别问题,提出一种利用抗噪纹理特征的快速鸟鸣声识别方法,该方法也解决了纹理特征提取过程中灰度共生矩阵(GLCM)占用空间大,以及计算量大、耗时的问题.该方法分三个步骤,首先,通过短时谱估计算法对鸟鸣声带噪功率谱进行音频增强;然后,采用和差统计法(SDH)对增强功率谱快速提取纹理特征;最后,由随机森林进行分类.在实验部分,设计了两组对比实验,结果表明,该方法有良好的识别性能、较少的时耗,且具有噪声鲁棒性.
-
关键词
鸟鸣声识别
抗噪纹理特征
短时谱估计
和差统计法
-
Keywords
bird sound recognition
anti-noise texture features
short-time spectrum estimation
sum and difference histograms(SDH)
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于纹理特征与随机森林的生态声音识别
被引量:3
- 7
-
-
作者
魏静明
李应
-
机构
福州大学数学与计算机科学学院
-
出处
《计算机应用与软件》
CSCD
2015年第3期162-166,共5页
-
基金
国家自然科学基金项目(61075022)
-
文摘
针对真实环境中普遍存在的非平稳噪声,提出一种基于纹理特征与随机森林的生态声音识别方法。该方法首先使用一种基于噪声估计的音频增强算法,即短时谱估计对输入端声音信号进行前端处理,得到增强信号功率谱;然后根据得到的增强信号功率谱图的纹理信息,采用和差统计法对其进行纹理特征提取;最后,利用基于决策树的组合分类器,即随机森林进行识别和分类。设计了两组对比实验,结果表明该方法不仅有良好的识别性能,而且具有噪声鲁棒性。
-
关键词
生态声音识别
短时谱估计
纹理特征
和差统计法
随机森林
-
Keywords
Ecological sounds recognition Short-time spectrum estimation Texture features Sum and difference histogram(SDH) Random forest(RF
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名帧间约束MMSE语音增强算法
被引量:1
- 8
-
-
作者
田滨
曹志刚
-
机构
清华大学电子工程系
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
1995年第9期12-18,共7页
-
文摘
本文主要讨论基于语音短时谱估计的语音增强算法。在语音短时谱幅度最小均方误差估计(MMSE)的基础上,本文提出了一种基于帧间频域分布约束的改进的语音短时谱幅度MMSE估计算法。该算法充分利用了语音分析帧之间存在的相关性,并以频域分布约束的形式结合到估计式中,考虑到在MMSE估计式中需要利用语音频谱的分布,本文采取了两种解决办法:利用高斯分布模型进行近似;利用语音材料进行统计得到近似的分布模型。新算法在我们开发的一个语音增强系统中进行了实验,并与其它的算法进行了对比。结果表明该算法可以更有效地去除噪声而不对语音本身造成明显的损伤。
-
关键词
语音信号处理
语音增强
短时谱估计
噪声抑制
-
Keywords
Speech signal processing, Speech enhancement, Short time spectrum extimation, Noise suppression
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于EEG信号的STPS睡眠状态在线辨识
被引量:1
- 9
-
-
作者
周强
陈颖
李俊雨
肖强宏
-
机构
陕西科技大学电气与信息工程学院
-
出处
《陕西科技大学学报(自然科学版)》
2016年第6期164-170,共7页
-
基金
陕西省科技厅科技攻关计划项目(2016GY-005)
-
文摘
睡眠状态辨识作为控制睡眠过程中提高睡眠质量的前提,是现代生物医学研究的一个重要内容.本文针对目前睡眠状态辨识方法存在辨识准确率低及处理速度慢等问题,提出基于EEG信号的STPS的睡眠状态在线辨识.以脑电波(EEG)的时-频分析作为睡眠状态特征量,并将其输入到径向基神经网络中进行模糊融合,辨识出不同睡眠状态.人体实验表明:该方法的辨识睡眠状态的准确率达到88.89%,为实现人体睡眠状态控制奠定了一定基础.
-
关键词
睡眠状态辨识
脑电信号
短时功率谱估计
径向基神经网络
模糊融合
-
Keywords
sleep stage classification
EEG signals
STPS
RBFNN
fuzzy fusion
-
分类号
TN911.7
[电子电信—通信与信息系统]
-