期刊文献+
共找到175篇文章
< 1 2 9 >
每页显示 20 50 100
Hybrid In-Vehicle Background Noise Reduction for Robust Speech Recognition:The Possibilities of Next Generation 5G Data Networks
1
作者 Radek Martinek Jan Baros +2 位作者 Rene Jaros Lukas Danys Jan Nedoma 《Computers, Materials & Continua》 SCIE EI 2022年第6期4659-4676,共18页
This pilot study focuses on employment of hybrid LMS-ICA system for in-vehicle background noise reduction.Modern vehicles are nowadays increasingly supporting voice commands,which are one of the pillars of autonomous ... This pilot study focuses on employment of hybrid LMS-ICA system for in-vehicle background noise reduction.Modern vehicles are nowadays increasingly supporting voice commands,which are one of the pillars of autonomous and SMART vehicles.Robust speaker recognition for context-aware in-vehicle applications is limited to a certain extent by in-vehicle back-ground noise.This article presents the new concept of a hybrid system which is implemented as a virtual instrument.The highly modular concept of the virtual car used in combination with real recordings of various driving scenarios enables effective testing of the investigated methods of in-vehicle background noise reduction.The study also presents a unique concept of an adaptive system using intelligent clusters of distributed next generation 5G data networks,which allows the exchange of interference information and/or optimal hybrid algorithm settings between individual vehicles.On average,the unfiltered voice commands were successfully recognized in 29.34%of all scenarios,while the LMS reached up to 71.81%,and LMS-ICA hybrid improved the performance further to 73.03%. 展开更多
关键词 5G noise reduction hybrid algorithms speech recognition 5G data networks in-vehicle background noise
下载PDF
Speech Signal Recovery Based on Source Separation and Noise Suppression
2
作者 Zhe Wang Haijian Zhang Guoan Bi 《Journal of Computer and Communications》 2014年第9期112-120,共9页
In this paper, a speech signal recovery algorithm is presented for a personalized voice command automatic recognition system in vehicle and restaurant environments. This novel algorithm is able to separate a mixed spe... In this paper, a speech signal recovery algorithm is presented for a personalized voice command automatic recognition system in vehicle and restaurant environments. This novel algorithm is able to separate a mixed speech source from multiple speakers, detect presence/absence of speakers by tracking the higher magnitude portion of speech power spectrum and adaptively suppress noises. An automatic speech recognition (ASR) process to deal with the multi-speaker task is designed and implemented. Evaluation tests have been carried out by using the speech da- tabase NOIZEUS and the experimental results show that the proposed algorithm achieves impressive performance improvements. 展开更多
关键词 speech RECOVERY TIME-FREQUENCY Source SEPARATION Adaptive noise SUPPRESSION Automatic speech recognition
下载PDF
Research on Interactive English Speech Recognition Algorithm in Multimedia Cooperative Teaching
3
作者 SUI Peng 《International English Education Research》 2018年第1期79-82,共4页
Multi-media overcomes the defects of traditional teaching means so foreign language teaching rapidly develops with such technology. It becomes a bottleneck to restrict intelligence learning software development. To so... Multi-media overcomes the defects of traditional teaching means so foreign language teaching rapidly develops with such technology. It becomes a bottleneck to restrict intelligence learning software development. To solve the problem, this paper discuss basic knowledge in speech recognition and studies targeted corpus according to English pronunciation habit of Chinese people. Integrated with oral English learners' requirements with Chinese as native language, this paper applies DTW model-based speech recognition technology for Viterbi decoding speech, then it recognizes and scores through posterior probability. After experiment verification, English pronunciation recognition model in this paper is verified to be reasonable and credible and it can offer learners' timely, accurate and objective evaluation and feedback direction to correct pronunciation errors to improve oral English learning efficiency. 展开更多
关键词 speech recognition TEACHING DTW noise
下载PDF
Sudden Noise Reduction Based on GMM with Noise Power Estimation
4
作者 Nobuyuki Miyake Tetsuya Takiguchi Yasuo Ariki 《Journal of Software Engineering and Applications》 2010年第4期341-346,共6页
This paper describes a method for reducing sudden noise using noise detection and classification methods, and noise power estimation. Sudden noise detection and classification have been dealt with in our previous stud... This paper describes a method for reducing sudden noise using noise detection and classification methods, and noise power estimation. Sudden noise detection and classification have been dealt with in our previous study. In this paper, GMM-based noise reduction is performed using the detection and classification results. As a result of classification, we can determine the kind of noise we are dealing with, but the power is unknown. In this paper, this problem is solved by combining an estimation of noise power with the noise reduction method. In our experiments, the proposed method achieved good performance for recognition of utterances overlapped by sudden noises. 展开更多
关键词 SUDDEN noise MODEL-BASED noise REDUCTION speech recognition
下载PDF
中文版hearWHO应用程序在听力筛查中的验证
5
作者 李静 米玛玉珍 +1 位作者 古鑫 傅新星 《中国耳鼻咽喉头颈外科》 CSCD 2024年第6期364-368,共5页
目的验证中文版hearWHO应用程序,一款噪声下数字言语测试工具,在听力筛查中的有效性。方法招募听力正常者12名,听力损失患者92例。所有受试者依次完成纯音听阈测试、声导抗测试以及中文版hearWHO测试。分析双耳PTA0.5~4kHz和hearWHO得... 目的验证中文版hearWHO应用程序,一款噪声下数字言语测试工具,在听力筛查中的有效性。方法招募听力正常者12名,听力损失患者92例。所有受试者依次完成纯音听阈测试、声导抗测试以及中文版hearWHO测试。分析双耳PTA0.5~4kHz和hearWHO得分的相关性,采用受试者工作特性曲线及曲线下面积等参数,确定hearWHO得分在最佳诊断截点下的灵敏度和特异度。结果hearWHO得分与较好耳和较差耳纯音听阈均值PTA0.5~4kHz均呈显著负相关性,相关系数分别为-0.552和-0.693(P<0.001)。按PTA0.5~4kHz≥20dBHL为存在听力损失的标准,当hearWHO得分≤60时,提示至少单耳出现听力下降,灵敏度和特异度分别为0.733、0.690;当hearWHO得分≤50时,提示受试者可能存在双耳听力下降,灵敏度和特异度分别为0.815、0.917。结论hearWHO对检出单耳或双耳听力损失的灵敏度和特异度均较高,当hearWHO得分≤60时,提示受试者有必要转诊进行进一步的听力检测及诊断。 展开更多
关键词 噪声 言语识别测验 信噪比 噪声下数字言语测试 言语识别阈 听力筛查
下载PDF
噪声暴露者的噪声下信噪比损失与耳蜗电图的关系研究
6
作者 黄渝涵 赵乌兰 +1 位作者 邱伟 徐飞 《听力学及言语疾病杂志》 CAS CSCD 北大核心 2024年第5期409-412,共4页
目的探究噪声暴露者的噪声下信噪比损失(SNR loss)与耳蜗电图的关系及其对隐性听力损失的辅助诊断价值。方法选取有噪声暴露史的工人41例(41耳),分别进行纯音测听、声导抗、噪声下的言语识别以及耳蜗电图测试,依据噪声下言语识别能力分... 目的探究噪声暴露者的噪声下信噪比损失(SNR loss)与耳蜗电图的关系及其对隐性听力损失的辅助诊断价值。方法选取有噪声暴露史的工人41例(41耳),分别进行纯音测听、声导抗、噪声下的言语识别以及耳蜗电图测试,依据噪声下言语识别能力分为两组,A组:SNR loss<0(19耳),B组:SNR loss≥0(22耳),分析两组耳蜗电图的差异。结果噪声下言语识别测试结果显示,A、B两组受试者的信噪比损失差异有统计学意义(P<0.05);耳蜗电图结果显示,在96、90、80 dB nHL三个刺激强度下A组AP振幅大于B组,差异有统计学意义(P<0.05);在96、90、80、70、60 dB nHL五个刺激强度下B组SP振幅大于A组,差异有显著统计学意义(P<0.001);在96、90、80、70 dB nHL四个刺激强度下,B组SP/AP振幅比大于A组,差异有统计学意义(P<0.05)。结论信噪比损失<0与≥0的噪声暴露者耳蜗电图SP/AP振幅比在不同声强下有显著差异。 展开更多
关键词 噪声暴露 噪声下的言语识别 耳蜗电图 隐性听力损失
下载PDF
基于噪声破坏和波形重建的声纹对抗样本防御方法
7
作者 魏春雨 孙蒙 +2 位作者 张雄伟 邹霞 印杰 《信息安全学报》 CSCD 2024年第1期71-83,共13页
语音是人类最重要的交流方式之一。语音信号中除了文本内容外,还包含了说话人的身份、种族、年龄、性别和情感等丰富的信息,其中说话人身份的识别也被称为声纹识别,是一种生物特征识别技术。声纹具有获取方便、容易保存、使用简单等特点... 语音是人类最重要的交流方式之一。语音信号中除了文本内容外,还包含了说话人的身份、种族、年龄、性别和情感等丰富的信息,其中说话人身份的识别也被称为声纹识别,是一种生物特征识别技术。声纹具有获取方便、容易保存、使用简单等特点,而深度学习技术的进步也极大地促进了识别准确率的提升,因此,声纹识别已被应用于智慧金融、智能家居、语音助手和司法调查等领域。另一方面,针对深度学习模型的对抗样本攻击受到了广泛关注,在输入信号中添加不可感知的微小扰动即可导致模型预测结果错误。对抗样本的出现对基于深度学习的声纹识别也将造成巨大的安全威胁。现有声纹对抗样本防御方法会不同程度地影响正常样本的识别,并且局限于特定的攻击方法或识别模型,鲁棒性较差。为了使对抗防御能够兼顾纠正错误输出和准确识别正常样本两个方面,本文提出一种“破坏+重建”的两阶段对抗样本防御方法。第一阶段,在对抗样本中添加具有一定信噪比幅度限制的高斯白噪声,破坏对抗扰动的结构进而消除样本的对抗性。第二阶段,利用提出的名为SCAT-Wave-U-Net的语音增强模型重建原始语音样本,通过在Wave-U-Net模型结构中引入Transformer全局多头自注意力和层间交叉注意力机制,使改进后的模型更有助于防御声纹对抗样本攻击。实验表明,提出的防御方法不依赖于特定声纹识别系统和对抗样本攻击方式,在两种典型的声纹识别系统下对多种类型对抗样本攻击的防御效果均优于其他预处理防御方法。 展开更多
关键词 声纹识别 噪声破坏 语音增强 对抗样本防御
下载PDF
基于语音识别的机械零件自动分类回收系统的研究
8
作者 于洪波 邵娟 《电声技术》 2024年第2期36-38,共3页
针对传统机械零件自动分类回收系统因复杂噪声环境导致语音识别准确性不高的问题,文章提出一种混合语音降噪算法,利用谱减法、维纳滤波与小波阈值降噪对语音进行多级降噪处理。搭建实验环境对改进后的方式进行验证,实验结果表明改进后... 针对传统机械零件自动分类回收系统因复杂噪声环境导致语音识别准确性不高的问题,文章提出一种混合语音降噪算法,利用谱减法、维纳滤波与小波阈值降噪对语音进行多级降噪处理。搭建实验环境对改进后的方式进行验证,实验结果表明改进后的方式能够有效改善系统语音识别的准确性,提升系统分拣效率。 展开更多
关键词 机械零件 自动分类 语音识别 语音降噪
下载PDF
基于生成对抗网络数据增强的抗噪语音识别系统
9
作者 冯天宇 朱永华 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期476-490,共15页
语音识别的研究始终存在数据集具有局限性的问题.通过数据增强可以提升训练数据的规模以及多样性,从而提升识别的准确率.提出了一种基于生成对抗网络(generative adversarial network,GAN)的语音数据生成方法,以改善噪声条件下的语音识... 语音识别的研究始终存在数据集具有局限性的问题.通过数据增强可以提升训练数据的规模以及多样性,从而提升识别的准确率.提出了一种基于生成对抗网络(generative adversarial network,GAN)的语音数据生成方法,以改善噪声条件下的语音识别.首先,使用基础的GAN结构,逐帧生成基于光谱特征水平的语音样本;之后,针对缺乏真实标签用于训练的问题,又提出了一种利用非转录数据进行声学建模的无监督学习框架,并利用条件GAN结构探讨2种条件:每个语音帧的声学状态和与数据集中语音对应的原始干净语音.整合了条件信息的条件GAN可以直接提供真实标签用于声学建模.该方法在2个噪声任务(Aurora-4和AMI会议转录任务)上进行了评估.研究结果表明,在各种噪声条件(加性噪声、信道失真和混响)下,该方法都能显著提升性能.GAN生成的增强数据在先进的非常深度卷积神经网络(very deep convolutional network,VDCNN)声学模型上,可以降低6%14%的字错误率(worderrorrate,WER). 展开更多
关键词 生成对抗网络 声学模型 数据增强 噪声 语音识别
下载PDF
耳蜗死区对不同信噪比条件下轻、中度感音神经性听力损失患者言语识别的影响
10
作者 孟超 郭倩倩 +1 位作者 吕静 陈雪清 《听力学及言语疾病杂志》 CAS CSCD 北大核心 2024年第3期228-231,共4页
目的初步探究安静及不同信噪比条件下,有、无耳蜗死区的轻、中度感音神经性听力损失患者的言语识别变化规律,以及不同测试条件下两组患者的言语识别差异。方法通过纯音测听选出符合纳入标准的轻、中度感音神经性听力损失患者44耳,采用... 目的初步探究安静及不同信噪比条件下,有、无耳蜗死区的轻、中度感音神经性听力损失患者的言语识别变化规律,以及不同测试条件下两组患者的言语识别差异。方法通过纯音测听选出符合纳入标准的轻、中度感音神经性听力损失患者44耳,采用均衡噪声阈(threshold equalizing noise,TEN)测试将患者分为非耳蜗死区组24耳和耳蜗死区组20耳。选取汉语(普通话)测听词汇表(Mandarin speech test materials,MSTMs)中单音节词言语测听词表,对两组患者在安静环境和言语谱噪声环境(SNR=6、3、0、-3 dB)下进行言语识别率测试。结果耳蜗死区组患者耳蜗死区1~2个,频率集中在3~4 kHz;两组患者不同测试环境下言语识别率均随信噪比降低而下降(P<0.05);耳蜗死区组患者在各测试条件下言语识别率得分较非耳蜗死区组低,且均有显著差异(P<0.05)。结论无论有无耳蜗死区,轻、中感音神经性听力损失患者的言语识别率均随着信噪比下降呈显著下降的趋势。在本研究各信噪比条件下耳蜗死区组患者的言语识别率均较非耳蜗死区组患者低,对于轻、中度感音神经性听力损失患者开展耳蜗死区测试是必要的。 展开更多
关键词 耳蜗死区 言语识别 均衡噪声阈测试 信噪比
下载PDF
语后聋双侧人工耳蜗使用者对噪声言语识别阈及音乐感知能力的研究
11
作者 高娜 闵世尧 +1 位作者 张炜徇 迟放鲁 《中国眼耳鼻喉科杂志》 2024年第1期21-25,共5页
目的了解语后聋的双侧人工耳蜗使用者(BCI)的噪声下言语识别能力及音乐感知能力。方法收集2017年1月—2021年2月收治的8例语后聋BCI、26例正常听力受试者和40例单侧极重度聋受试者,采用HOUSE耳研所研发的开放式普通话言语识别评估系统,... 目的了解语后聋的双侧人工耳蜗使用者(BCI)的噪声下言语识别能力及音乐感知能力。方法收集2017年1月—2021年2月收治的8例语后聋BCI、26例正常听力受试者和40例单侧极重度聋受试者,采用HOUSE耳研所研发的开放式普通话言语识别评估系统,评估不同听觉条件受试者的噪声言语识别阈(SRT)和音乐音符辨识能力、旋律辨识能力。结果8例语后聋BCI双耳佩戴耳蜗的噪声下SRT与单耳佩戴时的差异无统计学意义,均显著高于单侧耳聋组(P<0.01),且单侧耳聋组高于正常听力组(P<0.01)。语后聋BCI双耳佩戴时的音乐音符识别率高于单耳佩戴时,与单侧耳聋组相似。结论语后聋BCI双耳佩戴耳蜗与单耳佩戴时的噪声下言语识别能力相似,均弱于单侧耳聋者及正常听力者。语后聋BCI的音乐感知能力与其既往音乐基础有关,双耳佩戴时优于单耳佩戴时,与单侧耳聋组的音乐感知能力相似,远低于正常听觉人群。 展开更多
关键词 双侧人工耳蜗 单侧人工耳蜗 噪声 言语识别阈 音乐欣赏
下载PDF
语种识别技术在中短波广播强噪声语音音频识别中的应用
12
作者 刘琪 莫东林 《电声技术》 2024年第5期49-51,共3页
在中短波广播中,语音信号经常受到各种噪声的影响,如电磁干扰和环境噪声,增加了语音识别的难度。基于此,全面探讨语种识别技术在中短波广播强噪声环境中的应用,详细介绍特征提取技术、模型适应策略、语言特征库的构建与模型调整方法,旨... 在中短波广播中,语音信号经常受到各种噪声的影响,如电磁干扰和环境噪声,增加了语音识别的难度。基于此,全面探讨语种识别技术在中短波广播强噪声环境中的应用,详细介绍特征提取技术、模型适应策略、语言特征库的构建与模型调整方法,旨在提高中短波广播中语种识别的准确率和效率。 展开更多
关键词 语种识别技术 中短波广播 强噪声语音音频识别
下载PDF
面向数据增强的轻量化语音情感识别 被引量:3
13
作者 崔晨露 崔琳 《计算机与现代化》 2023年第4期83-89,100,共8页
利用深度学习进行语音情感识别时通常需要大量的训练数据。针对现有语音情感数据库匮乏且数据量少容易造成过拟合的缺陷,本文在预处理阶段,将原始语音通过加入高斯白噪声和对波形进行位移产生新的语音信号以实现数据增强,不仅可提高识... 利用深度学习进行语音情感识别时通常需要大量的训练数据。针对现有语音情感数据库匮乏且数据量少容易造成过拟合的缺陷,本文在预处理阶段,将原始语音通过加入高斯白噪声和对波形进行位移产生新的语音信号以实现数据增强,不仅可提高识别准确率而且可增强模型的鲁棒性。与此同时,由于普通卷积神经网络参数量过大,提出一种轻量化模型,该模型由可分离卷积与门控循环单元构成。首先,从原始语音中提取MFCC特征作为模型的输入;其次利用可分离卷积来提取语音空间信息,门控循环单元提取语音的时序信息,用时序信息和空间信息同时表征语音情感可以使预测结果更加准确;最后送入带有softmax的全连接层完成情感分类。实验结果表明,本文模型与基准模型相比不仅可以得到较高的准确率且模型可压缩约50%。 展开更多
关键词 语音情感识别 数据增强 高斯白噪声 波形位移 参数量
下载PDF
Mobile Communication Voice Enhancement Under Convolutional Neural Networks and the Internet of Things
14
作者 Jiajia Yu 《Intelligent Automation & Soft Computing》 SCIE 2023年第7期777-797,共21页
This study aims to reduce the interference of ambient noise in mobile communication,improve the accuracy and authenticity of information transmitted by sound,and guarantee the accuracy of voice information deliv-ered ... This study aims to reduce the interference of ambient noise in mobile communication,improve the accuracy and authenticity of information transmitted by sound,and guarantee the accuracy of voice information deliv-ered by mobile communication.First,the principles and techniques of speech enhancement are analyzed,and a fast lateral recursive least square method(FLRLS method)is adopted to process sound data.Then,the convolutional neural networks(CNNs)-based noise recognition CNN(NR-CNN)algorithm and speech enhancement model are proposed.Finally,related experiments are designed to verify the performance of the proposed algorithm and model.The experimental results show that the noise classification accuracy of the NR-CNN noise recognition algorithm is higher than 99.82%,and the recall rate and F1 value are also higher than 99.92.The proposed sound enhance-ment model can effectively enhance the original sound in the case of noise interference.After the CNN is incorporated,the average value of all noisy sound perception quality evaluation system values is improved by over 21%compared with that of the traditional noise reduction method.The proposed algorithm can adapt to a variety of voice environments and can simultaneously enhance and reduce noise processing on a variety of different types of voice signals,and the processing effect is better than that of traditional sound enhancement models.In addition,the sound distortion index of the proposed speech enhancement model is inferior to that of the control group,indicating that the addition of the CNN neural network is less likely to cause sound signal distortion in various sound environments and shows superior robustness.In summary,the proposed CNN-based speech enhancement model shows significant sound enhancement effects,stable performance,and strong adapt-ability.This study provides a reference and basis for research applying neural networks in speech enhancement. 展开更多
关键词 Convolutional neural networks speech enhancement noise recognition deep learning human-computer interaction Internet of Things
下载PDF
面向铁路客运站场景的语音降噪模型研究
15
作者 高志强 戴琳琳 +1 位作者 景辉 王心雨 《铁路计算机应用》 2023年第2期7-12,共6页
为进一步提升铁路客运站嘈杂环境下的语音识别效果,文章提出一种基于Conformer的语音降噪模型ConformerGAN。其训练流程类似生成对抗网络,生成器采用Conformer进行语音特征提取,对特征建模;鉴别器使用代理评估函数对语音感知进行质量评... 为进一步提升铁路客运站嘈杂环境下的语音识别效果,文章提出一种基于Conformer的语音降噪模型ConformerGAN。其训练流程类似生成对抗网络,生成器采用Conformer进行语音特征提取,对特征建模;鉴别器使用代理评估函数对语音感知进行质量评价。为增强模型的泛化能力并提高模型对未知噪声的降噪能力,在噪声的叠加上采用随机截取片段融入的方式,并构建铁路客运站场景噪声数据集。与语音降噪相关模型效果对比的结果表明,ConformerGAN模型可将客观语音质量评估(PESQ,Perceptual Evaluation of Speech Quality)分数提高0.19,有效提高铁路客运站嘈杂环境下的语音识别准确率,改善铁路旅客语音交互体验。 展开更多
关键词 铁路客运站 语音降噪 CONFORMER 生成对抗网络(GAN) 语音识别
下载PDF
普通话可接受噪声级测试材料的开发与等价性评估 被引量:21
16
作者 陈建勇 张华 +5 位作者 陈静 陈雪清 郭连生 曹文 吴燕君 李玉玲 《中国耳鼻咽喉头颈外科》 北大核心 2011年第3期136-140,共5页
目的开发普通话版可接受噪声级(acceptable noise level,ANL)测试材料。方法从小学、初中和高中语文教材中选取3篇难易程度不同的短文材料;选取31例听力言语正常人分别进行3种材料的ANL测试,获得3种材料下的最舒适响度级(most comfortab... 目的开发普通话版可接受噪声级(acceptable noise level,ANL)测试材料。方法从小学、初中和高中语文教材中选取3篇难易程度不同的短文材料;选取31例听力言语正常人分别进行3种材料的ANL测试,获得3种材料下的最舒适响度级(most comfortable loudness,MCL)、最大背景噪声级(background noise level,BNL)和ANL值。结果听力正常人群个体间ANL值存在很大差异(F=22.414,P<0.05),变化范围从-1~21dBHL不等;但3组测试材料的MCL、BNL和ANL值均无统计学差异。相关分析结果显示,3组材料间MCL与ANL的相关性依次为:《北京的春节》,r=0.532,P=0.002;《苏州园林》,r=0.474,P=0.007;《故都的秋》,r=0.530,P=0.002。结论 ANL值不受测试材料的影响,可利用不同性质的材料进行ANL测试,便于临床该项测试的开展和应用;初步选取相关性较好且较易理解的《北京的春节》作为普通话ANL正式测试材料,用于助听器选配和人工耳蜗植入效果的评估。 展开更多
关键词 语言试验 言语识别测试 可接受噪声级 最舒适响度级 最大背景噪声级 短文材料
下载PDF
复杂噪声环境中的语音端点检测 被引量:17
17
作者 国雁萌 付强 颜永红 《声学学报》 EI CSCD 北大核心 2006年第6期549-554,共6页
提出了一种适用于复杂加性噪声环境的语音端点检测方法。通过对噪声类型的归纳,建立自适应的平稳噪声模型,并根据模型搜索信号能量非平稳的区域。然后基于浊音在频域上的谐波结构,在此区域内检测浊音,从而排除非平稳噪声的干扰。最后根... 提出了一种适用于复杂加性噪声环境的语音端点检测方法。通过对噪声类型的归纳,建立自适应的平稳噪声模型,并根据模型搜索信号能量非平稳的区域。然后基于浊音在频域上的谐波结构,在此区域内检测浊音,从而排除非平稳噪声的干扰。最后根据信号能量精确搜索语音起止点。与目前典型端点检测算法的对比实验表明,在大多数复杂噪声环境下,该算法具有较好的准确率。 展开更多
关键词 语音端点检测 噪声环境 端点检测算法 非平稳噪声 噪声模型 信号能量 噪声类型 对比实验
下载PDF
一种语音特征提取中Mel倒谱系数的后处理算法 被引量:12
18
作者 张毅 谢延义 +1 位作者 罗元 席兵 《智能系统学报》 CSCD 北大核心 2016年第2期208-215,共8页
为提高语音识别系统的鲁棒性,本文以Mel频率倒谱系数(MFCC)为基础,结合均值消减法、方差归一化、时间序列滤波法和加权自回归移动平均滤波法,提出了一种后处理算法,本文将该算法命名为MVDA后处理法,所得语音特征参数简称MVDA。本文首先... 为提高语音识别系统的鲁棒性,本文以Mel频率倒谱系数(MFCC)为基础,结合均值消减法、方差归一化、时间序列滤波法和加权自回归移动平均滤波法,提出了一种后处理算法,本文将该算法命名为MVDA后处理法,所得语音特征参数简称MVDA。本文首先从理论上推导了MVDA后处理法可以去除加性噪声和卷积噪声的干扰,接着针对MVDA与MFCC做了对比试验,并分析了含噪语音与语音信号的欧氏距离变化,证明MVDA后处理法的每一步均有效降低了噪声的干扰,且得出了MVDA在不同噪声环境中均更优的结论。这种简洁的语音特征不仅可以达到许多复杂语音特征处理方法的效果,而且有效减少了自动语音识别系统的计算量。 展开更多
关键词 后处理 语音特征 语音识别 噪声 鲁棒性
下载PDF
嘈杂语噪声下汉语整句识别的同质性研究 被引量:19
19
作者 郗昕 赵阳 +2 位作者 冀飞 Teresa Ching 韩东一 《中华耳科学杂志》 CSCD 2008年第1期35-39,共5页
目的获得嘈杂语噪声背景下汉语短句识别率-信噪比(Performance-Intensity,P-I)函数的斜率和50%的得分所对应的信噪比(记为SNR50),并对所有短句的同质性进行评估和调整。方法采用16张(每张20句)新编嘈杂语噪声下汉语普通话短句识别表作... 目的获得嘈杂语噪声背景下汉语短句识别率-信噪比(Performance-Intensity,P-I)函数的斜率和50%的得分所对应的信噪比(记为SNR50),并对所有短句的同质性进行评估和调整。方法采用16张(每张20句)新编嘈杂语噪声下汉语普通话短句识别表作为测试材料。选取年龄为21~25岁之间、听力/言语发育正常且日常以汉语普通话为交流方式的48名受试者按"随机区组设计"在-1、-4、-7、-10dB四种信噪比条件下进行言语识别率的心理声学测量。使用Statistica7.0软件进行P-I函数拟合和统计分析。结果320句语句在嘈杂语噪声下的言语识别P-I函数曲线的阈值呈正态分布,斜率呈不规则分布。剔除P-I函数强健性增长(斜率>55%/dB)的语句,并保留阈值变异度在±2!内的语句,精选出同质性良好的240句。结论逐个调整每句的SNR以实现同质性,可为编制"等言语识别阈级"的句表奠定扎实的心理声学基础。 展开更多
关键词 言语测听 嘈杂语噪声 语句 言语识别阈 同质性
下载PDF
FCMBP聚类法在语音识别和模糊控制中的应用 被引量:12
20
作者 何清 徐树富 +1 位作者 王加银 史忠植 《系统工程学报》 CSCD 2001年第6期430-437,共8页
首先从理论上证明了 FCMBP模糊聚类方法 ,即基于摄动的模糊聚类方法 ,比传递闭包法失真小 ;其次 ,用例子说明这两种聚类方法的聚类结果并不总是相同 ,有时还会产生本质差异 ;再次 ,提出用 FCMBP模糊聚类方法设立语音模式的参考向量集来... 首先从理论上证明了 FCMBP模糊聚类方法 ,即基于摄动的模糊聚类方法 ,比传递闭包法失真小 ;其次 ,用例子说明这两种聚类方法的聚类结果并不总是相同 ,有时还会产生本质差异 ;再次 ,提出用 FCMBP模糊聚类方法设立语音模式的参考向量集来进行语音识别 ,该方法能提高语音识别的正确率 ;最后 ,利用 FCMBP模糊聚类方法滤除量测数据对中的噪声 ,再用这些处理过的数据构造模糊控制规则 ,从而达到模糊控制规则的优化 . 展开更多
关键词 模糊聚类 语音识别 模糊控制 噪声滤出 FCMBP
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部