期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
融合递归求逆滤波的机器人混合语音识别方法 被引量:6
1
作者 李丽亚 闫宏印 《计算机仿真》 北大核心 2020年第8期277-280,290,共5页
机器人语音识别需要满足混合噪声与非特定人等复杂场景的使用需求,现有方法难以达到全场景的准确识别。为此提出了融合递归求逆滤波的混合语音识别方法。方法根据机器人语音识别模型,分别对语音信号的预处理,特征提取,以及匹配识别三个... 机器人语音识别需要满足混合噪声与非特定人等复杂场景的使用需求,现有方法难以达到全场景的准确识别。为此提出了融合递归求逆滤波的混合语音识别方法。方法根据机器人语音识别模型,分别对语音信号的预处理,特征提取,以及匹配识别三个阶段做了相应优化。在预处理阶段,设计了递归求逆算法,用于补偿原始语音中的小特征信号,同时采用加权向量,在递推过程中增强原始语音信号。在特征提取阶段,针对卷积噪声,边缘效应,以及基音干扰,设计了多次滤波器,用以避免语音特征提取时的各种干扰。最后的匹配识别阶段,利用提取的特征训练得到模板库,通过欧氏距离递推得到相似度,并根据阈值约束完成匹配识别。仿真结果表明,融合递归求逆滤波方法显著提高了混合语音信号的识别率与抗噪性能,能够更好的满足机器人复杂场景下的应用需求。 展开更多
关键词 机器人场景 递归求逆 多次滤波 欧氏距离 混合语音识别
下载PDF
混合语音识别系统的一种新的简化神经网络结构
2
作者 邓伟 《数据采集与处理》 CSCD 2002年第1期25-28,共4页
研究适用于隐马尔可夫模型 ( HMM)结合多层感知器 ( MLP)的小词汇量混合语音识别系统的一种简化神经网络结构。利用小词汇量混合语音识别系统中的 HMM状态所形成的规则的二维阵列 ,对状态观测概率进行分解。基于这种利用 HMM的二维结构... 研究适用于隐马尔可夫模型 ( HMM)结合多层感知器 ( MLP)的小词汇量混合语音识别系统的一种简化神经网络结构。利用小词汇量混合语音识别系统中的 HMM状态所形成的规则的二维阵列 ,对状态观测概率进行分解。基于这种利用 HMM的二维结构特性的方法 ,实现了用一种由多个简单的 MLP所组成的简化神经网络结构来估计状态观测概率。理论分析和语音识别实验的结果都表明 ,这种简化神经网络结构在性能上优于 Fran-co等人提出的简化神经网络结构。 展开更多
关键词 隐马尔可夫模型 多层感知器 神经网络结构 混合语音识别系统
下载PDF
一种噪音环境下的基于特征口形的音频视频混合连续语音识别系统 被引量:1
3
作者 谢磊 I.Cravyse +5 位作者 蒋冬梅 赵荣椿 H.Sahli Werner Verhelst J Cornelis Ignace Lemahieu 《计算机工程与应用》 CSCD 北大核心 2003年第16期3-5,35,共4页
文章抓住人类语音感知多模型的特点,尝试建立一个在噪音环境下的基于音频和视频复合特征的连续语音识别系统。在视频特征提取方面,引入了一种基于特征口形的提取方法。识别实验证明,这种视频特征提取方法比传统DCT、DWT方法能够带来更... 文章抓住人类语音感知多模型的特点,尝试建立一个在噪音环境下的基于音频和视频复合特征的连续语音识别系统。在视频特征提取方面,引入了一种基于特征口形的提取方法。识别实验证明,这种视频特征提取方法比传统DCT、DWT方法能够带来更高的识别率;基于特征口形的音频-视频混合连续语音识别系统具有很好的抗噪性。 展开更多
关键词 音频-视频混合连续语音识别 主分量分析 特征口形 多数据流 HMM
下载PDF
自编码器和LSTM在混合语音情感的应用
4
作者 张卫 贾宇 张雪英 《计算机仿真》 北大核心 2022年第11期258-262,共5页
针对混合语音情感识别中,传统识别方法不能充分考虑语种之间的差异性,导致分类准确率偏低的问题,提出了自编码器(autoencoder)与长短时记忆(Long Short Term Memory,LSTM)模型相结合的方法,通过提取MFCC,MEL Spectrogram Frequency,Chr... 针对混合语音情感识别中,传统识别方法不能充分考虑语种之间的差异性,导致分类准确率偏低的问题,提出了自编码器(autoencoder)与长短时记忆(Long Short Term Memory,LSTM)模型相结合的方法,通过提取MFCC,MEL Spectrogram Frequency,Chroma三种特征获得180维特征。并利用自编码器获取一个更高维度、更深层次的500维特征,通过LSTM进行建模,提高语音情感分类的准确性。使用德语EMO-DB和中文CASIA语音库进行分类实验,研究表明,自编码器提取出的深度特征更适合混合语音情感分类。较传统分类方法,使用自编码器+LSTM进行分类,最优识别结果可提升7.5%。 展开更多
关键词 自编码器 长短时记忆 混合语音情感识别
下载PDF
面向多人语音识别的对话系统研究 被引量:2
5
作者 杨雪霁 《自动化与仪器仪表》 2023年第8期286-290,共5页
针对传统英语对话系统受环境噪声影响,出现多人混合语音分离现象,造成多人英语语音识别和对话效果降低的问题,提出一种基于深度学习的语音增强和传统阵列信号处理的多人英语语音分离系统。首先,采用基于长短时记忆网络LSTM的多目标语音... 针对传统英语对话系统受环境噪声影响,出现多人混合语音分离现象,造成多人英语语音识别和对话效果降低的问题,提出一种基于深度学习的语音增强和传统阵列信号处理的多人英语语音分离系统。首先,采用基于长短时记忆网络LSTM的多目标语音增强算法捕捉英语语音序列的长时特性;然后建立一个两阶段的单通道多人语音分离框架提取目标说话人语音;最后将提取语音与阵列算法进行融合,并通过空间信息实现目标说话人英语语音精确估计。结果表明,相较于DNN-DM模型和LSTM-IRM模型,提出的LSTM-DM模型的信噪比指标明显更高,此模型的平均PESQ由2.66提升至2.95,增益为0.074%。由此说明,LSTM-DM模型的英语语音去噪和语音增强效果更好。提出的特定说话人前端系统的英语语音对话词错误率为65.3%,对比于Officoal Beamformlt系统和CGMM3Mask Fusion模型下降了14.6%和5.1%。说明此系统可实现多人混合英语语音分离,具备一定的有效性。 展开更多
关键词 多目标 混合语音识别 英语对话系统 长短时记忆网络 语音分离
原文传递
Recognition of Speech Based on HMM/MLP Hybrid Network
6
作者 黄心晔 马小辉 +2 位作者 李想 富煜清 陆佶人 《Journal of Southeast University(English Edition)》 EI CAS 2000年第2期26-30,共5页
This paper presents a new HMM/MLP hybrid network for speech recognition. By taking advantage of the discriminative training of MLP, the unreasonable model correctness assumption on the model correctness of the ML trai... This paper presents a new HMM/MLP hybrid network for speech recognition. By taking advantage of the discriminative training of MLP, the unreasonable model correctness assumption on the model correctness of the ML training in basic HMM can be overcome, and its discriminative ability and recognition performance can be improved. Experimental results demonstrate that the discriminative ability and recognition performance of HMM/MLP is apparently better than normal HMM. 展开更多
关键词 HMM/MLP hybrid network discriminative training speech recognition
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部