期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于深度神经网络的语音识别系统研究 被引量:13
1
作者 李伟林 文剑 马文凯 《计算机科学》 CSCD 北大核心 2016年第S2期45-49,共5页
语音识别是人机交互模式识别领域的一个重要课题,构建了一种基于深度神经网络的语音识别系统,使用了抗噪对比散度法和抗噪最小平方误差法对模型进行无监督训练;使用了均值归一化进行模型优化,提高了网络对训练集的拟合度,并且降低了语... 语音识别是人机交互模式识别领域的一个重要课题,构建了一种基于深度神经网络的语音识别系统,使用了抗噪对比散度法和抗噪最小平方误差法对模型进行无监督训练;使用了均值归一化进行模型优化,提高了网络对训练集的拟合度,并且降低了语音识别的错误率;使用多状态激活函数进行了模型优化,这不仅使得不带噪测试和带噪声测试的语音识别错误率进一步下降,并能在一定程度上减轻过拟合现象;并通过奇异值分解和重构的方法对模型进行了降维。实验结果表明,此系统可以在不影响语音识别错误率的基础上极大地降低系统的复杂性。 展开更多
关键词 模式识别 深度神经网络 语音识别 马尔科夫模型 模型重构
下载PDF
基于DNN-HMM模型的语音识别的语音导航系统 被引量:4
2
作者 赵永生 徐海青 吴立刚 《新型工业化》 2017年第2期45-53,共9页
随着计算机技术和人工智能总体技术的发展,语音识别系统已成为一个越来越广泛的应用方向。基于传统声学模型的语音识别技术在语音导航系统中得到了广泛应用,但在模型的训练、识别率、鲁棒性方面存在一些缺陷。本文研究基于DNN-HMM模型... 随着计算机技术和人工智能总体技术的发展,语音识别系统已成为一个越来越广泛的应用方向。基于传统声学模型的语音识别技术在语音导航系统中得到了广泛应用,但在模型的训练、识别率、鲁棒性方面存在一些缺陷。本文研究基于DNN-HMM模型的语音识别技术在语音导航中的应用,首先介绍了基于DNN-HMM模型的语音识别技术,然后给出语音导航系统的结构和主要功能。最后从识别率、鲁棒性方面对该系统进行了测试和分析,实验结果表明,引入DNN-HMM后的语音导航系统在模型的训练、识别率、鲁棒性方面有显著的改善。 展开更多
关键词 计算机技术 人工智能 语音识别 深度神经网络-马尔科夫模型(dnn-hmm) 语音导航系统
下载PDF
基于瓶颈复合特征的声学模型建立方法 被引量:3
3
作者 郑文秀 赵峻毅 +1 位作者 文心怡 姚引娣 《计算机工程》 CAS CSCD 北大核心 2020年第11期301-305,314,共6页
针对梅尔频率倒谱系数(MFCC)语音特征不能有效反映连续帧之间有效信息的问题,基于深度神经网络相关性和紧凑性特征,提出一种融合神经网瓶颈特征与MFCC特征的复合特征构造方法,提高语音的表征能力和建模能力。从语音数据中提取MFCC特征... 针对梅尔频率倒谱系数(MFCC)语音特征不能有效反映连续帧之间有效信息的问题,基于深度神经网络相关性和紧凑性特征,提出一种融合神经网瓶颈特征与MFCC特征的复合特征构造方法,提高语音的表征能力和建模能力。从语音数据中提取MFCC特征作为输入数据,将MFCC特征和BN特征进行串接得到新的复合特征,并进行GMM-HMM声学建模。在TIMIT数据库上的实验结果表明,与单一的瓶颈特征和深度神经网络后验特征相比,该方法识别率明显提升。 展开更多
关键词 深度神经网络 梅尔频率倒谱系数 瓶颈特征 复合特征 高斯混合模型-马尔科夫模型
下载PDF
基于瓶颈特征的藏语拉萨话连续语音识别研究 被引量:9
4
作者 周楠 赵悦 +3 位作者 李要嫱 徐晓娜 才旺拉姆 吴立成 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第2期249-254,共6页
基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点,将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中,可以代替传统的MFCC特征进行GMM-HMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明,瓶颈特征... 基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点,将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中,可以代替传统的MFCC特征进行GMM-HMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明,瓶颈特征的复合特征取得比深度神经网络后验特征和单瓶颈特征更好的识别表现。 展开更多
关键词 藏语拉萨话 连续语音识别 高斯混合–马尔科夫模型 瓶颈特征 深度神经网络
下载PDF
基于稀疏DNN的声学复合特征构造方法 被引量:1
5
作者 郑文秀 连晓飞 +1 位作者 张旭东 黄琼丹 《传感器与微系统》 CSCD 北大核心 2021年第12期69-72,共4页
针对梅尔频率倒谱系数(MFCC)特征、感知线性预测系数特征等常用语音特征不能有效提取语音前后帧相关性信息、冗余信息较多导致识别效果不佳的问题,提出一种将稀疏性瓶颈(BN)特征与MFCC特征相结合的复合特征构造方法,以此来提高语音的表... 针对梅尔频率倒谱系数(MFCC)特征、感知线性预测系数特征等常用语音特征不能有效提取语音前后帧相关性信息、冗余信息较多导致识别效果不佳的问题,提出一种将稀疏性瓶颈(BN)特征与MFCC特征相结合的复合特征构造方法,以此来提高语音的表征和建模能力,并进行高斯混合模型—隐马尔科夫模型(GMM-HMM)声学建模。在TIMIT数据库上的实验结果表明:利用声学复合特征构建的声学模型具有优良的识别性能,证明该方法的有效性。 展开更多
关键词 深度神经网络 稀疏性瓶颈特征 重叠组套索算法 稀疏正则化 声学复合特征 高斯混合模型马尔科夫模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部