期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
深度信念网络的Bottleneck特征提取方法 被引量:3
1
作者 谈建慧 景新幸 杨海燕 《桂林电子科技大学学报》 2016年第2期118-122,共5页
为了提升连续语音识别系统的识别率,提出一种基于深度信念网络的Bottleneck特征提取方法。该方法使用对比散度算法,采用无监督的预训练堆叠限制玻尔兹曼机得到网络初始化参数,进而采用反向传播算法,以最大化帧级交叉熵作为训练准则,反... 为了提升连续语音识别系统的识别率,提出一种基于深度信念网络的Bottleneck特征提取方法。该方法使用对比散度算法,采用无监督的预训练堆叠限制玻尔兹曼机得到网络初始化参数,进而采用反向传播算法,以最大化帧级交叉熵作为训练准则,反向迭代对网络参数进行微调。采用上下文相关的三音素模型,以音素错误率大小作为评价系统性能的准则。实验结果表明,所提出的基于深度信念网络提取的Bottleneck特征相对于传统特征更具优越性。 展开更多
关键词 连续语音识别 深度信念网络 bottleneck特征 音素错误率
下载PDF
LVCSR系统中一种基于区分性和自适应瓶颈深度置信网络的特征提取方法 被引量:9
2
作者 陈雷 杨俊安 +1 位作者 王一 王龙 《信号处理》 CSCD 北大核心 2015年第3期290-298,共9页
大词汇量连续语音识别系统中,为了进一步增强网络的鲁棒性、提升瓶颈深度置信网络的识别准确率,本文提出一种基于区分性和自适应瓶颈深度置信网络的特征提取方法。该方法首先使用鲁棒性较强的瓶颈深度置信网络进行初步特征提取,进而进... 大词汇量连续语音识别系统中,为了进一步增强网络的鲁棒性、提升瓶颈深度置信网络的识别准确率,本文提出一种基于区分性和自适应瓶颈深度置信网络的特征提取方法。该方法首先使用鲁棒性较强的瓶颈深度置信网络进行初步特征提取,进而进行区分性训练,使网络的区分性更强、识别准确率更高,在此基础上引入说话人自适应技术对网络进行调整,提高系统的鲁棒性。本文利用提出的声学特征在多个噪声较强、主题风格较为随意的多个公共连续语音数据库上进行了测试,识别准确率取得了6.9!的提升。实验结果表明所提出的特征提取方法相对于传统方法的优越性。 展开更多
关键词 连续语音识别 瓶颈深度置信网络 区分性训练 说话人自适应
下载PDF
一种新的基于瓶颈深度信念网络的特征提取方法及其在语种识别中的应用 被引量:10
3
作者 李晋徽 杨俊安 王一 《计算机科学》 CSCD 北大核心 2014年第3期263-266,共4页
在语种识别中,传统的MFCC特征由于每帧信号上的信息量不足,很容易受到噪声污染,且抗噪能力较弱。同时,目前普遍使用的SDC特征提取方法在参数选择上需要人为设定,这增加了识别结果的不确定性。针对上述不足,将深度学习方法引入特征提取之... 在语种识别中,传统的MFCC特征由于每帧信号上的信息量不足,很容易受到噪声污染,且抗噪能力较弱。同时,目前普遍使用的SDC特征提取方法在参数选择上需要人为设定,这增加了识别结果的不确定性。针对上述不足,将深度学习方法引入特征提取之中,提出了基于瓶颈深度信念网络的特征提取方法。最后在NIST2007数据库上对瓶颈层的大小、隐层数目以及瓶颈层位置进行了相关的对比实验,结果表明,提出的方法相对于传统的特征提取方法能够取得更高的识别率。 展开更多
关键词 语种识别 瓶颈特征 深度信念网络
下载PDF
一种基于层次结构深度信念网络的音素识别方法 被引量:2
4
作者 王一 杨俊安 +2 位作者 刘辉 柳林 卢高 《应用科学学报》 CAS CSCD 北大核心 2014年第5期515-522,共8页
针对现有音素识别系统识别准确率不高、建模方法表征能力不强且易陷入局部最优解等问题,提出了一种基于层次结构深度信念网络(deep belief network,DBN)的音素识别新方法.该方法由基于层次结构DBN的瓶颈特征以及基于DBN的音素分类器两... 针对现有音素识别系统识别准确率不高、建模方法表征能力不强且易陷入局部最优解等问题,提出了一种基于层次结构深度信念网络(deep belief network,DBN)的音素识别新方法.该方法由基于层次结构DBN的瓶颈特征以及基于DBN的音素分类器两部分组成:其中的瓶颈特征能够充分利用DBN能够处理长时段语音、监督性的提取方法等特性;而基于DBN的音素分类器则具有更强的建模和表征能力.因此,将两者结合在一起能够在提取低维、监督性特征的同时,利用DBN更加有效地对音素后验概率进行识别.在TIMIT数据库上进行的实验结果表明,所提出的音素识别方法在识别正确率上相对于以往音素识别系统有较大提高. 展开更多
关键词 音素识别 层次结构 深度信念网络 瓶颈特征
下载PDF
一种新的基于DBN的声学特征提取方法
5
作者 陈雷 杨俊安 +1 位作者 王龙 李晋徽 《无线电通信技术》 2015年第6期41-45,共5页
大词汇量连续语音识别系统中,为了进一步增强网络的鲁棒性、提升深度置信网络的识别准确率,提出一种基于区分性和ODLR自适应瓶颈深度置信网络的特征提取方法。该方法首先使用鲁棒性较强的瓶颈深度置信网络进行初步特征提取,进而进行区... 大词汇量连续语音识别系统中,为了进一步增强网络的鲁棒性、提升深度置信网络的识别准确率,提出一种基于区分性和ODLR自适应瓶颈深度置信网络的特征提取方法。该方法首先使用鲁棒性较强的瓶颈深度置信网络进行初步特征提取,进而进行区分性训练,使网络的区分性更强、识别准确率更高,在此基础上引入说话人自适应技术对网络进行调整,提高模型的鲁棒性。利用提出的声学特征在多个噪声较强、主题风格较为随意的多个公共连续语音数据库上进行了测试,识别结果取得了22.2%的提升。实验结果表明所提出的特征提取方法有效性。 展开更多
关键词 连续语音识别 瓶颈深度置信网络 区分性训练 ODLR
下载PDF
结合瓶颈特征的注意力声学模型 被引量:3
6
作者 龙星延 屈丹 张文林 《计算机科学》 CSCD 北大核心 2019年第1期260-264,共5页
目前基于注意力机制的序列到序列声学模型成为语音识别领域的研究热点。针对该模型训练耗时长和鲁棒性差等问题,提出一种结合瓶颈特征的注意力声学模型。该模型由基于深度置信网络(Deep Belief Network,DBN)的瓶颈特征提取网络和基于注... 目前基于注意力机制的序列到序列声学模型成为语音识别领域的研究热点。针对该模型训练耗时长和鲁棒性差等问题,提出一种结合瓶颈特征的注意力声学模型。该模型由基于深度置信网络(Deep Belief Network,DBN)的瓶颈特征提取网络和基于注意力的序列到序列模型两部分组成:DBN能够引入传统声学模型的先验信息来加快模型的收敛速度,同时增强瓶颈特征的鲁棒性和区分性;注意力模型利用语音特征序列的时序信息计算音素序列的后验概率。在基线系统的基础上,通过减少注意力模型中循环神经网络的层数来减少训练的时间,通过改变瓶颈特征提取网络的输入层单元数和瓶颈层单元数来优化识别准确率。在TIMIT数据库上的实验表明,该模型在测试集上的音素错误率降低至了17.80%,训练的平均迭代周期缩短了52%,训练迭代次数由139减少至89。 展开更多
关键词 声学模型 注意力模型 瓶颈特征 深度置信网络
下载PDF
基于语谱图提取瓶颈特征的情感识别算法研究 被引量:7
7
作者 李姗 徐珑婷 《计算机技术与发展》 2017年第5期82-86,共5页
传统的谱特征(诸如MFCC)来源于对语谱图特征的再加工提取,但存在着因分帧处理引起相邻帧谱特征之间相关性被忽略的问题和所提取的谱特征与目标标签不相关的问题。这导致了从语谱图中提取的特征丢失了很多有用信息。为此,提出了获取深度... 传统的谱特征(诸如MFCC)来源于对语谱图特征的再加工提取,但存在着因分帧处理引起相邻帧谱特征之间相关性被忽略的问题和所提取的谱特征与目标标签不相关的问题。这导致了从语谱图中提取的特征丢失了很多有用信息。为此,提出了获取深度谱特征(Deep Spectral Feature,DSF)的算法。DSF的特征是把直接从语谱图中提取的谱特征用于深度置信网络(DBN)训练,进而从隐层节点数较少的瓶颈层提取到瓶颈特征。为了解决传统谱特征的第一种缺陷,采用相邻多帧语音信号中提取的特征参数构成DSF特征。而深度置信网络所具有的强大自学习能力以及与目标标签密切相关的性能,使得经过微调的DSF特征能够解决传统谱特征的第二个缺陷。大量的仿真实验结果表明,相对于传统MFCC特征,经过微调的DSF特征在语音情感识别领域的识别率比传统MFCC高3.97%。 展开更多
关键词 瓶颈特征 深度置信网络 谱特征 语谱图 情感识别
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部