-
题名结合瓶颈特征的注意力声学模型
被引量:3
- 1
-
-
作者
龙星延
屈丹
张文林
-
机构
解放军信息工程大学信息系统工程学院
-
出处
《计算机科学》
CSCD
北大核心
2019年第1期260-264,共5页
-
基金
国家自然科学基金(61673395
61403415)
河南省自然科学基金(162300410331)资助
-
文摘
目前基于注意力机制的序列到序列声学模型成为语音识别领域的研究热点。针对该模型训练耗时长和鲁棒性差等问题,提出一种结合瓶颈特征的注意力声学模型。该模型由基于深度置信网络(Deep Belief Network,DBN)的瓶颈特征提取网络和基于注意力的序列到序列模型两部分组成:DBN能够引入传统声学模型的先验信息来加快模型的收敛速度,同时增强瓶颈特征的鲁棒性和区分性;注意力模型利用语音特征序列的时序信息计算音素序列的后验概率。在基线系统的基础上,通过减少注意力模型中循环神经网络的层数来减少训练的时间,通过改变瓶颈特征提取网络的输入层单元数和瓶颈层单元数来优化识别准确率。在TIMIT数据库上的实验表明,该模型在测试集上的音素错误率降低至了17.80%,训练的平均迭代周期缩短了52%,训练迭代次数由139减少至89。
-
关键词
声学模型
注意力模型
瓶颈特征
深度置信网络
-
Keywords
Acoustic model
Attention model
Bottleneck feature
Deep belief network
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名采用最少门单元结构的改进注意力声学模型
被引量:1
- 2
-
-
作者
龙星延
屈丹
张文林
徐思颖
-
机构
战略支援部队信息工程大学信息系统工程学院
-
出处
《信号处理》
CSCD
北大核心
2018年第6期739-748,共10页
-
基金
国家自然科学基金(61673395
61403415)
河南省自然科学基金(162300410331)项目资助
-
文摘
采用"编码-解码"结构的注意力声学模型存在参数规模庞大、收敛速度慢和在噪声环境中对齐关系不准确的问题。针对以上问题,先提出引入最少门结构单元减少模型参数,减少训练时间;再采用自适应宽度的窗函数和在计算注意力系数特征的卷积神经网络中加入池化层进一步提高音素与特征对齐的准确度,从而提升识别准确率。在英语和捷克语的实验结果表明,改进后的模型参数规模和音素错误率均下降,同时识别性能优于基于隐马可夫模型和基于连接时序分类算法的声学模型。
-
关键词
声学模型
注意力机制
最少门单元
自适应窗函数
池化层
-
Keywords
acoustic model
attention mechanism
minimal gate unit
adaptive window function
pooling layer
-
分类号
TP912.3
[自动化与计算机技术]
-
-
题名NGN发展综述
被引量:1
- 3
-
-
作者
赵俊洋
龙星延
刘志方
申涛
-
机构
不详
-
出处
《电信技术研究》
2020年第4期41-46,共6页
-
文摘
本文主要研究了下一代网络(NGN)产生的背景,重点阐述了ITU-T和3GPP两大标准化组织的NGN发展演进路线以及NGN在国内的发展现状,并对下一步的发展进行了展望。当前,NGN技术已发展应用于4G VoLTE,5G亦将NGN架构作为其语音解决方案,其承载与控制分离、控制与业务分离的特性有利于运营商业务的快速迭代开发,满足用户日益多样化和综合化的需求。
-
关键词
NGN
VoLTE
5G
-
分类号
TN9
[电子电信—信息与通信工程]
-