-
题名基于深度前编码卷积网络的汉越语音翻译方法
被引量:6
- 1
-
-
作者
王剑
许树理
余正涛
王振晗
梁仁凤
-
机构
昆明理工大学信息工程与自动化学院
昆明理工大学云南省人工智能重点实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2021年第4期736-739,共4页
-
基金
国家重点研发计划项目(2018YFC0830105,2018YFC0830101,2018YFC0830100)资助。
-
文摘
语音翻译是将源语言语音翻译为目标语言文本的过程.传统序列到序列模型应用到语音翻译领域时,模型对于序列长度较为敏感,编码端特征提取和局部依赖建模压力较大.针对这一问题,本文基于Transformer网络构建语音翻译模型,使用深度卷积网络对音频频谱特征进行前编码处理,通过对音频序列进行下采样,对音频频谱中的时频信息进行局部依赖建模和深层特征提取,缓解编码器的建模压力,实现了汉越双语的语音到文本互译.实验结果表明,提出方法取得很好效果,相比基准系统获得了约19%的性能提升.
-
关键词
语音翻译
语音识别
机器翻译
-
Keywords
speech translation
speech recognition
machine translation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于拼音约束联合学习的汉语语音识别
被引量:2
- 2
-
-
作者
梁仁凤
余正涛
高盛祥
黄于欣
郭军军
许树理
-
机构
昆明理工大学信息工程与自动化学院
昆明理工大学云南省人工智能重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2022年第10期167-172,共6页
-
基金
国家自然科学基金(61732005,U21B2027,61972186)
云南高新技术产业发展项目(201606)
+2 种基金
云南省重大科技专项计划(202103AA080015,202002AD080001-5)
云南省基础研究计划(202001AS070014)
云南省学术和技术带头人后备人才(202105AC160018)。
-
文摘
当前的语音识别模型在英语、法语等表音文字中已取得很好的效果。然而,汉语是一种典型的表意文字,汉字与语音没有直接的对应关系,但拼音作为汉字读音的标注符号,与汉字存在相互转换的内在联系。因此,在汉语语音识别中利用拼音作为解码时的约束,可以引入一种更接近语音的归纳偏置。该文基于多任务学习框架,提出一种基于拼音约束联合学习的汉语语音识别方法,以端到端的汉字语音识别为主任务,以拼音语音识别为辅助任务,通过共享编码器,同时利用汉字与拼音识别结果作为监督信号,增强编码器对汉语语音的表达能力。实验结果表明,相比基线模型,该文提出的方法取得了更优的识别效果,词错误率降低了2.24%。
-
关键词
端到端
汉语语音识别
联合学习
拼音
-
Keywords
end-to-end
Chinese speech recognition
joint learning
Pinyin
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名高校学生创业困境调查研究
- 3
-
-
作者
梁仁凤
杨采玲
黄梅芳
陈观华
-
机构
桂林理工大学人文社会科学学院
-
出处
《消费导刊》
2015年第1期272-273,共2页
-
基金
基金项目:2013年国家级大学生创新创业训练项目“大学生跳蚤街--爱心超市”(2013RWCY003)成果之一.
-
文摘
随着我国经济的快速发展,产业结构的不断调整与劳动力需求的日益多元化,就业形势越加严峻,越来越多的人们另辟蹊径,形成了自主创业这一趋势。而大学生则是这群体中最具特殊性,最引人注意的人群。本文就G市高校大学生创业的背景、创业现状、存在的问题进行调查分析,并提出对策建议,以提高大学生创业成功率。
-
关键词
大学生
创业
困境
-
分类号
G64
[文化科学—高等教育学]
-