期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于多语言任务的口语词的一次性学习
被引量:
2
1
作者
王蓉蓉
张连海
沈君
《信息工程大学学报》
2018年第3期331-337,共7页
一次性学习(one-shot learning)是一种仅从一个或少数例子中学习新概念的人类的能力。首先提出口语词上的一次性学习任务的计算模型——基于HHMM模型的口语词的一次性学习框架;然后利用非参贝叶斯方法从多语言语音数据中发现语言间通用...
一次性学习(one-shot learning)是一种仅从一个或少数例子中学习新概念的人类的能力。首先提出口语词上的一次性学习任务的计算模型——基于HHMM模型的口语词的一次性学习框架;然后利用非参贝叶斯方法从多语言语音数据中发现语言间通用的类音素声学单元;最后将自动获得的声学单元用于一次性学习任务,对英语、日语和汉语的口语词进行一次性分类实验。实验结果表明,从多语言中获取的类音素声学单元可以作为基本的概念组合生成复杂的概念(词),实现口语词分类,表明了从一种语言中学到的基本声学单元的知识可以迁移到另一种语言的学习中去。
展开更多
关键词
非参贝叶斯
多语言
声学单元发现
一次性学习
迁移学习
下载PDF
职称材料
基于VQ-VAE与Do-Conv层的无监督语音表示学习
2
作者
刘雪鹏
张文林
陈紫龙
《信息工程大学学报》
2022年第5期513-519,共7页
针对在无监督条件下,对语音信号提取语音表示的问题,提出了Do-VQVAE模型。提出的Do-VQVAE模型主要基于矢量量化变分自编码器的结构进行实现,并在此基础上,引入深度方向超参数化卷积层构成编码器。该模型通过编码器-解码器的结构,以无监...
针对在无监督条件下,对语音信号提取语音表示的问题,提出了Do-VQVAE模型。提出的Do-VQVAE模型主要基于矢量量化变分自编码器的结构进行实现,并在此基础上,引入深度方向超参数化卷积层构成编码器。该模型通过编码器-解码器的结构,以无监督的方式提取语音信号的特征,将编码器的输出通过码书的映射进行量化,得到离散的语音表示。在实验过程中还引入了互信息神经估计,旨在提高学习到的语音表示的说话人不变性。提出的模型在ZeroSpeech 2019挑战的数据集上进行了训练和测试,经过测试,模型的ABX错误率相比于基线和卷积VQ-VAE模型都有明显降低,并取得了与最好系统相媲美的结果。
展开更多
关键词
语音表示
无监督
声学单元发现
ZeroSpeech挑战
下载PDF
职称材料
题名
基于多语言任务的口语词的一次性学习
被引量:
2
1
作者
王蓉蓉
张连海
沈君
机构
信息工程大学
[
出处
《信息工程大学学报》
2018年第3期331-337,共7页
文摘
一次性学习(one-shot learning)是一种仅从一个或少数例子中学习新概念的人类的能力。首先提出口语词上的一次性学习任务的计算模型——基于HHMM模型的口语词的一次性学习框架;然后利用非参贝叶斯方法从多语言语音数据中发现语言间通用的类音素声学单元;最后将自动获得的声学单元用于一次性学习任务,对英语、日语和汉语的口语词进行一次性分类实验。实验结果表明,从多语言中获取的类音素声学单元可以作为基本的概念组合生成复杂的概念(词),实现口语词分类,表明了从一种语言中学到的基本声学单元的知识可以迁移到另一种语言的学习中去。
关键词
非参贝叶斯
多语言
声学单元发现
一次性学习
迁移学习
Keywords
nonparametric Bayesian
multilingualism
acoustic units discovery
one-shot learning
transfer learning
分类号
TN912.34 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于VQ-VAE与Do-Conv层的无监督语音表示学习
2
作者
刘雪鹏
张文林
陈紫龙
机构
信息工程大学
出处
《信息工程大学学报》
2022年第5期513-519,共7页
基金
国家自然科学基金资助项目(61673395,62171470)。
文摘
针对在无监督条件下,对语音信号提取语音表示的问题,提出了Do-VQVAE模型。提出的Do-VQVAE模型主要基于矢量量化变分自编码器的结构进行实现,并在此基础上,引入深度方向超参数化卷积层构成编码器。该模型通过编码器-解码器的结构,以无监督的方式提取语音信号的特征,将编码器的输出通过码书的映射进行量化,得到离散的语音表示。在实验过程中还引入了互信息神经估计,旨在提高学习到的语音表示的说话人不变性。提出的模型在ZeroSpeech 2019挑战的数据集上进行了训练和测试,经过测试,模型的ABX错误率相比于基线和卷积VQ-VAE模型都有明显降低,并取得了与最好系统相媲美的结果。
关键词
语音表示
无监督
声学单元发现
ZeroSpeech挑战
Keywords
speech presentation
unsupervised
acoustic unit discovery
ZeroSpeech challenge
分类号
TN912.34 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于多语言任务的口语词的一次性学习
王蓉蓉
张连海
沈君
《信息工程大学学报》
2018
2
下载PDF
职称材料
2
基于VQ-VAE与Do-Conv层的无监督语音表示学习
刘雪鹏
张文林
陈紫龙
《信息工程大学学报》
2022
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部