期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于多视角融合稀疏表示的恐怖视频识别
被引量:
7
1
作者
丁昕苗
李兵
+2 位作者
胡卫明
郭文
王振翀
《电子学报》
EI
CAS
CSCD
北大核心
2014年第2期301-305,共5页
现有的基于多示例学习的恐怖视频识别算法都是假设示例间是相互独立的,而忽略了恐怖视频中存在的上下文信息和示例包的统计特性.因此,本文提出了一种多视角融合稀疏表示模型.该模型分别从集合视角、上下文视角以及统计特性视角三个不同...
现有的基于多示例学习的恐怖视频识别算法都是假设示例间是相互独立的,而忽略了恐怖视频中存在的上下文信息和示例包的统计特性.因此,本文提出了一种多视角融合稀疏表示模型.该模型分别从集合视角、上下文视角以及统计特性视角三个不同的视角来看待一个视频片段,并利用联合稀疏表示框架将三个不同视角融合到一个分类框架中,用来进行恐怖视频的识别.在恐怖视频库上的实验结果验证了算法在恐怖视频识别中比现有的其它算法有更好的性能和稳定性.
展开更多
关键词
恐怖视频
稀疏表示
多视角
核函数
下载PDF
职称材料
基于迁移学习的噪声鲁棒语音识别声学建模
被引量:
5
2
作者
易江燕
陶建华
+1 位作者
刘斌
温正棋
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018年第1期55-60,共6页
为了提高噪声环境下语音识别系统的鲁棒性,提出了一种基于迁移学习的声学建模方法。该方法用干净语音的声学模型(老师模型)指导带噪语音的声学模型(学生模型)进行训练。学生模型在训练过程中,尽量使其逼近老师模型的后验概率分布。...
为了提高噪声环境下语音识别系统的鲁棒性,提出了一种基于迁移学习的声学建模方法。该方法用干净语音的声学模型(老师模型)指导带噪语音的声学模型(学生模型)进行训练。学生模型在训练过程中,尽量使其逼近老师模型的后验概率分布。学生模型和老师模型间的后验概率分布差异通过相对熵(KL divergence)加以最小化。CHiME-2数据集上的实验结果表明,该方法的平均词错率(WER)比基线的绝对下降了7.29%,比CHiME-2竞赛第一名的绝对下降了3.92%。
展开更多
关键词
鲁棒语音识别
声学模型
神经网络
迁移学习
原文传递
基于静音时长和文本特征融合的韵律边界自动标注
被引量:
2
3
作者
傅睿博
陶建华
+1 位作者
李雅
温正棋
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018年第1期61-66,74,共7页
韵律边界标注对于语料库建设和语音合成有着至关重要的作用,而自动韵律标注可以克服人工标注中耗时、不一致的缺点。仿照人工标注流程,该文运用循环神经网络分别对文本和音频两个通道训练子模型,对子模型的输出采用模型融合的方法,从而...
韵律边界标注对于语料库建设和语音合成有着至关重要的作用,而自动韵律标注可以克服人工标注中耗时、不一致的缺点。仿照人工标注流程,该文运用循环神经网络分别对文本和音频两个通道训练子模型,对子模型的输出采用模型融合的方法,从而获得最优标注。以词为单位提取了静音时长,与传统以帧为单位的声学特征相比更具有明确的物理意义,与韵律边界的联系更加紧密。实验结果表明:相比传统声学特征,该文所采用的静音时长特征使自动韵律标注的性能有所提高;相比直接特征层面的方法,决策融合方法更好地结合了声学和文本的特征,进一步提高了标注的性能。
展开更多
关键词
韵律边界标注
决策融合
静音时长
语料库构建
语音合成
原文传递
题名
基于多视角融合稀疏表示的恐怖视频识别
被引量:
7
1
作者
丁昕苗
李兵
胡卫明
郭文
王振翀
机构
山东工商
学院
中国科学院自动化研究所、模式识别国家重点实验室
中国
矿业大学
出处
《电子学报》
EI
CAS
CSCD
北大核心
2014年第2期301-305,共5页
基金
国家自然科学基金(No.60935002,No.61100142,No.61174007,No.61303086)
国家863高技术研究发展计划(No.2012AA012503,No.2012AA012504)
+1 种基金
山东省自然科学基金(No.ZR2012FL09,No.ZR2011FQ039,No.ZR2011FL009)
山东省教育厅高校科研计划(No.J11LG12)
文摘
现有的基于多示例学习的恐怖视频识别算法都是假设示例间是相互独立的,而忽略了恐怖视频中存在的上下文信息和示例包的统计特性.因此,本文提出了一种多视角融合稀疏表示模型.该模型分别从集合视角、上下文视角以及统计特性视角三个不同的视角来看待一个视频片段,并利用联合稀疏表示框架将三个不同视角融合到一个分类框架中,用来进行恐怖视频的识别.在恐怖视频库上的实验结果验证了算法在恐怖视频识别中比现有的其它算法有更好的性能和稳定性.
关键词
恐怖视频
稀疏表示
多视角
核函数
Keywords
horror video
sparse coding
multi-view
kernel
分类号
TP37 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于迁移学习的噪声鲁棒语音识别声学建模
被引量:
5
2
作者
易江燕
陶建华
刘斌
温正棋
机构
中国科学院自动化研究所、模式识别国家重点实验室
中国科学院
大学人工智能技术
学院
中国科学院自动化研究所
、
中国科学院
脑
科学
与智能技术
研究
中心
出处
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018年第1期55-60,共6页
基金
国家”八六三”高技术项目(2015AA016305)
国家自然科学基金面上项目(61425017,61403386)
中国科学院战略性先导科技专项(GrantXDB02080006)
文摘
为了提高噪声环境下语音识别系统的鲁棒性,提出了一种基于迁移学习的声学建模方法。该方法用干净语音的声学模型(老师模型)指导带噪语音的声学模型(学生模型)进行训练。学生模型在训练过程中,尽量使其逼近老师模型的后验概率分布。学生模型和老师模型间的后验概率分布差异通过相对熵(KL divergence)加以最小化。CHiME-2数据集上的实验结果表明,该方法的平均词错率(WER)比基线的绝对下降了7.29%,比CHiME-2竞赛第一名的绝对下降了3.92%。
关键词
鲁棒语音识别
声学模型
神经网络
迁移学习
Keywords
robust speech recognition
acoustic model
deep neural
分类号
TP391.42 [自动化与计算机技术—计算机应用技术]
TP183 [自动化与计算机技术—控制理论与控制工程]
原文传递
题名
基于静音时长和文本特征融合的韵律边界自动标注
被引量:
2
3
作者
傅睿博
陶建华
李雅
温正棋
机构
中国科学院自动化研究所、模式识别国家重点实验室
中国科学院
大学人工智能技术
学院
中国科学院自动化研究所
、
中国科学院
脑
科学
与智能技术
研究
中心
出处
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018年第1期61-66,74,共7页
基金
国家“八六三”高技术项目(2015AA016305)
国家自然科学基金面上项目(61425017,61403386)
+1 种基金
中国科学院战略性先导科技专项(GrantXDB02080006)
中国社会科学基金重大项目(13&ZD189)
文摘
韵律边界标注对于语料库建设和语音合成有着至关重要的作用,而自动韵律标注可以克服人工标注中耗时、不一致的缺点。仿照人工标注流程,该文运用循环神经网络分别对文本和音频两个通道训练子模型,对子模型的输出采用模型融合的方法,从而获得最优标注。以词为单位提取了静音时长,与传统以帧为单位的声学特征相比更具有明确的物理意义,与韵律边界的联系更加紧密。实验结果表明:相比传统声学特征,该文所采用的静音时长特征使自动韵律标注的性能有所提高;相比直接特征层面的方法,决策融合方法更好地结合了声学和文本的特征,进一步提高了标注的性能。
关键词
韵律边界标注
决策融合
静音时长
语料库构建
语音合成
Keywords
prosodic boundary labeling
ensemble strategy
silence duration
corpus construction
speech synthesis
分类号
H116.4 [语言文字—汉语]
TP181 [自动化与计算机技术—控制理论与控制工程]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于多视角融合稀疏表示的恐怖视频识别
丁昕苗
李兵
胡卫明
郭文
王振翀
《电子学报》
EI
CAS
CSCD
北大核心
2014
7
下载PDF
职称材料
2
基于迁移学习的噪声鲁棒语音识别声学建模
易江燕
陶建华
刘斌
温正棋
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018
5
原文传递
3
基于静音时长和文本特征融合的韵律边界自动标注
傅睿博
陶建华
李雅
温正棋
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2018
2
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部