期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于小波谱图和深度卷积网络的音频场景识别新框架
被引量:
1
1
作者
陈航艇
《网络新媒体技术》
2019年第2期64-64,共1页
近年来,网络上音频的种类和数量呈现爆发式增长。相比语音和音乐,音频中的环境信息更加多样,受到了国内外研究者的广泛关注。音频场景分类的目的是识别出录制音频的特定场景,从而使穿戴式设备、智能机器人感知周围的环境信息并做出相应...
近年来,网络上音频的种类和数量呈现爆发式增长。相比语音和音乐,音频中的环境信息更加多样,受到了国内外研究者的广泛关注。音频场景分类的目的是识别出录制音频的特定场景,从而使穿戴式设备、智能机器人感知周围的环境信息并做出相应反射。传统的音频分类任务大都使用短时特征,如梅尔频率倒谱系数等。然而,环境信息一般隐藏在不同时长的背景声中,因此提取多分辨率多尺度的特征是音频场景分类的关键。
展开更多
关键词
深度卷积网络
音频分类
场景分类
识别
波谱图
梅尔频率倒谱系数
框架
环境信息
下载PDF
职称材料
波达方向初始化空间混合概率模型的语音增强
被引量:
2
2
作者
石倩
陈航艇
张鹏远
《声学学报》
EI
CAS
CSCD
北大核心
2022年第1期139-150,共12页
提出了波达方向初始化空间混合概率模型的语音增强算法。通过声源定位估计出声源波达方向,再根据此计算相对传递函数,进而构造空间协方差矩阵来初始化空间混合概率模型。论证了相对传递函数在作为模型参数中语音协方差矩阵的主特征向量...
提出了波达方向初始化空间混合概率模型的语音增强算法。通过声源定位估计出声源波达方向,再根据此计算相对传递函数,进而构造空间协方差矩阵来初始化空间混合概率模型。论证了相对传递函数在作为模型参数中语音协方差矩阵的主特征向量时,空间混合概率模型对应的概率分布可达到最大值,进而使期望最大化算法在迭代时更易收敛,以得到期望的掩蔽值。实验先后在自建仿真数据集和CHiME-4的两通道数据集中进行验证,结果表明,将波达方向信息引入到语音增强后语音识别系统的词错误率可以比未引入波达方向的词错误率最多降低3.79%,信号失真比最多提升2.00 dB,验证了在结合波达方向后的空间混合概率模型进行语音增强时性能有所提升。
展开更多
关键词
期望最大化算法
混合概率模型
通道数据
波达方向
初始化
语音增强
协方差矩阵
语音识别系统
下载PDF
职称材料
中科院语言声学与内容理解重点实验室团队获得DCASE2019音频场景比赛第一名
3
作者
陈航艇
《网络新媒体技术》
2019年第4期66-66,共1页
7月1日,由电气和电子工程师协会( IEEE)声学信号处理技术委员会( AASP)组织的声学场景识别与事件检测( DCASE2019)比赛公布成绩,中科院语言声学与内容理解重点实验室的团队获得了音频场景识别子任务( Task 1A)的第一名。本次参赛团队的...
7月1日,由电气和电子工程师协会( IEEE)声学信号处理技术委员会( AASP)组织的声学场景识别与事件检测( DCASE2019)比赛公布成绩,中科院语言声学与内容理解重点实验室的团队获得了音频场景识别子任务( Task 1A)的第一名。本次参赛团队的指导老师为张鹏远研究员,团队成员包括陈航艇、刘作桢、柳宗铭等人。
展开更多
关键词
重点实验室
语言声学
中科院
场景
比赛
音频
声学信号处理
技术委员会
下载PDF
职称材料
题名
基于小波谱图和深度卷积网络的音频场景识别新框架
被引量:
1
1
作者
陈航艇
机构
中国科学院声学研究所语言声学与内容理解重点实验室
出处
《网络新媒体技术》
2019年第2期64-64,共1页
文摘
近年来,网络上音频的种类和数量呈现爆发式增长。相比语音和音乐,音频中的环境信息更加多样,受到了国内外研究者的广泛关注。音频场景分类的目的是识别出录制音频的特定场景,从而使穿戴式设备、智能机器人感知周围的环境信息并做出相应反射。传统的音频分类任务大都使用短时特征,如梅尔频率倒谱系数等。然而,环境信息一般隐藏在不同时长的背景声中,因此提取多分辨率多尺度的特征是音频场景分类的关键。
关键词
深度卷积网络
音频分类
场景分类
识别
波谱图
梅尔频率倒谱系数
框架
环境信息
分类号
TN912.34 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
波达方向初始化空间混合概率模型的语音增强
被引量:
2
2
作者
石倩
陈航艇
张鹏远
机构
南京大学声学研究所
中国科学院声学研究所语言声学与内容理解重点实验室
中国科学院大学
出处
《声学学报》
EI
CAS
CSCD
北大核心
2022年第1期139-150,共12页
基金
中国科学院战略性先导科技专项项目(XDC08010300)
国家自然科学基金项目(11774380,62071461)资助。
文摘
提出了波达方向初始化空间混合概率模型的语音增强算法。通过声源定位估计出声源波达方向,再根据此计算相对传递函数,进而构造空间协方差矩阵来初始化空间混合概率模型。论证了相对传递函数在作为模型参数中语音协方差矩阵的主特征向量时,空间混合概率模型对应的概率分布可达到最大值,进而使期望最大化算法在迭代时更易收敛,以得到期望的掩蔽值。实验先后在自建仿真数据集和CHiME-4的两通道数据集中进行验证,结果表明,将波达方向信息引入到语音增强后语音识别系统的词错误率可以比未引入波达方向的词错误率最多降低3.79%,信号失真比最多提升2.00 dB,验证了在结合波达方向后的空间混合概率模型进行语音增强时性能有所提升。
关键词
期望最大化算法
混合概率模型
通道数据
波达方向
初始化
语音增强
协方差矩阵
语音识别系统
分类号
TN912.35 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
中科院语言声学与内容理解重点实验室团队获得DCASE2019音频场景比赛第一名
3
作者
陈航艇
机构
中国科学院声学研究所语言声学与内容理解重点实验室
出处
《网络新媒体技术》
2019年第4期66-66,共1页
文摘
7月1日,由电气和电子工程师协会( IEEE)声学信号处理技术委员会( AASP)组织的声学场景识别与事件检测( DCASE2019)比赛公布成绩,中科院语言声学与内容理解重点实验室的团队获得了音频场景识别子任务( Task 1A)的第一名。本次参赛团队的指导老师为张鹏远研究员,团队成员包括陈航艇、刘作桢、柳宗铭等人。
关键词
重点实验室
语言声学
中科院
场景
比赛
音频
声学信号处理
技术委员会
分类号
N24 [自然科学总论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于小波谱图和深度卷积网络的音频场景识别新框架
陈航艇
《网络新媒体技术》
2019
1
下载PDF
职称材料
2
波达方向初始化空间混合概率模型的语音增强
石倩
陈航艇
张鹏远
《声学学报》
EI
CAS
CSCD
北大核心
2022
2
下载PDF
职称材料
3
中科院语言声学与内容理解重点实验室团队获得DCASE2019音频场景比赛第一名
陈航艇
《网络新媒体技术》
2019
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部