期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于小波谱图和深度卷积网络的音频场景识别新框架 被引量:1
1
作者 陈航艇 《网络新媒体技术》 2019年第2期64-64,共1页
近年来,网络上音频的种类和数量呈现爆发式增长。相比语音和音乐,音频中的环境信息更加多样,受到了国内外研究者的广泛关注。音频场景分类的目的是识别出录制音频的特定场景,从而使穿戴式设备、智能机器人感知周围的环境信息并做出相应... 近年来,网络上音频的种类和数量呈现爆发式增长。相比语音和音乐,音频中的环境信息更加多样,受到了国内外研究者的广泛关注。音频场景分类的目的是识别出录制音频的特定场景,从而使穿戴式设备、智能机器人感知周围的环境信息并做出相应反射。传统的音频分类任务大都使用短时特征,如梅尔频率倒谱系数等。然而,环境信息一般隐藏在不同时长的背景声中,因此提取多分辨率多尺度的特征是音频场景分类的关键。 展开更多
关键词 深度卷积网络 音频分类 场景分类 识别 波谱图 梅尔频率倒谱系数 框架 环境信息
下载PDF
波达方向初始化空间混合概率模型的语音增强 被引量:2
2
作者 石倩 陈航艇 张鹏远 《声学学报》 EI CAS CSCD 北大核心 2022年第1期139-150,共12页
提出了波达方向初始化空间混合概率模型的语音增强算法。通过声源定位估计出声源波达方向,再根据此计算相对传递函数,进而构造空间协方差矩阵来初始化空间混合概率模型。论证了相对传递函数在作为模型参数中语音协方差矩阵的主特征向量... 提出了波达方向初始化空间混合概率模型的语音增强算法。通过声源定位估计出声源波达方向,再根据此计算相对传递函数,进而构造空间协方差矩阵来初始化空间混合概率模型。论证了相对传递函数在作为模型参数中语音协方差矩阵的主特征向量时,空间混合概率模型对应的概率分布可达到最大值,进而使期望最大化算法在迭代时更易收敛,以得到期望的掩蔽值。实验先后在自建仿真数据集和CHiME-4的两通道数据集中进行验证,结果表明,将波达方向信息引入到语音增强后语音识别系统的词错误率可以比未引入波达方向的词错误率最多降低3.79%,信号失真比最多提升2.00 dB,验证了在结合波达方向后的空间混合概率模型进行语音增强时性能有所提升。 展开更多
关键词 期望最大化算法 混合概率模型 通道数据 波达方向 初始化 语音增强 协方差矩阵 语音识别系统
下载PDF
中科院语言声学与内容理解重点实验室团队获得DCASE2019音频场景比赛第一名
3
作者 陈航艇 《网络新媒体技术》 2019年第4期66-66,共1页
7月1日,由电气和电子工程师协会( IEEE)声学信号处理技术委员会( AASP)组织的声学场景识别与事件检测( DCASE2019)比赛公布成绩,中科院语言声学与内容理解重点实验室的团队获得了音频场景识别子任务( Task 1A)的第一名。本次参赛团队的... 7月1日,由电气和电子工程师协会( IEEE)声学信号处理技术委员会( AASP)组织的声学场景识别与事件检测( DCASE2019)比赛公布成绩,中科院语言声学与内容理解重点实验室的团队获得了音频场景识别子任务( Task 1A)的第一名。本次参赛团队的指导老师为张鹏远研究员,团队成员包括陈航艇、刘作桢、柳宗铭等人。 展开更多
关键词 重点实验室 语言声学 中科院 场景 比赛 音频 声学信号处理 技术委员会
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部