期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
说话人日志中可靠静音模型语音活动检测方法
1
作者
杨登舟
徐嘉明
+1 位作者
刘加
夏善红
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2016年第1期151-157,共7页
为了解决传统语音活动检测(VAD)技术分离出的语音段掺杂静音以及帧间频繁跳动产生短语音碎片的问题,提出在说话人日志中能够高效稳定地完成语音活动检测的方法.该方法利用可靠静音模型对语音的区分度高这个特性,通过循环迭代收敛得到稳...
为了解决传统语音活动检测(VAD)技术分离出的语音段掺杂静音以及帧间频繁跳动产生短语音碎片的问题,提出在说话人日志中能够高效稳定地完成语音活动检测的方法.该方法利用可靠静音模型对语音的区分度高这个特性,通过循环迭代收敛得到稳定划分.建立静音和语音模型,通过帧间连续性原理进行不确定性解码得到帧类属信息,开展低能量短时间语音碎片后处理完成语音活动检测.在富标注说话人日志数据集上测试,实验结果表明,由于对静音模型的描述更加可靠,采用该方法可以减少帧间跳动,减少静音模型对语音的吸收误判,性能比基于子带熵顺序统计滤波(SE-OSF)方法提高明显.
展开更多
关键词
说话人日志
富标注
语音活动检测(VAD)
高斯模型
维特比解码
下载PDF
职称材料
题名
说话人日志中可靠静音模型语音活动检测方法
1
作者
杨登舟
徐嘉明
刘加
夏善红
机构
中国科学院电子学研究所
中国科学院大学电子电气与通信工程学院
清华大学电子工程系
出处
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2016年第1期151-157,共7页
基金
国家自然科学基金资助项目(61370034
61403224)
文摘
为了解决传统语音活动检测(VAD)技术分离出的语音段掺杂静音以及帧间频繁跳动产生短语音碎片的问题,提出在说话人日志中能够高效稳定地完成语音活动检测的方法.该方法利用可靠静音模型对语音的区分度高这个特性,通过循环迭代收敛得到稳定划分.建立静音和语音模型,通过帧间连续性原理进行不确定性解码得到帧类属信息,开展低能量短时间语音碎片后处理完成语音活动检测.在富标注说话人日志数据集上测试,实验结果表明,由于对静音模型的描述更加可靠,采用该方法可以减少帧间跳动,减少静音模型对语音的吸收误判,性能比基于子带熵顺序统计滤波(SE-OSF)方法提高明显.
关键词
说话人日志
富标注
语音活动检测(VAD)
高斯模型
维特比解码
Keywords
speaker diarization
rich transcription
voice activity detection(VAD)
Gaussian model
Viterbi alignment
分类号
TN912 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
说话人日志中可靠静音模型语音活动检测方法
杨登舟
徐嘉明
刘加
夏善红
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2016
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部