-
题名基于深层置信网络的说话人信息提取方法
被引量:5
- 1
-
-
作者
陈丽萍
王尔玉
戴礼荣
宋彦
-
机构
中国科学技术大学电子工程与信息科学系
腾讯控股有限公司
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2013年第12期1089-1095,共7页
-
基金
国家自然科学基金项目(No.61273264)
国家973前期研究专项项目(No.2012CB326405)资助
-
文摘
在基于全差异空间因子(i-Vector)的说话人确认系统中,需进一步从语音段的i-Vector表示中提取说话人相关的区分性信息,以提高系统性能.文中通过结合锚模型的思想,提出一种基于深层置信网络的建模方法.该方法通过对i-Vector中包含的复杂差异信息逐层进行分析、建模,以非线性变换的形式挖掘出其中的说话人相关信息.在NIST SRE 2008核心测试电话训练-电话测试数据库上,男声和女声的等错误率分别为4.96%和6.18%.进一步与基于线性判别分析的系统进行融合,能将等错误率降至4.74%和5.35%.
-
关键词
全差异空间因子
说话人确认
深层置信网络
锚模型
-
Keywords
i-Vector, Speaker Verification, Deep Belief Network, Anchor Model
-
分类号
TN912.34
[电子电信—通信与信息系统]
-