-
题名一种两步判决的说话人分割算法
被引量:7
- 1
-
-
作者
杨继臣
贺前华
李艳雄
王伟凝
-
机构
华南理工大学电子与信息学院
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2010年第8期2006-2009,共4页
-
基金
国家自然科学基金(60972132
60602014)资助课题
-
文摘
为了提高说话人分割(SS)准确率,该文综合考虑了静音信息和性别信息在SS中的作用,提出了一种两步判决的SS算法。在从音频流中分离出语音段的基础上,采用两步判决的方法进行SS。第1步采用基频信息为主、性别模型为辅的策略进行SS,将相邻说话人基频差异大的说话人改变检测出来;第2步采用基于性别的改进T2判决公式进行SS,实现相邻说话人基频差异小的同性别SS,为此,该文提出了一个基于块的潜在说话人改变点检测算法。实验结果表明,本文算法提高了分割准确率,F1度量值可达85.14%。对于短时长(<2s)语音段的SS,该算法和传统的贝叶斯信息判决算法相比,漏检率减少了16%。
-
关键词
语音信号处理
两步判决
说话人分割
基频信息
性别信息
-
Keywords
Speech signal processing
Two-step criterion
Speaker Segmentation(SS)
Pitch information
Gender information
-
分类号
TN912.3
[电子电信—通信与信息系统]
-