-
题名基于计算听觉场景分析的说话人转换检测
被引量:1
- 1
-
-
作者
杨登舟
刘加
夏善红
-
机构
中国科学院电子学研究所
中国科学院大学
清华大学电子工程系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2018年第2期316-321,共6页
-
基金
国家自然科学基金"噪声和短语音条件下的说话人识别"(61370034)
-
文摘
在短时语音说话人快速转变的说话人转换检测中,用于训练说话人模型的连续语音较短导致模型不稳健,致使说话人转换检测的性能较差。为此,提出一种新的说话人转换检测方法。借鉴人耳听觉处理机制将语音信号分解为多个子带,可以得到准确的浊、清音边界,实现对零散清、浊音子段的拼接。利用贝叶斯信息准则判决语音子段间的疑似转换点,并运用音高特征做区间验证。实验结果表明,该方法在平均语音子段时长为1.34 s的极短语音条件下,可使说话人转换检测的等错率降至23.2%,F1值达到70%。
-
关键词
说话人转换检测
计算听觉场景分析
伽马通能量倒谱系数
音高
贝叶斯信息准则
-
Keywords
Speaker Change Detection(SCD)
Computational Auditory Scene Analysis(CASA)
Gammatone Energy Cepstral Coefficients(GECC)
pitch
Bayesian Information Criterion(BCI)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-