-
题名基于概率球面判别分析的说话人识别信道补偿算法
- 1
-
-
作者
景维鹏
肖庆欣
罗辉
-
机构
东北林业大学信息与计算机工程学院
-
出处
《计算机应用》
CSCD
北大核心
2024年第2期556-562,共7页
-
基金
国家自然科学基金资助项目(62101114)。
-
文摘
在说话人识别任务中,概率线性判别分析(PLDA)模型是目前常用的分类后端,但由于高斯PLDA模型分布假设不能准确拟合真实说话人特征分布,导致基于高斯分布假设长度归一化的信道补偿方法会破坏说话人特征类内分布的独立性,使得高斯PLDA不能充分利用上游任务提取特征所包含的说话人信息,从而影响识别结果。针对这一问题,提出基于概率球面判别分析的信道补偿算法(CC-PSDA),通过引入冯·米塞斯-费希尔(VMF)分布假设的概率球面判别分析模型(PSDA)和特征变换方法代替高斯分布假设的概率线性判别分析方法,以避免信道补偿对说话人特征类内分布独立性的影响。首先,为了使说话人特征符合VMF分布先验假设拟合后端分类模型,在特征级利用非线性转换对说话人特征进行分布变换。之后,利用基于VMF分布假设的PLDA模型不会破坏说话人特征的类内分布结构的特点,将变换后的说话人特征定义到特定维度的超球面,最大化特征类间距离。所提算法通过期望最大化(EM)算法进行求解,最终完成分类任务。实验结果表明,改进算法在三个测试集上的识别等错误率相较于对比模型PSDA、高斯PLDA均最低。由此可见,所提模型可以有效区分说话人特征,提高识别性能。
-
关键词
说话人识别
i-vector
概率球面判别分析
信道补偿
冯·米塞斯-费希尔分布
长度归一化
-
Keywords
speaker recognition
i-vector
Probabilistic Spherical Discriminant Analysis(PSDA)
channel compensation
Von Mises-Fisher(VMF)distribution
length normalization
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-