-
题名基于模型聚类的说话人识别研究
- 1
-
-
作者
陈秉沃
张二华
唐振民
-
机构
南京理工大学计算机科学与工程学院
-
出处
《计算机与数字工程》
2023年第8期1745-1749,1831,共6页
-
文摘
随着说话人识别技术的广泛应用,说话人规模不断增长,若采用传统的说话人辨别方式逐一比较,则计算量较大,难以实时响应,使说话人识别系统的性能与实用性大大降低。传统的K-L散度距离由于非对称性,并不是一种很好的聚类距离度量,聚类效果不佳。论文提出了一种基于Wasserstein distance聚类方法,相比于传统说话人识别方法,该方法的识别准确率提升了近4.7%,并且识别耗时仅为传统识别方法的25.5%,大大提升了说话人识别系统的性能与实用性。
-
关键词
模型聚类
推土机距离
Wasserstein
distance
说话人识别
高斯混合模型
-
Keywords
model clustering
bulldozer distance
Wasserstein distance
speaker recognition
Gaussian mixture model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-