-
题名基于ISODATA聚类算法的语音转换研究
- 1
-
-
作者
崔立梅
李燕萍
吕中良
-
机构
南京邮电大学通信与信息工程学院
-
出处
《计算机技术与发展》
2017年第6期106-109,共4页
-
基金
国家自然科学基金资助项目(61401227)
江苏省博士后基金(1402067B)
-
文摘
提出了一种基于迭代自组织聚类算法(ISODATA)的双线性频率弯折语音转换模型。根据语音特征参数分类不充分产生残差成分的问题,在基于高斯混合模型的聚类过程中引入了迭代自组织聚类算法。该算法将聚类得到的类内均值作为训练模型初始均值,改善了EM算法初始值选取不当导致算法不能收敛的问题,从而对特征参数的拟合更加准确,结合后续的双线性频率弯折(BLFW)模型实现语音转换。实验测试结果表明:提出的算法具有较好的自适应聚类特性,能够使特征参数分类更合理,进而得到更准确的转换函数,使得转换的语音更接近目标语音。选择合适的初始值参数,对提出的算法与高斯混合模型及双线性频率弯折模型进行比较,平均MCD值相差很小,平均MOS值有所提高。这说明合理精确的聚类有利于提高语音转换系统的性能。
-
关键词
迭代自组织聚类算法
双线性频率弯折语音转换模型
残差成分
聚类特性
-
Keywords
iterative self-organizing clustering algorithm
bilinear frequency warping voice conversion model
residual components
clus-tering characteristics
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-