针对传统高斯混合模型(GMM,Gaussian mixture model)难以自动获取类属数和对噪声敏感问题,提出了一种基于可变类空间约束GMM的遥感图像分割方法。首先在构建的GMM中,将像素类属性建模为马尔可夫随机场(MRF,Markov random field),并在此...针对传统高斯混合模型(GMM,Gaussian mixture model)难以自动获取类属数和对噪声敏感问题,提出了一种基于可变类空间约束GMM的遥感图像分割方法。首先在构建的GMM中,将像素类属性建模为马尔可夫随机场(MRF,Markov random field),并在此基础上定义其先验概率;结合邻域像素类属性的后验概率和先验概率,定义噪声平滑因子,以提高算法的抗噪性;在参数求解过程中,分别采用可逆跳变马尔可夫链蒙特卡罗(RJMCMC,reversible jump Markov chain Monte Carlo)方法和最大似然(ML,maximum likelihood)方法估计类属数和模型参数;最后以最小化噪声平滑因子为准则获取最终分割结果。为了验证提出的分割方法,分别对模拟图像和全色遥感图像进行了可变类分割实验。实验结果表明提出方法的可行性和有效性。展开更多
针对非平行语料非联合训练条件下的语音转换,提出一种基于倒谱本征空间结构化高斯混合模型的方法。提取说话人语音倒谱特征参数之后,根据其散布矩阵计算本征向量构造倒谱本征空间并训练结构化高斯混合模型SGMM-ES(Structured Gaussian M...针对非平行语料非联合训练条件下的语音转换,提出一种基于倒谱本征空间结构化高斯混合模型的方法。提取说话人语音倒谱特征参数之后,根据其散布矩阵计算本征向量构造倒谱本征空间并训练结构化高斯混合模型SGMM-ES(Structured Gaussian Mixture Model in Eigen Space)。源和目标说话人各自独立训练的SGMM-ES根据全局声学结构AUS(Acoustical Universal Structure)原理进行匹配对准,最终得到基于倒谱本征空间的短时谱转换函数。实验结果表明,转换语音的目标说话人平均识别率达到95.25%,平均谱失真度为1.25,相对基于原始倒谱特征空间的SGMM方法分别提高了0.8%和7.3%,而ABX和MOS测评表明转换性能非常接近于传统平行语料方法。这一结果说明采用倒谱本征空间结构化高斯混合模型进行非平行语料条件下的语音转换是有效的。展开更多
文摘针对非平行语料非联合训练条件下的语音转换,提出一种基于倒谱本征空间结构化高斯混合模型的方法。提取说话人语音倒谱特征参数之后,根据其散布矩阵计算本征向量构造倒谱本征空间并训练结构化高斯混合模型SGMM-ES(Structured Gaussian Mixture Model in Eigen Space)。源和目标说话人各自独立训练的SGMM-ES根据全局声学结构AUS(Acoustical Universal Structure)原理进行匹配对准,最终得到基于倒谱本征空间的短时谱转换函数。实验结果表明,转换语音的目标说话人平均识别率达到95.25%,平均谱失真度为1.25,相对基于原始倒谱特征空间的SGMM方法分别提高了0.8%和7.3%,而ABX和MOS测评表明转换性能非常接近于传统平行语料方法。这一结果说明采用倒谱本征空间结构化高斯混合模型进行非平行语料条件下的语音转换是有效的。