期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于音素分类的汉语语声转换算法 被引量:1
1
作者 李燕萍 张玲华 丁辉 《南京邮电大学学报(自然科学版)》 2011年第1期10-15,38,共7页
提出了一种基于音素分类的语声转换算法。根据汉语语音学理论,分析汉语语言结构,通过帧特征分析,构建了汉语元音映射表,指导音素的分类,然后对每类音素进行独立的特征参数转换,解决了传统GMM转换算法的过平滑问题,避免了训练与测试阶段... 提出了一种基于音素分类的语声转换算法。根据汉语语音学理论,分析汉语语言结构,通过帧特征分析,构建了汉语元音映射表,指导音素的分类,然后对每类音素进行独立的特征参数转换,解决了传统GMM转换算法的过平滑问题,避免了训练与测试阶段的语料音素之间的不均衡,从而提高语音的可懂度与自然度。客观评测结果表明,基于音素分类的语声转换算法与GMM算法相比,谱距离比值平均降低了9.31%;主观听力测试表明,ABX测试结果提高了10.36%,同时MOS得分平均提高了29.33%。 展开更多
关键词 语声转换 音素分类 汉语元音映射 高斯混合模型
下载PDF
音素分类用函数链网的训练 被引量:1
2
作者 徐近霈 孟宪军 《信号处理》 CSCD 北大核心 1995年第4期295-300,共6页
提出用于音素分类的函数链神经网的改进训练方法。其基本思想是:用正反例均衡、样本跳转、目标函数修正、学习率自动调整和样本渐增等改善常规的BP算法,以提高其分类性能和收敛速度。文中还提出了一种形象和有效地评价分类器性能的方... 提出用于音素分类的函数链神经网的改进训练方法。其基本思想是:用正反例均衡、样本跳转、目标函数修正、学习率自动调整和样本渐增等改善常规的BP算法,以提高其分类性能和收敛速度。文中还提出了一种形象和有效地评价分类器性能的方法—正反例样本分布直方图。实验表明,所提算法能显著改善BP训练性能。将其与结构优化算法结合用于训练和优化汉语辅音‘b’的分类网,可将输入维数由90维压缩到18维,而对其训练集的正识率仅由96.98%减为95.29%。 展开更多
关键词 语音识别 神经网络 音素分类 函数链网
下载PDF
采用音素分类的因子分析说话人识别方法
3
作者 马啸空 郭武 《小型微型计算机系统》 CSCD 北大核心 2016年第9期2130-2134,共5页
提出一种利用深度神经网络和语音学知识进行文本无关的说话人识别的方法.采用深度神经网络(Deep Neural Netw ork,DNN)来进行有监督的因子分析建模方法是目前与文本无关说话人识别的研究热点,在此基础上挖掘了不同的音素对识别性能的影... 提出一种利用深度神经网络和语音学知识进行文本无关的说话人识别的方法.采用深度神经网络(Deep Neural Netw ork,DNN)来进行有监督的因子分析建模方法是目前与文本无关说话人识别的研究热点,在此基础上挖掘了不同的音素对识别性能的影响.首先根据语音学知识对DNN的输出节点进行分类,在说话人建模过程中,根据不同的类别来提取不同的后验因子(i-vectors),然后采用拼接的方式得到一个高维的i-vector用于话者识别.在NIST SRE 2012的核心测试任务上,相对于无监督的全空间变量因子分析与基于DNN的因子分析方法,提出的算法都有不同程度的性能提升.综合来看,超过了目前已知的最佳系统性能. 展开更多
关键词 说话人识别 深度神经网络 音素分类 因子分析
下载PDF
音素分类用函数链网的训练和结构优化
4
作者 孟宪军 徐近霈 《模式识别与人工智能》 EI CSCD 北大核心 1998年第2期211-214,共4页
提出用于音素分类的函数链神经网的加速训练和结构优化算法,其基本思想是:在用改进BP法训练网络参数同时,逐步删剪对正确分类无用的联结和整个训练集中活度相关的节点,以获得最小化网络.实验表明,所提算法能显著改善BP训练性能,简化分... 提出用于音素分类的函数链神经网的加速训练和结构优化算法,其基本思想是:在用改进BP法训练网络参数同时,逐步删剪对正确分类无用的联结和整个训练集中活度相关的节点,以获得最小化网络.实验表明,所提算法能显著改善BP训练性能,简化分类网结构,而很少影响其分类性能。 展开更多
关键词 语音识别 音素分类 结构优化 函数链网
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部