期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
基于MAP和MLLR的综合渐进自适应方法研究 被引量:3
1
作者 丰洪才 卢正鼎 《计算机工程》 CAS CSCD 北大核心 2005年第5期4-7,共4页
从说话人自适应技术讨论了最大后验概率(MAP)和最大似然线性回归(MLLR)两种经典的说话人自适应方法,通过在渐进的MAP方法中引入一个简化的MLLR模块,提出一种适合于强健语音识别的快速综合渐进自适应语音识别方法和策略。
关键词 语音识别 自适应 MAP mllr
下载PDF
基于MLLR和MAP非母语说话人自适应语音识别
2
作者 尉洪 杨鉴 +1 位作者 普园媛 赵征鹏 《信号处理》 CSCD 北大核心 2005年第z1期196-199,共4页
说话人自适应是提高非特定人语音识别系统识别性能的有效手段,本文针对非母语说话人,结合常规的自适应技术MLLR和MAP,探索云南纳西族和傈僳族两种母语说话人的汉语普通话语音识别问题,实验结果显示有显著效果.
关键词 非母语语音识别 说话人自适应 mllr MAP
下载PDF
MLLR和MAP在远场噪声混响下的语音识别研究 被引量:7
3
作者 娄英丹 徐静林 +1 位作者 黄丽霞 张雪英 《计算机工程与应用》 CSCD 北大核心 2020年第10期122-126,共5页
自适应技术可以用较少的数据来调整声学模型参数,从而达到较好的语音识别效果,它们大多用于自适应有口音的语音。将最大似然线性回归(Maximum Likelihood Linear Regression,MLLR)、最大后验概率(Maximum A Posteriori,MAP)自适应技术... 自适应技术可以用较少的数据来调整声学模型参数,从而达到较好的语音识别效果,它们大多用于自适应有口音的语音。将最大似然线性回归(Maximum Likelihood Linear Regression,MLLR)、最大后验概率(Maximum A Posteriori,MAP)自适应技术用在远场噪声混响环境下来分析其在此环境下的识别性能。实验结果表明,仿真条件下,在墙壁反射系数为0.6,各种噪声环境下MAP有最好的自适应性能,在信噪比(Signal-to-Noise Ratio,SNR)分别为5 dB、10 dB、15 dB时,MAP使远场连续语音词错率(Word Error Rate,WER)平均降低了1.51%、12.82%、2.95%。真实条件下,MAP使WER下降幅度最大达到了37.13%。进一步验证了MAP良好的渐进性,且当自适应句数为1 000时,用MAP声学模型自适应方法得到的远场噪声混响连续语音的识别词错率比自适应前平均降低了12.5%。 展开更多
关键词 最大似然线性回归(mllr) 最大后验概率(MAP) 环境自适应 远场语音识别
下载PDF
使用无监督网络MLLR自适应改进算法的语音识别
4
作者 潘复平 赵庆卫 颜永红 《数据采集与处理》 CSCD 北大核心 2007年第1期8-13,共6页
介绍了一种基于词网的最大似然线性回归(Lattice-MLLR)无监督自适应算法,并进行了改进。Lattice-MLLR是根据解码得到的词网估计MLLR变换参数,词网的潜在误识率远小于识别结果,因此可以使参数估计更为准确。Lattice-MLLR的一个很大缺点... 介绍了一种基于词网的最大似然线性回归(Lattice-MLLR)无监督自适应算法,并进行了改进。Lattice-MLLR是根据解码得到的词网估计MLLR变换参数,词网的潜在误识率远小于识别结果,因此可以使参数估计更为准确。Lattice-MLLR的一个很大缺点是计算量极大,较难实用,对此本文提出了两个改进技术:(1)利用后验概率压缩词网;(2)利用单词的时间信息限制状态统计量的计算范围。实验测定Lattice-MLLR的误识率比传统MLLR相对下降了3.5%,改进技术使Lattice-MLLR计算量下降幅度超过了87.9%。 展开更多
关键词 语音识别 无监督自适应 最大似然线性回归 词网 后验概率
下载PDF
基于目标驱动的多层MLLR自适应算法
5
作者 穆向禹 贾磊 +1 位作者 张树武 徐波 《中文信息学报》 CSCD 北大核心 2003年第6期39-46,共8页
本文在对语音识别中基于自适应回归树的极大似然线性变换 (MLLR)模型自适应算法深刻分析的基础上 ,提出了一种基于目标驱动的多层MLLR自适应 (TMLLR)算法。这种算法基于目标驱动的原则 ,引入反馈机制 ,根据目标函数似然概率的增加来动... 本文在对语音识别中基于自适应回归树的极大似然线性变换 (MLLR)模型自适应算法深刻分析的基础上 ,提出了一种基于目标驱动的多层MLLR自适应 (TMLLR)算法。这种算法基于目标驱动的原则 ,引入反馈机制 ,根据目标函数似然概率的增加来动态决定MLLR变换的变换类 ,大大提高了系统的识别率。并且由于这种算法的特殊多层结构 ,减少了许多中间的冗余计算 ,算法在具有较高的自适应精度的同时还具有较快的自适应速度。在有监督自适应实验中 ,经过此算法自适应后的系统识别率比基于自适应回归树的MLLR算法自适应后系统的误识率降低了 10 % ,自适应速度也比基于自适应回归树的MLLR算法快近一倍。 展开更多
关键词 计算机应用 中文信息处理 语音识别 模型自适应 自适应回归树 极大似然线性变换
下载PDF
基于MAP+CMLLR的说话人识别中发声力度问题 被引量:1
6
作者 黄文娜 彭亚雄 贺松 《计算机应用》 CSCD 北大核心 2017年第3期906-910,共5页
为了改善发声力度对说话人识别系统性能的影响,在训练语音存在少量耳语、高喊语音数据的前提下,提出了使用最大后验概率(MAP)和约束最大似然线性回归(CMLLR)相结合的方法来更新说话人模型、投影转换说话人特征。其中,MAP自适应方法用于... 为了改善发声力度对说话人识别系统性能的影响,在训练语音存在少量耳语、高喊语音数据的前提下,提出了使用最大后验概率(MAP)和约束最大似然线性回归(CMLLR)相结合的方法来更新说话人模型、投影转换说话人特征。其中,MAP自适应方法用于对正常语音训练的说话人模型进行更新,而CMLLR特征空间投影方法则用来投影转换耳语、高喊测试语音的特征,从而改善训练语音与测试语音的失配问题。实验结果显示,采用MAP+CMLLR方法时,说话人识别系统等错误率(EER)明显降低,与基线系统、最大后验概率(MAP)自适应方法、最大似然线性回归(MLLR)模型投影方法和约束最大似然线性回归(CMLLR)特征空间投影方法相比,MAP+CMLLR方法的平均等错率分别降低了75.3%、3.5%、72%和70.9%。实验结果表明,所提出方法削弱了发声力度对说话人区分性的影响,使说话人识别系统对于发声力度变化更加鲁棒。 展开更多
关键词 说话人识别 发声力度 最大后验概率 最大似然线性回归 约束最大似然线性回归
下载PDF
MLLR特征的SVM语种识别算法
7
作者 钟山 刘加 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第S1期1283-1287,共5页
为了挖掘更多语种间区分性信息进行可靠的自动语种识别,本文提出一种将自适应领域的最大似然线性回归(maximum likelihood linear regression,MLLR)矩阵作为特征的语种识别算法。该算法首先对每个语种训练Gauss混合模型(Gaussian mixtur... 为了挖掘更多语种间区分性信息进行可靠的自动语种识别,本文提出一种将自适应领域的最大似然线性回归(maximum likelihood linear regression,MLLR)矩阵作为特征的语种识别算法。该算法首先对每个语种训练Gauss混合模型(Gaussian mixture model,GMM),然后对每个语音段在所有语种的GMM上计算MLLR矩阵。将得到的多类MLLR矩阵经归一化后拼接形成超矢量作为特征输入支持向量机(support vector machine,SVM)分类器进行训练和识别。比较了均值方差和排序两种归一化方法,并将多类MLLR-SVM算法与传统GMM语种识别算法进行对比。实验表明:排序归一化算法优于传统的均值方差归一化;建立在GMM模型基础上的MLLR-SVM系统性能有9.7%的提升,并与GMM分类器有很强的互补性。 展开更多
关键词 语种识别 语音段 最大似然线性回归(mllr) 支持向量机(SVM)
原文传递
语音识别说话人自适应研究现状及发展趋势 被引量:32
8
作者 李虎生 刘加 刘润生 《电子学报》 EI CAS CSCD 北大核心 2003年第1期103-108,共6页
说话人自适应是提高非特定人语音识别系统识别性能的有效手段 .本文介绍了说话人自适应研究的现状 ,包括自适应的不同方式和不同算法 ,并详细介绍了目前应用最为广泛的MLLR算法和MAP算法 .
关键词 研究现状 发展趋势 语音识别 说话人自适应 mllr算法 MAP算法
下载PDF
决策树结构对说话人自适应影响的研究 被引量:3
9
作者 徐向华 朱杰 郭强 《声学学报》 EI CSCD 北大核心 2006年第1期42-47,共6页
提出一种利用自适应语料和训练语料对模型状态结构调整的算法。该算法在易混淆的状态间参数共享,提高了模型对样本的后验概率和对自适应语料的利用率,并间接地调整了系统决策树的结构。识别实验结果表明,在不同数量的自适应语句下,调整... 提出一种利用自适应语料和训练语料对模型状态结构调整的算法。该算法在易混淆的状态间参数共享,提高了模型对样本的后验概率和对自适应语料的利用率,并间接地调整了系统决策树的结构。识别实验结果表明,在不同数量的自适应语句下,调整后的系统识别率比基线系统获得了一致的提高,结合使用MLLR说话人自适应,调整的系统识别率平均提高了 15.60%,有效地减少了测试语料与训练语料决策树结构不匹配造成的系统识别率降低。 展开更多
关键词 说话人自适应 树结构 决策树 基线系统 结构调整 识别率 后验概率 mllr 语料 利用率
下载PDF
基于极大似然线性回归的模型合成和特征映射进行说话人确认 被引量:2
10
作者 陈存宝 赵力 邹采荣 《声学学报》 EI CSCD 北大核心 2011年第1期81-87,共7页
提出了基于极大似然线性回归(MLLR)调整的说话人模型合成和特征映射方法。MAP调整事后确定相应模型间线性关系,变换参数人为确定;而MLLR调整首先确定相应模型间线性关系,变换参数由训练数据确定,并且可以只调整均值向量。模型合成时,MLL... 提出了基于极大似然线性回归(MLLR)调整的说话人模型合成和特征映射方法。MAP调整事后确定相应模型间线性关系,变换参数人为确定;而MLLR调整首先确定相应模型间线性关系,变换参数由训练数据确定,并且可以只调整均值向量。模型合成时,MLLR调整指定通用信道背景模型参数间的线性变换;特征映射时,MLLR调整指定Root GMM-UBM与通用信道背景模型参数间的线性变换。通过对模型参数进行分组调整,可以在训练数据和参数数目间达成平衡。实验结果表明,合适选取MLLR回归类,可以取得比相应MAP调整方法更好的识别效果。 展开更多
关键词 模型参数 说话人确认 特征映射 线性回归 极大似然 合成 mllr 线性关系
下载PDF
语音识别自适应算法在智能家居中的应用 被引量:3
11
作者 蒋泰 张林军 《计算机系统应用》 2017年第3期150-155,共6页
在基于语音识别的智能家居中,用于训练的语料库不完备且应用场景复杂,自然语言语音识别错误接受率远远高于小词汇的语音识别的错误接受率.作者在设计与实现基于自然语言的语音识别智能家居系统的过程中,深入研究了MAP、MLLR算法在基于HM... 在基于语音识别的智能家居中,用于训练的语料库不完备且应用场景复杂,自然语言语音识别错误接受率远远高于小词汇的语音识别的错误接受率.作者在设计与实现基于自然语言的语音识别智能家居系统的过程中,深入研究了MAP、MLLR算法在基于HMM声学模型参数中的作用,提出了一种综合的自适应方法,并基于开源的语音识别工具CMU SPHIN最终完整的实现了该系统,结果表明所提出的自适应新算法可行有效,较好改善了系统在不同场景中的性能. 展开更多
关键词 语音识别 自适应 MAP mllr 智能家居 开源工具
下载PDF
说话人自适应训练方法在连续语音识别中的应用 被引量:1
12
作者 罗骏 欧智坚 王作英 《中文信息学报》 CSCD 北大核心 2004年第3期61-65,共5页
自适应技术在近年来得到越来越多的重视 ,其中应用广泛的包括MAP、MLLR ,该技术利用少量特定人数据就可以调整码本 ,快速地提升识别性能 ,它要求原始的码本有很好的说话人无关性。本文介绍了结合MLLR自适应的说话人自适应训练 (SpeakerA... 自适应技术在近年来得到越来越多的重视 ,其中应用广泛的包括MAP、MLLR ,该技术利用少量特定人数据就可以调整码本 ,快速地提升识别性能 ,它要求原始的码本有很好的说话人无关性。本文介绍了结合MLLR自适应的说话人自适应训练 (SpeakerAdaptiveTraining ,以下简称SAT)算法 ,这种方法将每个说话人码本视为说话人无关码本经过线性变换的结果 ,在此基础上训练的说话人无关码本更有效剔除了说话人相关信息 ,因此在说话人自适应中时能根据特定数据调整更好地逼近说话人特性 ,从而有更好的性能表现。 展开更多
关键词 计算机应用 中文信息处理 自适应 mllr SAT
下载PDF
说话人识别中语速鲁棒性研究
13
作者 朱紫阳 贺松 彭亚雄 《微型机与应用》 2016年第7期54-56,共3页
如今,说话人识别技术已经比较成熟,但依然有很多因素影响说话人识别系统的稳定性。本文针对说话速度对说话人识别的影响进行了一系列的研究工作。通过模型空间分布可视化和语音频谱观察两方面来分析不同语速语音的差距。然后,提出了最... 如今,说话人识别技术已经比较成熟,但依然有很多因素影响说话人识别系统的稳定性。本文针对说话速度对说话人识别的影响进行了一系列的研究工作。通过模型空间分布可视化和语音频谱观察两方面来分析不同语速语音的差距。然后,提出了最大似然线性回归(MLLR)和Constraint MLLR(CMLLR)的方法对模型和特征进行变换,使训练端和测试端的语音特征互相接近匹配。通过实验发现,MLLR和CMLLR能较好地提高说话人识别系统中语速鲁棒性。 展开更多
关键词 说话人识别 语速鲁棒 模型空间分布可视化 mllr Cmllr
下载PDF
基于数据模拟和HMM自适应的电话语音识别研究
14
作者 左国玉 刘文举 阮晓钢 《计算机工程与应用》 CSCD 北大核心 2003年第27期29-31,129,共4页
该文研究了基于数据模拟方法和HMM(隐马尔科夫模型)自适应的电话信道条件下语音识别问题。模拟数据模仿了纯净语音在不同电话信道条件下的语音行为。各基线系统的HMM模型分别由纯净语音和模拟语音训练而成。语音识别实验评估了各基线系... 该文研究了基于数据模拟方法和HMM(隐马尔科夫模型)自适应的电话信道条件下语音识别问题。模拟数据模仿了纯净语音在不同电话信道条件下的语音行为。各基线系统的HMM模型分别由纯净语音和模拟语音训练而成。语音识别实验评估了各基线系统HMM模型在采用MLLR算法(最大似然线性回归)做无监督式自适应前后的识别性能。实验证明,由纯净语音转换生成的模拟语音有效地减小了训练语音和测试语音声学性质的不匹配,很大程度上提高了电话语音识别率。基线模型的自适应结果显示模拟数据的自适应性能比纯净语音自适应的性能最大提高达到9.8%,表明了电话语音识别性能的进一步改善和系统稳健性的提高。 展开更多
关键词 数据模拟 电话语音识别 HMM自适应 mllr
下载PDF
基于高斯相似度分析的最大后验非线性变换HMM自适应算法
15
作者 刘海滨 吴镇扬 +1 位作者 赵力 曾毓敏 《应用科学学报》 CAS CSCD 2004年第4期433-437,共5页
由于训练环境和识别环境的失配,识别系统的性能会严重下降,为此提出了基于高斯相似度分析的最大后验概率非线性变换的环境自适应算法,它可以减小由于环境的失配所引起的系统性能的下降.在该算法中,首先将HMM模型中的高斯分量进行相似度... 由于训练环境和识别环境的失配,识别系统的性能会严重下降,为此提出了基于高斯相似度分析的最大后验概率非线性变换的环境自适应算法,它可以减小由于环境的失配所引起的系统性能的下降.在该算法中,首先将HMM模型中的高斯分量进行相似度分析并建立二叉树,然后根据数据自适应调整变换类数,在每一类内利用分段线性回归近似非线性变换将训练环境下的HMM变换到识别环境,减小环境的失配,变换参数的估计采用了最大后验概率估计(MAP).数字语音识别实验证明:该环境自适应算法的识别性能优于带有高斯相似度分析的MLST、MAPLR和MLLR等算法. 展开更多
关键词 相似度 自适应算法 最大后验概率 mllr HMM模型 二叉树 系统性能 失配 数字语音识别 高斯
下载PDF
说话人自适应技术在维吾尔语语音识别中的应用研究 被引量:4
16
作者 努尔麦麦提.尤鲁瓦斯 张力文 吾守尔.斯拉木 《中文信息学报》 CSCD 北大核心 2016年第3期79-84,共6页
该文针对维吾尔语说话人之间的发音差异会在一定程度上影响维吾尔语语音识别系统的性能这一情况研究了说话人自适应技术,将目前较为常用的MLLR和MAP以及MLLR和MAP相结合的自适应方法应用于维吾尔语连续语音识别的声学模型训练中,并用这... 该文针对维吾尔语说话人之间的发音差异会在一定程度上影响维吾尔语语音识别系统的性能这一情况研究了说话人自适应技术,将目前较为常用的MLLR和MAP以及MLLR和MAP相结合的自适应方法应用于维吾尔语连续语音识别的声学模型训练中,并用这三种方法自适应后的声学模型分别在测试集上进行识别实验。实验结果表明MLLR、MAP以及MAP+MLLR自适应方法使基线识别系统的单词错误识别率分别降低了0.6%、2.34%和2.57%。 展开更多
关键词 维吾尔语 语音识别 说话人自适应 mllr MAP
下载PDF
说话人模型参数自适应技术研究
17
作者 钱洪伟 贺苏宁 《电信技术研究》 2008年第5期16-22,共7页
说话人自适应技术是提高说话人无关语音识别系统性能的有效手段。本文主要介绍了说话人自适应技术中的模型参数自适应,并通过实验研究了最大似然线性回归(MLLR)和有约束的最大似然线性回归(CMLLR)算法。
关键词 说话人自适应 语音识别 mllr Cmllr
下载PDF
基于数据生成的手语识别自适应方法
18
作者 周宇 陈熙霖 +2 位作者 赵德斌 姚鸿勋 高文 《高技术通讯》 EI CAS CSCD 北大核心 2009年第12期1258-1264,共7页
采用自适应技术来解决非特定人手语识别问题,提出了一种基于数据生成的手语识别自适应方法。首先,对非特定人模型的均值向量进行自动聚类,寻找聚类中心生成手语词码本,然后,根据此码本选择词根子集,该子集能覆盖手语词码本的所有码字,继... 采用自适应技术来解决非特定人手语识别问题,提出了一种基于数据生成的手语识别自适应方法。首先,对非特定人模型的均值向量进行自动聚类,寻找聚类中心生成手语词码本,然后,根据此码本选择词根子集,该子集能覆盖手语词码本的所有码字,继而,使用新用户的词根子集数据通过遗传算法生成其它词根的数据,最后,结合词根子集的真实数据和其它词根的生成数据,利用最大似然线性回归(MLLR)和最大后验概率(MAP)算法对非特定人模型进行自适应。实验结果表明,该方法既能够降低所需要的自适应数据量,又能够在非特定人模型基础上取得识别正确率的大幅提高。 展开更多
关键词 手语识别 自适应 最大似然线性回归(mllr) 最大后验概率(MAP) 遗传算法
下载PDF
语音转换技术在电话语音识别中的应用研究(英文)
19
作者 左国玉 刘文举 阮晓钢 《系统仿真学报》 EI CAS CSCD 北大核心 2005年第2期448-452,456,共6页
提出了一种用语音转换技术改善电话语音识别性能的方法。通过模拟真实电话信道条件下影响语音质量的各种因素,实现由纯净语音到电话语音的转换。识别试验利用模拟电话语音评估了HMM识别器做MLLR自适应前后的性能。实验数据显示,自适应... 提出了一种用语音转换技术改善电话语音识别性能的方法。通过模拟真实电话信道条件下影响语音质量的各种因素,实现由纯净语音到电话语音的转换。识别试验利用模拟电话语音评估了HMM识别器做MLLR自适应前后的性能。实验数据显示,自适应前由转换语音训练的模型识别率比由纯净语音训练的模型识别率增加了18.9%,而自适应试验表明,由转换语音训练而成的模型在MLLR自适应后,系统识别性能进一步得到改善,识别率增加了5.8%。识别实验表明所提语音转换方法可以减小由于真实电话语料缺乏而造成训练语音和测试语音声学性质的不匹配,从而有效地改善电话语音识别系统的性能。 展开更多
关键词 语音转换 模拟电话语音 语音识别 mllr
下载PDF
基于三对角和共享分块对角转换矩阵的快速说话人自适应方法
20
作者 丁国宏 徐波 《电子学报》 EI CAS CSCD 北大核心 2004年第10期1709-1712,1719,共5页
本文提出了两种在最大似然线性回归 (MLLR)框架下实现快速说话人自适应的方法 .这两种方法在本文中分别称为Log 谱域下基于三对角转换矩阵的说话人自适应 (SATD)和倒谱域下基于共享分块对角转换矩孟加拉国说话人自适应 (SASBD) .这两种... 本文提出了两种在最大似然线性回归 (MLLR)框架下实现快速说话人自适应的方法 .这两种方法在本文中分别称为Log 谱域下基于三对角转换矩阵的说话人自适应 (SATD)和倒谱域下基于共享分块对角转换矩孟加拉国说话人自适应 (SASBD) .这两种方法在一定先验知识的基础上采用较少的参数来描述说话人间的差异 ,因而只需要少量的自适应数据就可以得到参数的鲁棒估计 .在以整词建模的孤立词识别系统和以三音子建模的孤立词识别系统上分别进行的测试表明所提出的方法相对传统的MLLR自适应方法有较快的自适应性能 . 展开更多
关键词 快速自适应 转换矩阵 mllr 三对角矩阵 分块对角矩阵
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部