期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
基于本征音子说话人子空间的说话人自适应算法 被引量:4
1
作者 屈丹 张文林 《电子与信息学报》 EI CSCD 北大核心 2015年第6期1350-1356,共7页
本征音子说话人自适应算法在自适应数据量充足时可以取得很好的自适应效果,但在自适应数据量不足时会出现严重的过拟合现象。为此该文提出一种基于本征音子说话人子空间的说话人自适应算法来克服这一问题。首先给出基于隐马尔可夫模型-... 本征音子说话人自适应算法在自适应数据量充足时可以取得很好的自适应效果,但在自适应数据量不足时会出现严重的过拟合现象。为此该文提出一种基于本征音子说话人子空间的说话人自适应算法来克服这一问题。首先给出基于隐马尔可夫模型-高斯混合模型(HMM-GMM)的语音识别系统中本征音子说话人自适应的基本原理。其次通过引入说话人子空间对不同说话人的本征音子矩阵间的相关性信息进行建模;然后通过估计说话人相关坐标矢量得到一种新的本征音子说话人子空间自适应算法。最后将本征音子说话人子空间自适应算法与传统说话人子空间自适应算法进行了对比。基于微软语料库的汉语连续语音识别实验表明,与本征音子说话人自适应算法相比,该算法在自适应数据量极少时能大幅提升性能,较好地克服过拟合现象。与本征音自适应算法相比,该算法以较小的性能牺牲代价获得了更低的空间复杂度而更具实用性。 展开更多
关键词 信号处理 说话人自适应 本征音 本征音子说话人子空间 低秩约束 本征音
下载PDF
基于正则化的本征音说话人自适应方法 被引量:9
2
作者 张文林 张连海 +2 位作者 牛铜 屈丹 李弼程 《自动化学报》 EI CSCD 北大核心 2012年第12期1950-1957,共8页
将正则化方法应用于本征音说话人自适应算法中,有效地解决了说话人子空间基的先验选择问题.通过对似然函数引入适当的正则项,在优化过程中从候选本征音基矢量中自动选择最佳的本征音进行线性组合.本文讨论了三种正则化因子,并给出了其... 将正则化方法应用于本征音说话人自适应算法中,有效地解决了说话人子空间基的先验选择问题.通过对似然函数引入适当的正则项,在优化过程中从候选本征音基矢量中自动选择最佳的本征音进行线性组合.本文讨论了三种正则化因子,并给出了其数学优化算法.l1正则化可以得到说话人因子的稀疏解,其非零项即对应最佳本征音基矢量;l2正则化可以提高解的稳健性,在某种程度上减少了子空间维数的先验选择对识别率的影响;而弹性网正则化则通过线性组合在二者之间取得折衷.有监督说话人自适应实验表明,新方法与本征音方法的最好结果相比,在少量的自适应数据条件下(10s以下),识别率相对提高了近1%~2%.三种方法中,l1正则化略优于l2正则化,而在引入弹性网正则化后,系统性能有了进一步提高. 展开更多
关键词 识别 说话人自适应 本征音 正则化 弹性网
下载PDF
语音识别中基于低秩约束的本征音子说话人自适应方法 被引量:3
3
作者 张文林 张连海 +1 位作者 陈琦 李弼程 《电子与信息学报》 EI CSCD 北大核心 2014年第4期981-987,共7页
该文提出一种基于低秩约束的本征音子(Eigenphone)说话人自适应方法。原始的本征音子说话人自适应方法在自适应语料充分时具有很好的效果,然而当自适应语料不足时,出现严重的过拟合现象,导致自适应后的系统可能比自适应前的系统还... 该文提出一种基于低秩约束的本征音子(Eigenphone)说话人自适应方法。原始的本征音子说话人自适应方法在自适应语料充分时具有很好的效果,然而当自适应语料不足时,出现严重的过拟合现象,导致自适应后的系统可能比自适应前的系统还要差。首先,对协方差矩阵为对角阵的隐马尔可夫-高斯混合模型语音识别系统,推导出一种简化的本征音子矩阵估计算法;然后,对本征音子矩阵引入低秩约束,采用矩阵的核范数作为矩阵秩的凸近似,通过调节核范数的权重因子以有效控制自适应模型的复杂度;最后,给出一种加速近点梯度算法以求解新算法中引入的带有核范数正则项的数学优化问题。汉语连续语音识别的说话人自适应实验表明,引入低秩约束后,本征音子说话人自适应方法的自适应效果得到了明显提高,在5~50 s的自适应数据条件下,均取得了比最大似然线性回归后接最大后验(MLLR+MAP)自适应更佳的识别效果。 展开更多
关键词 识别 说话人自适应 本征音 低秩约束 近点梯度法
下载PDF
特征空间本征音说话人自适应 被引量:4
4
作者 屈丹 杨绪魁 张文林 《自动化学报》 EI CSCD 北大核心 2015年第7期1244-1252,共9页
提出了特征空间本征音说话人自适应算法,该方法首先借鉴RATZ算法的思想,采用高斯混合模型对特征空间中的说话人信息进行建模;其次利用子空间方法实现对特征补偿项的估计,减少估计参数的数量,在对特征空间精确建模的同时,降低了算法对自... 提出了特征空间本征音说话人自适应算法,该方法首先借鉴RATZ算法的思想,采用高斯混合模型对特征空间中的说话人信息进行建模;其次利用子空间方法实现对特征补偿项的估计,减少估计参数的数量,在对特征空间精确建模的同时,降低了算法对自适应数据量的需求.基于微软语料库的中文连续语音识别实验表明,该算法在自适应数据量极少时仍能取得较好的性能,配合说话人自适应训练能够进一步降低词错误率,其实时性优于本征音说话人自适应算法. 展开更多
关键词 连续语识别 说话人自适应 多高斯倒谱规整 本征音
下载PDF
干扰空间投影在本征音说话人自适应中的应用
5
作者 刘建航 杨喜鹏 +2 位作者 李世宝 陈海华 黄庭培 《计算机应用与软件》 2017年第11期188-191,263,共5页
本征音自适应是一种快速高效的自适应算法,它被广泛应用到说话人识别中,但由于同一个说话人的本征音自适应的说话人因子之间的信道特征和噪声存在差异,导致了算法的识别精度降低。针对这一问题,提出基于干扰空间投影的本征音说话人识别(... 本征音自适应是一种快速高效的自适应算法,它被广泛应用到说话人识别中,但由于同一个说话人的本征音自适应的说话人因子之间的信道特征和噪声存在差异,导致了算法的识别精度降低。针对这一问题,提出基于干扰空间投影的本征音说话人识别(EV-NSP)算法。将训练语音通过主成分分析(PCA)方法计算得到干扰投影矩阵;将投影矩阵应用到生成本征音矢量算法中;利用最大似然估计算法自适应地得到说话人因子的估计值。实验结果表明,EV-NSP算法相对于传统的本征音自适应算法识别性能有了较大的提高。 展开更多
关键词 本征音自适应 干扰空间投影 主成分分析 信道失配
下载PDF
基于稀疏组LASSO约束的本征音子说话人自适应
6
作者 屈丹 张文林 《通信学报》 EI CSCD 北大核心 2015年第9期47-54,共8页
本征音子说话人自适应方法在自适应数据量不足时会出现严重的过拟合现象,提出了一种基于稀疏组LASSO约束的本征音子说话人自适应算法。首先给出隐马尔可夫—高斯混合模型下本征音子说话人自适应的基本原理;然后将稀疏组LASSO正则化引入... 本征音子说话人自适应方法在自适应数据量不足时会出现严重的过拟合现象,提出了一种基于稀疏组LASSO约束的本征音子说话人自适应算法。首先给出隐马尔可夫—高斯混合模型下本征音子说话人自适应的基本原理;然后将稀疏组LASSO正则化引入到本征音子说话人自适应,通过调整权重因子控制模型的复杂度,并通过一种加速近点梯度的数学优化算法来实现;最后将稀疏组LASSO约束的自适应算法与当前多种正则化约束的自适应方法进行比较。汉语连续语音识别的说话人自适应实验表明,引入稀疏组LASSO约束后,本征音子说话人自适应方法的性能得到了明显提高,且稀疏组LASSO约束方法优于l1、l2和弹性网正则化方法。 展开更多
关键词 说话人自适应 本征音 组稀疏约束 稀疏组LASSO约束 近点梯度法
下载PDF
基于本征音因子分析的短时说话人识别 被引量:3
7
作者 潘镭 郭武 +1 位作者 李轶杰 戴礼荣 《数据采集与处理》 CSCD 北大核心 2009年第4期449-452,共4页
提出了一种基于本征音因子分析的文本无关的说话人识别方法。它解决了训练语音与测试语音均很短的情况下,传统的基于最大后验概率准则的混合高斯模型无法建立稳定的说话人模型问题。首先利用期望最大化算法在开发集上训练出说话人的本... 提出了一种基于本征音因子分析的文本无关的说话人识别方法。它解决了训练语音与测试语音均很短的情况下,传统的基于最大后验概率准则的混合高斯模型无法建立稳定的说话人模型问题。首先利用期望最大化算法在开发集上训练出说话人的本征音载荷矩阵,在说话人模型建模时通过将短时语音数据向本征音空间的降维映射来得到模型参数。实验结果表明,在NIST SRE 2006数据库中的10 s训练语音-10 s测试语音任务中,在传统的混合高斯模型的基线系统上,通过采用本征音因子分析的方法可以使系统等错误率降低18%。 展开更多
关键词 本征音 本征信道 说话人确认
下载PDF
基于相关子空间本征音分析的MAP快速自适应 被引量:2
8
作者 罗骏 欧智坚 王作英 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第6期829-832,共4页
本征音自适应是一种快速自适应算法 ,它根据对说话人矢量全空间的本征分析指导参数更新。该文提出一种基于子空间分析的本征音自适应算法 ,并且不同于一般本征音自适应采用最大似然准则的做法 ,该算法用最大后验准则以更好地估计参数。... 本征音自适应是一种快速自适应算法 ,它根据对说话人矢量全空间的本征分析指导参数更新。该文提出一种基于子空间分析的本征音自适应算法 ,并且不同于一般本征音自适应采用最大似然准则的做法 ,该算法用最大后验准则以更好地估计参数。实验证明 ,在仅有 1句自适应数据的情况下它即能取得 6 .4 5 %的相对误识率下降 ,自适应速度远快于传统的最大后验方法 ,也不存在最大似然线性回归方法在极少数据量情况下反而造成系统识别性能下降的现象。结果表明该方法并不明显依赖相关子空间的划分数量 。 展开更多
关键词 信息处理 识别 快速自适应 本征音 最大似然 最大后验 相关子空间
原文传递
一种新的基于子空间的说话人自适应方法 被引量:3
9
作者 张文林 张卫强 +2 位作者 刘加 李弼程 屈丹 《自动化学报》 EI CSCD 北大核心 2011年第12期1495-1502,共8页
提出了一种新的基于子空间的快速说话人自适应方法.该方法在本征音(Eigen-voice,EV)自适应方法基础上,进一步在音子空间寻找低维子空间,得到更为紧凑的"说话人–音子"联合子空间.该子空间不仅包含了说话人间的模型参数相关性... 提出了一种新的基于子空间的快速说话人自适应方法.该方法在本征音(Eigen-voice,EV)自适应方法基础上,进一步在音子空间寻找低维子空间,得到更为紧凑的"说话人–音子"联合子空间.该子空间不仅包含了说话人间的模型参数相关性信息,而且对音子间的模型参数相关性信息也进行了显式建模,在大大降低模型存储量的同时更为全面地反映模型参数的先验信息.在基于连续语音识别的无监督自适应实验中,在少量的自适应数据条件下,新方法取得了比最大似然线性回归和聚类最大似然线性基方法更好的效果. 展开更多
关键词 连续语识别 说话人自适应 本征音 本征音
下载PDF
说话人识别中的因子分析以及空间拼接 被引量:14
10
作者 郭武 李轶杰 +1 位作者 戴礼荣 王仁华 《自动化学报》 EI CSCD 北大核心 2009年第9期1193-1198,共6页
联合因子分析可以有效拟合混合高斯模型中的说话人和信道差异,在说话人识别中得到广泛应用.一般情况下,该算法在对说话人和信道两个载荷矩阵进行联合估计时,说话人残差矩阵无法发挥作用,信道载荷矩阵的因子数不能提高.本文提出说话人载... 联合因子分析可以有效拟合混合高斯模型中的说话人和信道差异,在说话人识别中得到广泛应用.一般情况下,该算法在对说话人和信道两个载荷矩阵进行联合估计时,说话人残差矩阵无法发挥作用,信道载荷矩阵的因子数不能提高.本文提出说话人载荷矩阵、说话人残差载荷矩阵采用串行的训练模式,在信道载荷矩阵训练中采用矩阵拼接的方法,能够有效提高识别率;在NIST SRE 2008年核心测试数据库的五个部分分别达到等错误率3.3%,5.1%,5.0%,5.3%和5.0%. 展开更多
关键词 说话人识别 联合因子分析 本征音因子 说话人确认 期望最大化
下载PDF
基于最大似然可变子空间的快速说话人自适应方法 被引量:3
11
作者 张文林 牛铜 +1 位作者 张连海 李弼程 《电子与信息学报》 EI CSCD 北大核心 2012年第3期571-575,共5页
该文提出一种基于最大似然可变子空间的说话人自适应方法。在训练阶段,对训练集中的说话人相关模型参数进行主分量分析,得到一组说话人基矢量;在自适应阶段,通过最大似然准则选取与当前说话人相关性最大的基矢量子集,进而将新的说话人... 该文提出一种基于最大似然可变子空间的说话人自适应方法。在训练阶段,对训练集中的说话人相关模型参数进行主分量分析,得到一组说话人基矢量;在自适应阶段,通过最大似然准则选取与当前说话人相关性最大的基矢量子集,进而将新的说话人相关模型限制在这组基矢量所张成的说话人子空间中,通过求解每一个基矢量对应的系数从而进行说话人自适应。与经典的基于子空间的说话人自适应方法不同,该文中的说话人子空间是在自适应阶段动态选取的,所需要估计的参数更少,在少量自适应数据下可以得到更稳健的自适应结果。在基于微软语料库的连续语音识别自适应实验中,给定极少量自适应数据(小于5 s),在有监督和无监督条件下,该文方法均优于经典的本征音自适应方法和基于最大似然线性回归的方法。 展开更多
关键词 连续语识别 说话人自适应 本征音 子空间方法
下载PDF
说话人识别中的串行因子分析 被引量:2
12
作者 郭武 戴礼荣 王仁华 《模式识别与人工智能》 EI CSCD 北大核心 2009年第4期514-518,共5页
在基于因子分析的说话人识别中,提出串行训练载荷矩阵的方法.在载荷矩阵训练中,采用串行的方式训练得到说话人因子矩阵、对角阵(残差矩阵)和信道空间矩阵.在说话人注册中,将以上3个载荷矩阵拼接,采用联合估计的方法得到每个说话人的因子... 在基于因子分析的说话人识别中,提出串行训练载荷矩阵的方法.在载荷矩阵训练中,采用串行的方式训练得到说话人因子矩阵、对角阵(残差矩阵)和信道空间矩阵.在说话人注册中,将以上3个载荷矩阵拼接,采用联合估计的方法得到每个说话人的因子.采用这种策略可有效解决因子分析中的饱和问题.在NISTSRE2006年核心测试数据库上等错误率能达到3.65%. 展开更多
关键词 说话人识别 联合因子分析 本征音因子 等错误率(EER)
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部