期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
Towards Realizing Mandarin-Tibetan Bi-lingual Emotional Speech Synthesis with Mandarin Emotional Training Corpus
1
作者 Peiwen Wu Hongwu Yang Zhenye Gan 《国际计算机前沿大会会议论文集》 2017年第2期29-32,共4页
This paper presents a method of hidden Markov model (HMM)-based Mandarin-Tibetan bi-lingual emotional speech synthesis by speaker adaptive training with a Mandarin emotional speech corpus.A one-speaker Tibetan neutral... This paper presents a method of hidden Markov model (HMM)-based Mandarin-Tibetan bi-lingual emotional speech synthesis by speaker adaptive training with a Mandarin emotional speech corpus.A one-speaker Tibetan neutral speech corpus, a multi-speaker Mandarin neutral speech corpus and a multi-speaker Mandarin emotional speech corpus are firstly employed to train a set of mixed language average acoustic models of target emotion by using speaker adaptive training.Then a one-speaker Mandarin neutral speech corpus or a one-speaker Tibetan neutral speech corpus is adopted to obtain a set of speaker dependent acoustic models of target emotion by using the speaker adap-tation transformation. The Mandarin emotional speech or the Tibetan emotional speech is finally synthesized from Mandarin speaker depen-dent acoustic models of target emotion or Tibetan speaker dependent acoustic models of target emotion. Subjective tests show that the aver-age emotional mean opinion score is 4.14 for Tibetan and 4.26 for Mandarin. The average mean opinion score is 4.16 for Tibetan and 4.28 for Mandarin. The average degradation opinion score is 4.28 for Tibetan and 4.24 for Mandarin. Therefore, the proposed method can synthesize both Tibetan speech and Mandarin speech with high naturalness and emotional expression by using only Mandarin emotional training speech corpus. 展开更多
关键词 Mandarin-Tibetan cross-lingual EMOTIONAL SPEECH SYNTHESIS hidden Markov model (HMM) speaker adaptive training Mandarin-Tibetan cross-lingual SPEECH SYNTHESIS EMOTIONAL SPEECH SYNTHESIS
下载PDF
基于Online-GRU信道预测的星上自适应功率控制方法
2
作者 施文军 朱立东 《太赫兹科学与电子信息学报》 2024年第3期261-268,共8页
针对传统卫星功率控制方法存在资源浪费、时延长的问题,提出一种基于在线-门控循环单元(Online-GRU)信道预测的星上自适应功率控制方法,通过在线训练更新网络参数来解决离线预测算法存在的累积误差的问题。仿真结果表明,提出的在线训练... 针对传统卫星功率控制方法存在资源浪费、时延长的问题,提出一种基于在线-门控循环单元(Online-GRU)信道预测的星上自适应功率控制方法,通过在线训练更新网络参数来解决离线预测算法存在的累积误差的问题。仿真结果表明,提出的在线训练算法比离线算法预测精确度提升了38.30%,相比在线-长短期记忆网络(Online-LSTM)节约了63.21%的训练时间;提出的自适应功率控制方法比固定发射功率的方法节约了55.74%的发射功率;同时,相比基于地面定时反馈信道状态的自适应功率控制方法具备更好的鲁棒性。 展开更多
关键词 星上自适应功率控制 在线训练 在线-门控循环单元 信道预测
下载PDF
Experimental Study of Discriminative Adaptive Training and MLLR for Automatic Pronunciation Evaluation 被引量:3
3
作者 宋寅 梁维谦 《Tsinghua Science and Technology》 SCIE EI CAS 2011年第2期189-193,共5页
A stronger canonical model was developed to improve the performance of automatic pronunciation evaluations. Three different strategies were investigated with speaker adaptive training to normalize variations among spe... A stronger canonical model was developed to improve the performance of automatic pronunciation evaluations. Three different strategies were investigated with speaker adaptive training to normalize variations among speakers, minimum phone error training to identify easily confused phones and maximum likelihood linear regression (MLLR) adaptation to compensate for accent variations between native and non-native speakers. The three schemes were combined to improve the correlation coefficient between machine scores and human scores from 0.651 to 0.679 on the sentence level and from 0.788 to 0.822 on the speaker level. 展开更多
关键词 discriminative adaptive training (DAT) speaker adaptive training (sat minimum phone error(MPE) automatic pronunciation evaluation (APE)
原文传递
LVCSR系统中一种基于区分性和自适应瓶颈深度置信网络的特征提取方法 被引量:9
4
作者 陈雷 杨俊安 +1 位作者 王一 王龙 《信号处理》 CSCD 北大核心 2015年第3期290-298,共9页
大词汇量连续语音识别系统中,为了进一步增强网络的鲁棒性、提升瓶颈深度置信网络的识别准确率,本文提出一种基于区分性和自适应瓶颈深度置信网络的特征提取方法。该方法首先使用鲁棒性较强的瓶颈深度置信网络进行初步特征提取,进而进... 大词汇量连续语音识别系统中,为了进一步增强网络的鲁棒性、提升瓶颈深度置信网络的识别准确率,本文提出一种基于区分性和自适应瓶颈深度置信网络的特征提取方法。该方法首先使用鲁棒性较强的瓶颈深度置信网络进行初步特征提取,进而进行区分性训练,使网络的区分性更强、识别准确率更高,在此基础上引入说话人自适应技术对网络进行调整,提高系统的鲁棒性。本文利用提出的声学特征在多个噪声较强、主题风格较为随意的多个公共连续语音数据库上进行了测试,识别准确率取得了6.9!的提升。实验结果表明所提出的特征提取方法相对于传统方法的优越性。 展开更多
关键词 连续语音识别 瓶颈深度置信网络 区分性训练 说话人自适应
下载PDF
普通话发音错误自动检测技术 被引量:3
5
作者 张峰 黄超 戴礼荣 《中文信息学报》 CSCD 北大核心 2010年第2期110-115,共6页
统计语音识别框架是现在发音错误检测系统的主流框架,而声学模型则是统计语音识别的基础。该文一方面为了获得对于发音错误检测更好的声学模型,引入了说话人自适应训练(SAT)和选择性最大似然线性回归(SMLLR)技术;另一方面,由于字发音检... 统计语音识别框架是现在发音错误检测系统的主流框架,而声学模型则是统计语音识别的基础。该文一方面为了获得对于发音错误检测更好的声学模型,引入了说话人自适应训练(SAT)和选择性最大似然线性回归(SMLLR)技术;另一方面,由于字发音检错中存在严重的信息量不足问题和专家对于不同水平说话人的评价标注不一样,在后端上加入了话者得分归一化技术。在包含40个不同水平说话人的8 000个字的数据库上的实验结果表明,文中提出的方法有效的提高了系统性能,召回率为30%时,正确率从45.8%升到了53.6%,召回率为10%时,正确率从64.6%升到了79.9%。 展开更多
关键词 计算机应用 中文信息处理 发音错误自动检错 说话人自适应训练 选择性最大似然线性回归 话者归 一化
下载PDF
一种改进的音段声码器编码方法 被引量:2
6
作者 邓昊 李双田 成少锋 《信号处理》 CSCD 2003年第5期448-452,共5页
本文以一种定速率音段声码器采用的分段算法为基础,提出了一种以随机码本作为初始码本结合“联合分段量化法”的码本训练方法,改进了基音轨迹的表示方法,并验证了一种说话人自适应方法的效果。
关键词 音段声码器 分段算法 编码方法 甚速率语音编码算法 基音轨迹
下载PDF
应用MAP方差估计的话者自适应训练方法
7
作者 黄盈椿 王欢良 冯涛 《计算机工程》 EI CAS CSCD 北大核心 2006年第20期203-204,212,共3页
近年来话者自适应训练(SAT)方法日益受到重视。然而在实际中此方法通常因为部分方差的估计失误而导致识别性能下降。该文提出了一种应用最大后验概率(MAP)估计方差的全新SAT方法,它能够根据后验概率动态地调整模型的方差,从而解决上述... 近年来话者自适应训练(SAT)方法日益受到重视。然而在实际中此方法通常因为部分方差的估计失误而导致识别性能下降。该文提出了一种应用最大后验概率(MAP)估计方差的全新SAT方法,它能够根据后验概率动态地调整模型的方差,从而解决上述问题。在Switchboard数据库上的实验显示,新方法能够显著地提高识别性能,并且有效地提升系统的稳定性。 展开更多
关键词 语音识别 话者自适应 话者自适应训练 MAP
下载PDF
基于话者无关模型的说话人转换方法
8
作者 陈凌辉 凌震华 戴礼荣 《模式识别与人工智能》 EI CSCD 北大核心 2013年第3期254-259,共6页
提出一种基于话者无关模型的说话人转换方法.考虑到音素信息共同存在于所有说话人的语音中,假设存在一个可以用高斯混合模型来描述的话者无关空间,且可用分段线性变换来描述该空间到各说话人相关空间之间的映射关系.在一个多说话人的数... 提出一种基于话者无关模型的说话人转换方法.考虑到音素信息共同存在于所有说话人的语音中,假设存在一个可以用高斯混合模型来描述的话者无关空间,且可用分段线性变换来描述该空间到各说话人相关空间之间的映射关系.在一个多说话人的数据库上,用话者自适应训练算法来训练模型,并在转换阶段使用源目标说话人空间到话者无关空间的变换关系来构造源与目标之间的特征变换关系,快速、灵活的构造说话人转换系统.通过主观测听实验来验证该算法相对于传统的基于话者相关模型方法的优点. 展开更多
关键词 说话人转换 话者无关模型 高斯混合模型 话者自适应训练
下载PDF
一种适用于远程电话音识别的自适应建模方法(英文)
9
作者 陈大为 吴朝晖 杨莹春 《广西师范大学学报(自然科学版)》 CAS 2003年第A01期185-190,共6页
在大多数的说话人识别系统中,需要首先建立一个说话人无关的模型,这种模型成为全局模型.然后在实际应用中,采取某种自适应的算法来修改此模型.采取这种说话人无关模型的一个不利之处在于性能会随着应用环境和训练环境差异的增大而大幅... 在大多数的说话人识别系统中,需要首先建立一个说话人无关的模型,这种模型成为全局模型.然后在实际应用中,采取某种自适应的算法来修改此模型.采取这种说话人无关模型的一个不利之处在于性能会随着应用环境和训练环境差异的增大而大幅度降低.为了修补这种差异,就需要较长的训练时间,使得这种方法不利于比较实时的应用,比如通过电话进行远程说话人识别,在这种情况中需要较快的响应速度.本文中提出了一个利用全局模型并能适用于远程说话人识别的方法.基本思路就是在进行识别时利用以前的模型,然后再系统空闲时采取了一个改进的自适应算法快速重建全局模型.试验结果证明了这种方法是可行的. 展开更多
关键词 说话人识别 自适应建模 训练
下载PDF
基于说话人自适应训练的汉藏双语语音合成 被引量:5
10
作者 王海燕 杨鸿武 +1 位作者 甘振业 裴东 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第6期776-780,共5页
根据藏语和汉语在发音上的相似性,提出了一种基于隐Markov模型(hidden Markov model,HMM)的汉藏双语语音合成方法。以声韵母为合成基元,采用多个普通话说话人和1个藏语说话人的语料库,利用说话人自适应训练,获得一个汉藏双语混合语言的... 根据藏语和汉语在发音上的相似性,提出了一种基于隐Markov模型(hidden Markov model,HMM)的汉藏双语语音合成方法。以声韵母为合成基元,采用多个普通话说话人和1个藏语说话人的语料库,利用说话人自适应训练,获得一个汉藏双语混合语言的平均音模型。通过说话人自适应变换,从混合语言的平均音模型获得普通话或藏语的说话人相关模型,从而合成出普通话或藏语语音。实验结果表明,在藏语训练语句较少的情况下,该方法合成的藏语语音明显优于仅采用说话人相关模型合成的藏语语音。 展开更多
关键词 语音合成 隐Markov模型(HMM) 说话人自适应训练 多语种语音合成 藏语语音合成 汉藏双语语音合成
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部