期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
Trainable unit selection speech synthesis under statistical framework 被引量:1
1
作者 WANG RenHua DAI LiRong LING ZhenHua HU Yu 《Chinese Science Bulletin》 SCIE EI CAS 2009年第11期1963-1969,共7页
This paper proposes a trainable unit selection speech synthesis method based on statistical modeling framework. At training stage, acoustic features are extracted from the training database and statistical models are ... This paper proposes a trainable unit selection speech synthesis method based on statistical modeling framework. At training stage, acoustic features are extracted from the training database and statistical models are estimated for each feature. During synthesis, the optimal candidate unit sequence is searched out from the database following the maximum likelihood criterion derived from the trained models. Finally, the waveforms of the optimal candidate units are concatenated to produce synthetic speech. Experiment results show that this method can improve the automation of system construction and naturalness of synthetic speech effectively compared with the conventional unit selection synthe-sis method. Furthermore, this paper presents a minimum unit selection error model training criterion according to the characteristics of unit selection speech synthesis and adopts discriminative training for model parameter estimation. This criterion can finally achieve the full automation of system con-struction and improve the naturalness of synthetic speech further. 展开更多
关键词 语音合成 训练模式 建模框架 单位 统计 自动化系统 模型参数估计 合成语音
原文传递
Experimental Georgian Speech Synthesizer Part 1 Structure of Synthesizer
2
作者 Alexander Vashalomidze 《Journal of Mathematics and System Science》 2013年第6期289-300,共12页
The term "Experimental" in the title means, that the synthesizer is constructed as tool to conduct experiments, for investigating the influence of environment of unit on sounding of it. Synthesizer as tool for testi... The term "Experimental" in the title means, that the synthesizer is constructed as tool to conduct experiments, for investigating the influence of environment of unit on sounding of it. Synthesizer as tool for testing of hypotheses and results of experiments, satisfy three conditions: independence from the selection of unit for the synthesis (word or any part of it); taking into account the environment of unit (left and right hand contexts and position of unit); independence from the content of base. Such synthesizer is a good tool for studying many aspects of speech and removes the problem of selection. We can vary the unit and other parameters, described in paper, by the same synthesizer, synthesize the same text and listen to the results directly. This paper describes the formal structure of experimental Georgian speech synthesizer. 展开更多
关键词 speech synthesis interchangeable units adequate covering optimal covering.
下载PDF
A Synthesis Instance Pruning Approach Based on Virtual Non-uniform Replacements
3
作者 张巍 凌震华 +1 位作者 胡国平 王仁华 《Tsinghua Science and Technology》 SCIE EI CAS 2008年第4期515-521,共7页
The employment of non-uniform processes assists greatly in the corpus-based text-to-speech (TTS) system to synthesize natural speech. However, tailoring a TTS voice font, or pruning redundant synthesis instances, us... The employment of non-uniform processes assists greatly in the corpus-based text-to-speech (TTS) system to synthesize natural speech. However, tailoring a TTS voice font, or pruning redundant synthesis instances, usually results in loss of non-uniform synthesis instances. In order to solve this problem, we propose the concept of virtual non-uniform instances. According to this concept and the synthesis frequency of each instance, the algorithm named StaRp-VPA is constructed to make up for the loss of nonuniform instances. In experimental testing, the naturalness scored by the mean opinion score (MOS) remains almost unchanged when less than 50% instances are pruned, and the MOS is only slightly degraded for reduction rates above 50%. The test results show that the algorithm StaRp-VPA is effective. 展开更多
关键词 text-to-speech system speech synthesis synthesis instance pruning non-uniform unit
原文传递
基于声学统计建模的语音合成技术研究 被引量:9
4
作者 胡郁 凌震华 +1 位作者 王仁华 戴礼荣 《中文信息学报》 CSCD 北大核心 2011年第6期127-136,共10页
该文介绍基于声学统计建模的语音合成技术,重点回顾中国科学技术大学讯飞语音实验室在语音合成领域这一前沿发展方向的创新性工作成果。具体包括:融合发音动作参数与声学参数,提高声学参数生成的灵活性;以最小生成误差准则取代最大似然... 该文介绍基于声学统计建模的语音合成技术,重点回顾中国科学技术大学讯飞语音实验室在语音合成领域这一前沿发展方向的创新性工作成果。具体包括:融合发音动作参数与声学参数,提高声学参数生成的灵活性;以最小生成误差准则取代最大似然准则,提高合成语音的音质;使用单元挑选与波形拼接方法取代参数合成器重构,改善参数语音合成器在合成语音音质上的不足。以上技术创新使得语音合成系统在自然度、表现力、灵活性及多语种应用等方面的性能都有进一步的提升,并推动语音合成技术在呼叫中心信息服务、移动嵌入式设备人机语音交互、智能语音教学等领域的广泛引用。 展开更多
关键词 语音合成 隐马尔可夫模型 参数合成 单元挑选
下载PDF
汉语文语转换系统(TTS) 被引量:8
5
作者 谌卫军 李建民 +1 位作者 林福宗 张钹 《计算机工程与应用》 CSCD 北大核心 2000年第9期1-3,共3页
文章讨论了一个典型的汉语文语转换系统的实现。首先介绍了系统的整体框架及其各个功能模块,然后分析了系统的特点及其存在的问题,最后从两方面讨论了改进系统的具体思路:提出了一种简单而有效的基音周期提取算法,验证了上下文环境... 文章讨论了一个典型的汉语文语转换系统的实现。首先介绍了系统的整体框架及其各个功能模块,然后分析了系统的特点及其存在的问题,最后从两方面讨论了改进系统的具体思路:提出了一种简单而有效的基音周期提取算法,验证了上下文环境在提高合成语音自然度中的作用。 展开更多
关键词 汉语文语转换系统 语音自然度 标音处理 单音字
下载PDF
藏语语音合成单元选择 被引量:5
6
作者 才让卓玛 李永明 才智杰 《软件学报》 EI CSCD 北大核心 2015年第6期1409-1420,共12页
基于语料库的语音合成是国内外应用广泛的语音合成方法.在这种合成方法中,单元选择是语音合成的关键.通过分析藏语言文字的属性特征,设计了藏语语音合成系统模型,提出以构件、组合构件、字、词及句单元相融合的藏语语音合成方法,有效地... 基于语料库的语音合成是国内外应用广泛的语音合成方法.在这种合成方法中,单元选择是语音合成的关键.通过分析藏语言文字的属性特征,设计了藏语语音合成系统模型,提出以构件、组合构件、字、词及句单元相融合的藏语语音合成方法,有效地保留了语音合成中大单元的完整性和小单元的灵活性与鲁棒性.同时,给出语音合成的单元选择策略与算法.实验数据表明:该策略与算法是有效和合理的,所选择的单元在封闭语料和开放语料上的覆盖率均达到预期目标. 展开更多
关键词 语音合成单元选择 构件 组合构件 音素
下载PDF
基于共振峰合成和韵律调整的语音验证码方法研究 被引量:4
7
作者 汪成亮 张玉维 《计算机应用研究》 CSCD 北大核心 2011年第7期2458-2461,共4页
为了提高语音验证技术的有效性,提出了一种基于共振峰合成、修改时长和调节韵律的随机语音验证码生成方法。该方法选择音素作为语音合成单元,基于规则在合成过程中设定随机语速参数,以及调整单元之间的连接规则来实现韵律的随机调整,使... 为了提高语音验证技术的有效性,提出了一种基于共振峰合成、修改时长和调节韵律的随机语音验证码生成方法。该方法选择音素作为语音合成单元,基于规则在合成过程中设定随机语速参数,以及调整单元之间的连接规则来实现韵律的随机调整,使得语速和韵律具有不确定性和不可预测性,从而有效降低了自动语音识别技术(ASR)对语音码的识别率,增强了语音验证码的抗攻击性。合成的语音验证码的人耳识别率达到了90%左右,ASR的识别率为28.8%,主观平均判分(MOS)为4分,语音码的可懂度和清晰度达到了满意的效果。实验结果验证了所提方法的可行性。 展开更多
关键词 语音合成 验证码 共振峰合成 韵律调整 时长规整
下载PDF
多基元及韵律参数匹配的维吾尔语语音合成方法 被引量:3
8
作者 姑丽加玛丽·麦麦提艾力 艾斯卡尔·肉孜 艾斯卡尔·艾木都拉 《计算机工程与应用》 CSCD 2012年第2期116-118,共3页
音节是维吾尔语的最小发音单元,所以大部分维吾尔语语音合成系统以音节作为基本的合成单元,但维吾尔语中音节数量很大,语料库很难保证覆盖所有的音节样本,这会导致合成语音不稳定和不连续。为解决合成语音不稳定的情况,提出了结合单音... 音节是维吾尔语的最小发音单元,所以大部分维吾尔语语音合成系统以音节作为基本的合成单元,但维吾尔语中音节数量很大,语料库很难保证覆盖所有的音节样本,这会导致合成语音不稳定和不连续。为解决合成语音不稳定的情况,提出了结合单音素和三音素两个不同基元的单元挑选算法。通过在单元挑选模块中加入韵律参数相匹配的方法选出最佳韵律匹配的单元并解决了合成语音不连续的情况。实验结果表明,提出的方法有效地解决了合成语音不稳定和不连续的现象,从而提高了合成语音的自然度。 展开更多
关键词 维吾尔语音合成 单音素 三音素 韵律参数模型 单元挑选
下载PDF
基于共振峰过渡的协同发音语音合成算法 被引量:2
9
作者 康广玉 郭世泽 孙圣和 《天津大学学报》 EI CAS CSCD 北大核心 2010年第9期810-814,共5页
协同发音是音素在语流中受前后音素的影响,而使2个以上音素的发音特征同时出现的现象.大语料库语音拼接算法获得的语音合成效果最好,但录制语料困难、算法复杂、耗费时间,需要占用很大的存储空间,在应用中存在困难.为此,针对小语料库语... 协同发音是音素在语流中受前后音素的影响,而使2个以上音素的发音特征同时出现的现象.大语料库语音拼接算法获得的语音合成效果最好,但录制语料困难、算法复杂、耗费时间,需要占用很大的存储空间,在应用中存在困难.为此,针对小语料库语音合成,提出参数修改和波形拼接相结合的语音合成方法,通过参数修改方法合成协同发音段,再与自然语音进行波形拼接.实验表明,该算法合成的语音效果较好,而且对语料库内容要求较低. 展开更多
关键词 语音合成 协同发音 共振峰 基频轨迹
下载PDF
TTS系统中基于双音素的基元选择方法 被引量:1
10
作者 杨玉红 胡瑞敏 +1 位作者 徐正全 艾浩军 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2002年第1期94-97,共4页
为寻求能较好解决音节内和音节间的协同发音单元方案 ,提出了采用类似英文文语转换系统中使用的双音素作为合成单元方案 ,并根据普通话语音中只包含 410个全音节特点 ,进一步完善了双音素在汉语中的应用。试验结果表明 ,该方案包含了连... 为寻求能较好解决音节内和音节间的协同发音单元方案 ,提出了采用类似英文文语转换系统中使用的双音素作为合成单元方案 ,并根据普通话语音中只包含 410个全音节特点 ,进一步完善了双音素在汉语中的应用。试验结果表明 ,该方案包含了连续语流中的所有过渡音征 ,使合成语音转接流畅、自然。 展开更多
关键词 TTS系统 双音素 基元选择 汉语语音合成 拼接单元 文语转换
下载PDF
基于声学统计建模的新一代语音合成技术 被引量:1
11
作者 王仁华 戴礼荣 +1 位作者 胡郁 凌震华 《中国科学技术大学学报》 CAS CSCD 北大核心 2008年第7期725-734,共10页
介绍基于声学统计建模的新一代语音合成技术.重点介绍中国科学技术大学讯飞语音实验室在发展新一代语音合成技术中的贡献,包括:融合发音器官参数与声学参数,提高声学参数生成的灵活性;以最小生成误差准则取代最大似然准则,提高合成语音... 介绍基于声学统计建模的新一代语音合成技术.重点介绍中国科学技术大学讯飞语音实验室在发展新一代语音合成技术中的贡献,包括:融合发音器官参数与声学参数,提高声学参数生成的灵活性;以最小生成误差准则取代最大似然准则,提高合成语音的音质;使用单元挑选与波形拼接方法取代参数合成器重构,从根本上改善HMM参数语音合成器在合成语音音质上的不足.这些技术创新使得新一代语音合成在自然度、表现力、灵活性及多语种实现等方面的性能都有进一步的提升. 展开更多
关键词 语音合成 隐马尔可夫模型 参数合成 单元挑选
下载PDF
Klatt共振峰合成器的实时化研究 被引量:2
12
作者 赵小杰 谢咏圭 《北京师范大学学报(自然科学版)》 CAS CSCD 1994年第2期212-216,共5页
介绍了Klatt共振峰合成器利用串-并联通道模拟清-浊音的优点和对汉语应用的前景,给出了合成器的结构原理。从实时研究的必要性出发,采用由高速数字信号处理器芯片TMS320C30与PC机构成的主从系统实时实现了Klat... 介绍了Klatt共振峰合成器利用串-并联通道模拟清-浊音的优点和对汉语应用的前景,给出了合成器的结构原理。从实时研究的必要性出发,采用由高速数字信号处理器芯片TMS320C30与PC机构成的主从系统实时实现了Klatt合成器。该合成器达到了实时、音质好的目标,并已应用于汉语文语转换系统的研制中。 展开更多
关键词 共振峰 实时合成 文语转换 合成器
下载PDF
基于语料库的藏语语音合成单元选择算法 被引量:2
13
作者 才让卓玛 才智杰 《中文信息学报》 CSCD 北大核心 2017年第5期59-63,共5页
在基于语料库的语音合成方法中,语音合成单元选择的优劣直接影响合成语音的自然度和流畅性。该文针对藏语言文字的特点,提出以基本构件、组合构件、字、词及句单元相融合的混合单元语音合成策略,并提出了藏语语音合成混合单元选择算法... 在基于语料库的语音合成方法中,语音合成单元选择的优劣直接影响合成语音的自然度和流畅性。该文针对藏语言文字的特点,提出以基本构件、组合构件、字、词及句单元相融合的混合单元语音合成策略,并提出了藏语语音合成混合单元选择算法。主观评价与客观评测数据表明该策略与算法有效和合理,各类合成单元在开放语料上的覆盖率与语音合成效果均达到预期的目标。 展开更多
关键词 语音合成 单元选择 基本构件 组合构件
下载PDF
基于韵律匹配代价和韵律拼接代价的汉语语音合成 被引量:1
14
作者 张鹏 王琳 刘胜 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2006年第11期2006-2008,共3页
为了进一步提高汉语语音合成的自然度,通过对汉语语音合成技术的分析与对比,确定了以汉语音节作为拼接的合成基元,采用韵律匹配代价和韵律拼接代价的方法,进行合成基元的优化选取,实现了汉语语音合成的韵律建模及其韵律控制.采用直接拼... 为了进一步提高汉语语音合成的自然度,通过对汉语语音合成技术的分析与对比,确定了以汉语音节作为拼接的合成基元,采用韵律匹配代价和韵律拼接代价的方法,进行合成基元的优化选取,实现了汉语语音合成的韵律建模及其韵律控制.采用直接拼接、过渡拼接和拟拼接,实现合成基元之间的拼接与平滑过渡.实验结果表明了汉语语音合成及其韵律控制方法的有效性. 展开更多
关键词 语音合成 合成基元 匹配代价 拼接代价
下载PDF
基于决策树的语音基元语境特征权重训练算法
15
作者 杨鸿武 郭威彤 +1 位作者 蔡莲红 吴志勇 《西北师范大学学报(自然科学版)》 CAS 2007年第4期50-54,共5页
提出了一种基于决策树的语音合成基元的语境特征权重训练算法.对语音数据库中的每个带调音节,利用语境相关的问题集和候选基元的频谱距离建立决策树.对每个要合成的音节,根据其语境特征,获得语音合成系统选择的基元的语境特征F*和该语... 提出了一种基于决策树的语音合成基元的语境特征权重训练算法.对语音数据库中的每个带调音节,利用语境相关的问题集和候选基元的频谱距离建立决策树.对每个要合成的音节,根据其语境特征,获得语音合成系统选择的基元的语境特征F*和该语境特征下决策树叶子结点中基元的语境特征F′.统计F′中每一个语境特征相对于F*的变化,根据语境特征变化的概率对权重进行调整.实验结果表明,这种方法能够训练出合理的语境特征权重,使得合成语音的自然度有一定提高.同时,利用这种方法还可以对语音合成系统进行实时优化. 展开更多
关键词 语音合成 文语转换 基元选取 权重训练
下载PDF
基于受限玻尔兹曼机的频谱建模与单元挑选语音合成方法 被引量:3
16
作者 宋阳 凌震华 戴礼荣 《模式识别与人工智能》 EI CSCD 北大核心 2015年第8期673-679,共7页
提出基于受限玻尔兹曼机的频谱建模与单元挑选语音合成方法.在模型训练阶段,采用受限玻尔兹曼机对包含丰富细节的频谱特征建模,如谱包络、短时幅度谱,取代传统的使用对角方差单高斯模型和梅尔倒谱特征的频谱建模方法,改善声学模型对于... 提出基于受限玻尔兹曼机的频谱建模与单元挑选语音合成方法.在模型训练阶段,采用受限玻尔兹曼机对包含丰富细节的频谱特征建模,如谱包络、短时幅度谱,取代传统的使用对角方差单高斯模型和梅尔倒谱特征的频谱建模方法,改善声学模型对于频谱特征的描述能力.在语音合成阶段,使用训练得到的受限玻尔兹曼机模型计算备选样本频谱特征的对数似然值,并通过分段线性映射构建单元挑选的目标代价函数.实验表明文中方法可有效提高合成语音的自然度. 展开更多
关键词 语音合成 单元挑选 隐马尔可夫模型 受限玻尔兹曼机
下载PDF
混合单元选择语音合成系统的目标代价构建 被引量:1
17
作者 蔡文彬 魏云龙 +1 位作者 徐海华 潘林 《计算机工程与应用》 CSCD 北大核心 2018年第24期20-25,共6页
合成语音的基元是通过最小化目标代价和拼接代价来选取。由于拼接基元涉及复杂的语言学、声学特性,如何选择能准确描述基元信息的声学特征(或语言学特征)并构建相应目标代价是提高合成语音质量的关键。从声学特征和声学模型两个方面对... 合成语音的基元是通过最小化目标代价和拼接代价来选取。由于拼接基元涉及复杂的语言学、声学特性,如何选择能准确描述基元信息的声学特征(或语言学特征)并构建相应目标代价是提高合成语音质量的关键。从声学特征和声学模型两个方面对目标代价构建进行了探究。实验结果表明,经过相似语料训练后微调的深度声学网络模型,预测的瓶颈特征更能表征拼接基元特性,从而指导目标代价筛选理想候选单元,提高合成语音的质量。 展开更多
关键词 语音合成 目标代价 声学特征 声学模型 拼接基元
下载PDF
基于不同长度拼接单元的英文文语转换系统 被引量:1
18
作者 曾令平 柴佩琪 《计算机工程》 EI CAS CSCD 北大核心 2005年第3期180-182,共3页
提出用不同长度的单元进行拼接的英语语音合成方法。实验表明,该方法能更好地利用自然语流的原始信息,提高合成语音的自然度,同时也能提高系统的灵活性和鲁棒性。
关键词 单元 成语 信息 英文 灵活性 自然 拼接 文语转换系统 鲁棒性 语音
下载PDF
汉语语音合成系统中激励源和声调模型研究 被引量:2
19
作者 刘志坚 刘加 《通信学报》 EI CSCD 北大核心 1998年第4期55-60,共6页
在语音合成器中激励源对合成语音的质量有极为重要的作用,本文对几种浊音激励源及其合成的结果进行了分析比较,同时对激励源细动态变化特性进行了研究。汉语的声调对合成语音质量影响很大,本文通过对语音基频、音长、音强的变化分析... 在语音合成器中激励源对合成语音的质量有极为重要的作用,本文对几种浊音激励源及其合成的结果进行了分析比较,同时对激励源细动态变化特性进行了研究。汉语的声调对合成语音质量影响很大,本文通过对语音基频、音长、音强的变化分析研究,建立了汉语的声调模型。在此基础上开发了一种并联型共振峰模型。 展开更多
关键词 语音合成 共振峰语音合成 合成器 激励源
下载PDF
融合自动检错的单元挑选语音合成方法
20
作者 孙晓辉 凌震华 戴礼荣 《数据采集与处理》 CSCD 北大核心 2016年第2期385-392,共8页
提出了一种融合自动检错的单元挑选语音合成方法。本文方法旨在设计与主观听感更加一致的单元挑选准则,以提高合成语音的自然度。首先利用众包网络平台快速大量地收集测听人对于合成语音的主观评价数据,取代了传统的利用具备语言学知识... 提出了一种融合自动检错的单元挑选语音合成方法。本文方法旨在设计与主观听感更加一致的单元挑选准则,以提高合成语音的自然度。首先利用众包网络平台快速大量地收集测听人对于合成语音的主观评价数据,取代了传统的利用具备语言学知识的专家收集主观评价数据的方法;然后基于这些主观评价数据,提取对应语音的音节时长、单元代价以及声学参数距离等特征,构建基于支持向量机的合成错误检测器;在合成阶段,该检测器被用来对传统单元挑选输出的N条路径行重打分,以确定最优的单元挑选序列。倾向性测听结果表明本文方法可以有效地提高合成语音的自然度。 展开更多
关键词 语音合成 单元挑选 支持向量机 众包 合成错误检测
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部