-
题名基于虚拟不定长的语音库裁剪方法
被引量:2
- 1
-
-
作者
张巍
吴晓如
赵志伟
王仁华
-
机构
中国科学技术大学电子工程与信息科学系
安徽中科大讯飞信息科技有限公司
-
出处
《软件学报》
EI
CSCD
北大核心
2006年第5期983-990,共8页
-
基金
国家高技术研究发展计划(863)~~
-
文摘
语音库裁剪或语音库去冗余,是大语料库语音合成技术的一个重要问题.提出了虚拟不定长替换的概念,以弥补不定长的损失.结合合成使用变体的频度,构建了语音库裁剪算法StaRp-VPA.该算法能够以任意比例裁剪语音库.实验表明:当裁剪率小于50%时,合成自然度几乎没有下降;当裁剪率大于50%时,合成自然度也不会严重降低.
-
关键词
语音合成
文语转换
语音库裁剪
可伸缩语音合成系统
-
Keywords
speech synthesis
text to speech
pruning redundant synthesis instances
scalable speech synthesis system
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名语音库裁剪的一种不定长递阶聚类方法
被引量:1
- 2
-
-
作者
张巍
吴晓如
刘江
王仁华
-
机构
中国海洋大学计算机科学系
安徽中科大讯飞信息科技有限公司
中国科学技术大学电子工程与信息科学系
-
出处
《计算机学报》
EI
CSCD
北大核心
2007年第11期2017-2024,共8页
-
基金
国家自然科学基金(60602017)
国家"八六三"高技术研究发展计划项目基金(2004AA114030)资助.~~
-
文摘
大量使用不定长是大语料库语音合成质量的一个重要保证,而语音库裁剪方法通常会导致不定长的损失.针对这一关键性问题,该文构建了NuClustering-VPA算法:对不同粒度的不定长变体进行聚类,根据高阶聚类结果调整低阶变体的聚类,使得低阶聚类中心有所偏向.NuClustering-VPA算法保留了最重要的不定长,从而有效减小了裁剪对不定长的破坏.测听实验表明,利用NuClustering-VPA算法,即使在语音库裁减率为39.63%时,合成自然度下降较小,仍然保持在较高的水平.这一技术已被应用在科大讯飞公司的实际语音产品中.
-
关键词
基于语料库的语音合成
语音库裁剪
语音库去冗余
可伸缩语音合成系统
-
Keywords
Corpus-based TTS
Tailoring TTS voice font
pruning redundant synthesis instances
scalable TTS
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名数据驱动方法的语音库裁剪研究
- 3
-
-
作者
张巍
吴晓如
王仁华
-
机构
中国海洋大学计算机科学系
安徽中科大讯飞信息科技股份有限公司
中国科学技术大学电子工程与信息科学系
-
出处
《高技术通讯》
EI
CAS
CSCD
北大核心
2008年第1期26-32,共7页
-
基金
国家自然科学基金(60602017)
863计划(2004AA114030)资助项目
-
文摘
为解决语音库裁剪会造成不定长损失的问题,首先提出了 NuClustering-VPA 算法,该算法对不同粒度的不定长变体进行递阶聚类,根据高阶聚类结果调整低阶变体的聚类,从而保留在声韵上最为重要的变体。接着提出了虚拟不定长替换的概念,意图弥补不定长的损失,并结合合成使用变体的频度,给出了可以任意比例裁剪语音库的 StaRp-VPA算法。大规模测听表明,两种算法在裁剪率小于50%时,合成自然度几乎没有下降;当裁剪率大于50%时,StaRp-VPA 给出的音库合成自然度也不会严重降低。两种裁剪在合成系统的移植中得到了很好的应用。
-
关键词
语音合成
语音库裁剪
可伸缩语音合成系统
-
Keywords
speech synthesis, synthesis instances pruning, sealable text-to-speech system
-
分类号
TN912.33
[电子电信—通信与信息系统]
TS941.712
[轻工技术与工程—服装设计与工程]
-