面向语音转换的汉语语料自动选取算法

Automatic Selection Algorithm of Mandarin Corpus for Voice Conversion

下载PDF

导出

摘要为实现语音转换,建立符合要求的汉语语音转换语料库,提出一种基于半音节模型的语料自动选取算法。根据语音转换训练时需要语料数量较少的特征,选择半音节作为语料库的基本单位。在此基础上,从原始语料中自动选取语料,根据语音转换对说话人特征较敏感的情况,利用评估函数并根据半音节的出现次数对原始语料中的句子进行打分。实验结果表明,与传统算法相比,该算法在语音库自动选取615句汉语语料时,可以覆盖97.8%的带声调半音节,其覆盖效率、覆盖率和稀疏度有较大改进。 In order to realize voice conversion,a satisfied voice conversion corpus needs to be built up.This paper proposes an automatic corpus selection algorithm based on the semi-syllable model.Because the number of corpus sentences is small for voice conversion,the semi-syllable is chosen as the basic unit of the corpus.The algorithm automatically selects corpus from original corpus.An evaluation function is utilized to score sentences from original corpus according to the number and the kind of semi-syllable.When the number of chosen sentences is 615,the set of selected text covers 97.8% of the semi-syllables.The covering rate,coverage efficiency and sparse rate are obviously better than that of conventional algorithms.

作者沈亚敏赵晖张权唐朝京

机构地区国防科学技术大学电子科学与工程学院

出处《计算机工程》 CAS CSCD 北大核心 2011年第5期256-257,260,共3页 Computer Engineering

基金国家部委基金资助项目

关键词中文信息处理语音库语音转换覆盖率 Chinese information processing speech database voice conversion covering rate

分类号 TP311.52 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献9

1李波,王成友,蔡宣平,唐朝京,张尔扬.语音转换及相关技术综述[J].通信学报,2004,25(5):109-118. 被引量：34
2Kain A. High Resolution Voice Transformation[D]. Portland, USA: Oregon Health & Science University, 2001.
3Srinivas D, Veera R E, Yegnanarayana B, et al. Voice Conversion Using Artificial Neural Networks[C]//Proc. of 2009 IEEE lnt'l Conf. on Information and Automation. Taipei, China: [s. n.], 2009.
4李波,褚振勇,张圣杰,毛玉泉,王宝良.基于小语料库训练的语音转换系统[J].中国科技信息,2008(18):28-29. 被引量：2
5左国玉,刘文举,阮晓钢.基于遗传径向基神经网络的声音转换[J].中文信息学报,2004,18(1):78-84. 被引量：3
6左国玉,刘文举,阮晓钢.一种使用声调映射码本的汉语声音转换方法[J].数据采集与处理,2005,20(2):144-149. 被引量：4
7祖漪清.汉语连续语音数据库的语料设计[J].声学学报,1999,24(3):236-247. 被引量：17
8赵晖,林成龙,唐朝京.基于视频三音子的双模态语料自动选取算法[J].计算机工程,2009,35(17):1-3. 被引量：2
9赵晖,林成龙,唐朝京.基于视频三音子的汉语双模态语料库的建立[J].中文信息学报,2009,23(5):98-103. 被引量：6

二级参考文献78

1刘鹏,王作英.多模式汉语连续语音识别中视觉特征的提取和应用[J].中文信息学报,2004,18(4):79-84. 被引量：6
2左国玉,刘文举,阮晓钢.声音转换技术的研究与进展[J].电子学报,2004,32(7):1165-1172. 被引量：32
3洪晓鹏,姚鸿勋,徐铭辉.基于句子级的唇读语料库及其切分算法[J].计算机工程与应用,2005,41(3):174-177. 被引量：7
4罗振声,郑碧霞.汉语句型自动分析和分布统计算法与策略的研究[J].中文信息学报,1994,8(2):1-19. 被引量：21
5孙国华.普通话两音节中V1－Z间的共振蜂过渡.第三届语音学研讨会论文集[M].,1996.108-110.
6许毅.普通话音联的声学语音学特性[J].中国语文,1986,5.
7郭锦浮.汉语句子长度、语速与结构停顿.计算机时代的汉语和汉字研究学术研讨会论文摘要[M].,1995.17.
8李爱军.普通话新闻广播话语中的障碍.中国声学学会1997年青年学术会议论文集[M].,1997.262-266.
9孙甲松王作英等.连续语音训练词表的构造.第二届中国计算机智能接口与智能应用学术会议论文集[M].,1995.116-121.
10曲菲黄泰翼等.汉语综合语音库语料设计.第四届全国人机语音通讯学术会议论文集[M].,1996.337-341.

共引文献59

1李荪,曹峰,刘姿杉.面向算法模型的语音数据集质量评估方法研究[J].计算机科学,2022,49(S02):519-524. 被引量：2
2岳振军,王浩,张雄伟.基于正弦谐波模型和BP神经网络的语音变换算法及实现[J].信号处理,2005,21(z1):208-211. 被引量：7
3孙健,贾永兴,陈向东.一种基于DCT和PSOLA的语音变换方法[J].军事通信技术,2008,29(2):23-26.
4井晓阳,罗飞,王亚棋.汉语语音合成技术综述[J].计算机科学,2012,39(S3):386-390. 被引量：13
5林茂灿.普通话语句中间断和语句韵律短语[J].当代语言学,2000,2(4):210-217. 被引量：31
6夏菁,尹俊勋,黄建成,黄锋.基于正弦加噪声模型的说话人转换方法[J].电声技术,2005,29(2):49-52. 被引量：1
7李元良,李波,王成友.语音转换中基于系统单位冲激响应的频谱搬移方法[J].矿业研究与开发,2005,25(5):59-61. 被引量：1
8陆静芳,李波,王成友.语音转换中系统单位冲激响应的频谱搬移方法研究[J].现代电子技术,2005,28(24):40-42.
9王浩,苏巨诗,许胜华,岳振军.基于正弦谐波模型的语音变换算法及实现[J].解放军理工大学学报（自然科学版）,2005,6(6):525-530.
10黄德智,蔡莲红.一种面向声音变换的参数化模型[J].声学学报,2006,31(6):542-548. 被引量：2

1王轩,李巍,王晓龙,赵淑香.大标记集汉语字(词)Markov 语言模型的建立[J].哈尔滨工业大学学报,1997,29(5):23-27. 被引量：3
2张辉,武亚红,黄润才.基于规则和统计的汉语多输出切分系统[J].微电子学与计算机,2007,24(7):56-58. 被引量：1
3刘志新,郑庆超,薛亮,关新平.一种具有提高覆盖性能的传感器网络节能分簇算法[J].控制与决策,2012,27(3):374-378. 被引量：2
4俞振利,张礼和.从任意连续语音中实时提取说话人特征及三维显示[J].杭州大学学报（自然科学版）,1992,19(4):390-397.
5宋凌.基于主成分分析的说话人特征变换研究[J].电子技术与软件工程,2013(17):241-243. 被引量：1
6徐菁,张辉,陆汝占.汉语语料的切分标注加工系统[J].计算机工程,2003,29(9):66-68. 被引量：4
7马宁,李亚超,何向真,于洪志.一种实用的资源稀缺条件下的分词方法[J].计算机应用研究,2016,33(1):68-70. 被引量：4
8刘龙飞,陈斌,党荣.基于CNET模型的无词典汉语自动分词算法研究[J].计算机应用与软件,2007,24(10):219-221.
9曹峰,刘丽萍,王智.能量有效的无线传感器网络部署[J].信息与控制,2006,35(2):147-153. 被引量：41
10高军,陈锡先.无监督的动态分词方法[J].北京邮电大学学报,1997,20(4):66-69. 被引量：4

计算机工程

2011年第5期

浏览历史

内容加载中请稍等...

面向语音转换的汉语语料自动选取算法

参考文献9

二级参考文献78

共引文献59

相关作者

相关机构

相关主题

浏览历史