期刊文献+

基于遗传径向基神经网络的声音转换 被引量:3

Voice Conversion by GA-based RBF Neural Network
下载PDF
导出
摘要 声音转换技术可以将一个人的语音模式转换为与其特性不同的另一个人语音模式 ,使转换语音保持源说话人原有语音信息内容不变 ,而具有目标说话人的声音特点。本文研究了由遗传算法训练的RBF神经网络捕获说话人的语音频谱包络映射关系 ,以实现不同说话人之间声音特性的转换。实验对六个普通话单元音音素的转换语音质量分别作了客观和主观评估 ,结果表明用神经网络方法可以获得所期望的转换语音性能。实验结果还说明 ,与K -均值法相比 ,用遗传算法训练神经网络可以增强网络的全局寻优能力 ,使转换语音与目标语音的平均频谱失真距离减小约 10 %。 Voice conversion technology makes the speech of one speaker sounds as though it were uttered by another speaker giving it a new identity while preserving the original content. This paper addresses a study on voice conversion using genetic algorithm (GA) to train the hidden layers of RBF neural network, which can help better capture the nonlinear mapping between different speakers. Both subjective evaluations and objective ones are conducted on the transformed speech quality with six mono vowel phones in Mandarin speech. Experimental results show that desired performance of converted speech can be obtained when a neural network method is applied to voice conversion technique. The evaluations report that compared with K means method, a genetic algorithm based RBF network has the ability of global optimization with a 10% decrease in the spectral distance between the transformed speech and the target speech.
出处 《中文信息学报》 CSCD 北大核心 2004年第1期78-84,共7页 Journal of Chinese Information Processing
基金 国家自然科学基金项目 (6 0 172 0 5 5 6 0 12 130 2 ) 中科院自动化所领域前沿项目 (1M 0 2J0 5 )
关键词 人工智能 自然语言处理 声音转换 RBF神经网络 遗传算法 线谱频 artificial intelligence natural language processing voice conversion RBF neural network genetic algorithm line spectrum frequency
  • 相关文献

参考文献2

二级参考文献26

  • 1罗振声,郑碧霞.汉语句型自动分析和分布统计算法与策略的研究[J].中文信息学报,1994,8(2):1-19. 被引量:21
  • 2孙国华.普通话两音节中V1-Z间的共振蜂过渡.第三届语音学研讨会论文集[M].,1996.108-110.
  • 3许毅.普通话音联的声学语音学特性[J].中国语文,1986,5.
  • 4郭锦浮.汉语句子长度、语速与结构停顿.计算机时代的汉语和汉字研究学术研讨会论文摘要[M].,1995.17.
  • 5李爱军.普通话新闻广播话语中的障碍.中国声学学会1997年青年学术会议论文集[M].,1997.262-266.
  • 6孙甲松 王作英 等.连续语音训练词表的构造.第二届中国计算机智能接口与智能应用学术会议论文集[M].,1995.116-121.
  • 7曲菲 黄泰翼 等.汉语综合语音库语料设计.第四届全国人机语音通讯学术会议论文集[M].,1996.337-341.
  • 8G方特 张家lu等(译).言语科学与言语技术[M].商务印书馆,1994..
  • 9曹剑芬.两音节音联字表[J].语言文字应用,1997,1:60-68.
  • 10陈肖霞.汉语普通话两音节CVCV间C2为三个发音部位的逆向协同发音声学研究[J].中国语文,1997,4:54-63.

共引文献21

同被引文献12

引证文献3

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部