最大熵软决策树HMM最大似然藏语音合成

SDT-HMM:Hidden Markov based soft decision tree with maximum entropy for maximum likelihood Tibet speech synthesis

下载PDF

导出

摘要针对传统的硬决策树藏语音合成系统存在泛化性能不强的问题,设计改进一种二进制软决策树算法,实现基于语境因子的藏语音合成模型参数估计。内部节点根据子代节点隶属度进行选取,每个节点可视为基于语境依赖隶属度的模糊集合,将每个语境分配给几个重叠的叶节点,提高模型概括和函数逼近性能;采用最大熵平滑分布进行局部一阶矩和全局二阶矩特征捕捉,实现隐式马尔可夫(HMM)输出概率分布的软决策参数最大似然估计。仿真验证结果表明,所提算法在满足应用实时性要求的前提下,可有效提高藏语音合成效果。 For the poor generalization performance of traditional hard decision tree Tibet speech synthesis system, a binary soft decision tree algorithm for Tibet voice synthesis was designed, which used the contextual factors to estimate the model parame- ters. According to the membership of internal node, the descendant nodes were selected, each node was considered as the con- text-dependent membership fuzzy set, which assigned each context to several overlapping leaf nodes, thereby improving model generalization and function approximation performance. The maximum entropy smooth distribution was used to capture the local first moment and global second order moments, which realized the maximum likelihood estimation of decision parameters of HMM output probability distribution. Results of simulation show that the proposed algorithm meets the real-time requirements and effectively improves the Tibet speech synthesis effects.

作者曲珍扎西加春燕

机构地区西藏大学藏文信息技术研究中心

出处《计算机工程与设计》北大核心 2017年第4期981-988,共8页 Computer Engineering and Design

基金教育部人文社会科学研究青年基金项目(15YJC740063) 教育部人文社会科学研究西藏基金项目(15XZJCZH001) 西藏大学青年科研培育基金项目(ZDPJZK1505) 西藏大学珠峰学者人才发展支持计划主体计划"杰出青年学者"的自助国家社会科学研究重大项目"基于地理信息平台的藏语方言数据库建设"(14ZDB101)之子课题"藏语方言时空数据库建设"

关键词软决策树藏语音合成隐式马尔可夫最大熵隶属度 soft decision tree Tibet speech synthesis hidden Markov maximum entropy membership

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1何凌,黄华,刘肖珩.基于韵律特征参数的情感语音合成算法研究[J].计算机工程与设计,2013,34(7):2566-2569. 被引量：8
2徐英进,蔡莲红.基于HCSIPA的中英文混合语音合成[J].计算机工程,2013,39(4):14-17. 被引量：4

二级参考文献10

1邵艳秋,韩纪庆,王卓然,刘挺.韵律参数和频谱包络修改相结合的情感语音合成技术研究[J].信号处理,2007,23(4):526-530. 被引量：7
2Traber C. From Multilingual to Polyglot Speech Synthe- sis[C]//Proc, of Eurospeech. Budapest, Hungary: Is. n.], 1999.
3Qian Yao, Liang Hui, Soong F K. A Cross-language State Sharing and Mapping Approach to Bilingual(Mandarin- English) TTS[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2009, 17(6): 1231-1239.
4So Yongjin, Jia Jia, Wang Yongxin, et al. Label Transform Based Cross-language Speaker Adaptation in Bilingual (Mandarin-English) TTS[C]//Proc. of International Confe- rence on Audio, Language and Image Processing. Shanghai, China: [s. n.], 2012.
5Zhang Yi, Tao Jianhua. Prosody Modification on Mixed- language Speech Synthesis[C]//Proc. of ISCSLP'08. Kunming, China: [s. n.], 2008.
6Qian Yao, Cao Houwei, Soong F K. HMM-based Mixed- language(Mandarin-English) Speech Synthesis[C]//Proc. oflSCSLP'08. Kunming, China: Is. n.], 2008.
7Yin Bo, Ambikairajah E, Chen Fang. Combining Cepstral and Prosodic Features in Language Identification[C]//Proc. ofICPR'06. Hong Kong, China: Is. n.], 2006.
8Zhang Jialu. A SAMPA System for Putonghua (Standard Chinese)[C]//Proc. of Oriental COCOSDA'99. Taipei, China: [s. n.], 1999.
9Zu Yiqing, Chert Yingzhi, Zhang Yaxin, et al. A Super Phonetic System and Multi-dialect Chinese Speech Corpus for Speech Recognition[C]//Proc. of ISCSLP'06. Singapore: [s. n.], 2006.
10张家騄.汉语普通话机读音标SAMPA-SC[J].声学学报,2009,34(1):81-86. 被引量：9

共引文献10

1李景娜,吴娇.中国学习者对英语情感语调的感知研究[J].中国外语研究,2021(1):54-62.
2纪正飚,王吉林,赵力.基于HMM的中英文语音合成技术研究[J].科学技术与工程,2014,22(32):237-240. 被引量：2
3徐照松,元昌安,覃晓,元建,李双.基于关联规则的语音情感中韵律特征抽取算法研究[J].计算机应用与软件,2015,32(9):42-45. 被引量：1
4郭威彤,杨鸿武,宋继华,顾香,甘振业.面向方言语音合成的文本分析研究[J].计算机工程,2015,41(9):184-189. 被引量：3
5佘陈凤,余远波,陈静娴,曹友,陈泽游.多语种医嘱播报系统设计与实现[J].软件工程,2016,19(5):47-50. 被引量：3
6孙晓虎,李洪均.语音情感识别综述[J].计算机工程与应用,2020,56(11):1-9. 被引量：16
7庞聪,连海伦,周健,王华彬,陶亮.一种基于特征融合的耳语音向正常音的转换方法[J].南京航空航天大学学报,2020,52(5):777-782.
8范涛,王昊,郝琳娜,王诗琴.基于视频上下文和高维融合的突发事件中网民情感分析研究[J].情报科学,2021,39(5):176-183. 被引量：6
9张昕,胡航烨,曹欣怡,王蔚.基于Tacotron模型和韵律修正的情感语音合成方法[J].数据采集与处理,2022,37(4):909-916. 被引量：2
10崔娟娟,张海燕.以项目为导向的虚拟仿真教学案例研究[J].移动信息,2024,46(6):109-111.

1朱明,李香,郑烇.基于多学习策略的网页信息抽取方法[J].计算机应用与软件,2008,25(12):68-69.
2邓小明,梁正友.隐式马尔可夫链无线冲突概率约乘退避策略[J].计算机工程与设计,2017,38(4):868-873.
3李文鑫,陈静,范文兵.基于小波域HMT模型的图像去噪研究[J].现代电子技术,2009,32(6):110-112. 被引量：2
4姜涛,习俊通,严隽琪.反求工程中融合特征捕捉的光学三维测量方法[J].光电工程,2005,32(2):19-22. 被引量：2
5罗亚伟,田生伟,禹龙,吐尔根.依布拉音,艾斯卡尔.艾木都拉.意见挖掘中维吾尔语文本隐式情感分析[J].计算机工程与设计,2014,35(9):3295-3300. 被引量：5
6吴勇,周军.基于语境和语义的中文文本聚类算法研究[J].科技信息,2010(35).
7蔡东风,白宇,于水,叶娜,任晓娜.一种基于语境的词语相似度计算方法[J].中文信息学报,2010,24(3):24-28. 被引量：12
8马红妹,齐璇,王挺,陈火旺.汉英机器翻译中汉语篇章时间信息系统模型[J].计算机工程与科学,2002,24(4):85-88. 被引量：1
9江晖,钱树人,李景春,季叶枫.一个基于语境的面向对象的实时命令理解系统的设计与实现[J].小型微型计算机系统,1998,19(1):33-39.
10张茂元,卢正鼎,邹春燕.一种基于语境的中文分词方法研究[J].小型微型计算机系统,2005,26(1):129-133. 被引量：8

计算机工程与设计

2017年第4期

浏览历史

内容加载中请稍等...

最大熵软决策树HMM最大似然藏语音合成

参考文献2

二级参考文献10

共引文献10

相关作者

相关机构

相关主题

浏览历史