一种改进的基于决策树的英文韵律短语边界预测方法被引量：3

Improved decision tree based method for English prosodic phrase boundary prediction

下载PDF

导出

摘要在英文语音合成系统中,韵律短语边界预测的精度对合成语音的自然度和可懂度有着至关重要的影响。基于决策树的预测方法是现阶段最为常用的韵律短语边界预测方法,但因决策树构建时受到数据平衡性制约,难以针对关键词进行建模,而且在基于决策树进行预测时采用了局部最优的搜索方式无法达到全局最优。所以,为了进一步提升韵律短语边界的预测效果,对基于决策树的预测方法进行了改进,引入韵律短语条件概率,使用Viterbi算法同时优化韵律短语边界概率和条件概率,并提出了基于关键词在韵律短语中的位置分布特性的决策树节点概率优化方法。实验表明,在基线系统上使用改进方法后,F-Score由68.7%提升到77.8%,而不可接受率从22.4%降低到15.2%。 In English speech synthesis systems, the accuracy of prosodic phrase boundary prediction has a critical influence on the naturalness and intelligibility of synthetic speech. Currently, decision tree based prediction is the most popular method for predicting the prosodic phrase boundaries. However, this method can＇ t build models for specific keywords because of the data balance issue. Besides, it wouldn＇ t be possible to achieve the global optimization by the local optimization search method at prediction stage. Therefore, in order to improve the prediction performance, this paper introduced the conditional probability of prosodic phrases, and used Viterbi algorithm to optimize the prosodic phrase boundary probability and conditional probability simultaneously. Furthermore, it proposed an optimization method for probability distribution of the decision tree nodes, based on location distribution characteristics of keywords in prosodic phrases. The experimental results show that F-Score of phrase boundary prediction increases from 68.7% to 77.8% and the non-acceptance rate drops from 22.4% to 15.2% after adopting the proposed method.

作者张元平凌震华戴礼荣刘庆峰

机构地区中国科学技术大学电子工程与信息科学系

出处《计算机应用研究》 CSCD 北大核心 2012年第8期2921-2925,共5页 Application Research of Computers

关键词语音合成韵律短语边界预测决策树位置分布 speech synthesis prosodic phrase boundary prediction decision tree location distribution

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献14

1SILVERMAN K E A, BECKMAN M E, PITRELLI J F,et al. ToBI:a standard for labeling english prosody [ C ]//Proc of International Con- ference on Spoken Language Processing. 1992:867-870.
2杨军.ToBI韵律标注体系及其运用[J].现代外语,2005,28(4):360-366. 被引量：14
3LI Wei-jun,YANG Yu-fang. Perception of prosodic hierarchical bound- aries in Mandarin Chinese sentences [ J ]. Neuroseience, 2009, 158 (4) :1416-1425.
4荀恩东,钱揖丽,郭庆,宋柔.应用二叉树剪枝识别韵律短语边界[J].中文信息学报,2006,20(3):1-5. 被引量：4
5李剑锋,胡国平,王仁华.基于最大熵模型的韵律短语边界预测[J].中文信息学报,2004,18(5):56-63. 被引量：20
6YING Zhi-wei, SHI Xiao-hua. An RNN-based algorithm to detect pro- sodic phrase for Chinese TIS[ C]//Proc of International Conference on Acoustics, Speech, and Signal Processing. 2001 : 809- 812.
7BAILLY G, HOLM B. SFC : a trainable prosodic model [ J ]. Speech Communication ,2005,46 (3-4) :348-364.
8FUJIO S, SAGISAKA Y, HIGUCHI N. Prediction of prosodic phrase boundaries using stochastic context-free grammar[ C]//Proc of the 3rd International Conference on Spoken Language Processing. 1994:18-22.
9READ I, COX S. Stochastic and syntactic techniques for predicting phrase breaks [ J ]. Computer Speech & Language, 2007,21 ( 3 ) : 519-542.
10董远,周涛,董乘宇,王海拉.中文语音合成系统中的一种两层韵律结构生成体系(英文)[J].自动化学报,2010,0(11):1569-1574. 被引量：2

二级参考文献48

1CHU Min and LU Shinan(Institute of Acoustics, Academia Sinica, Beijing 100080).A text-to-speech system with high intelligibility and naturalness for Chinese[J].Chinese Journal of Acoustics,1996,15(1):81-90. 被引量：5
2赵永贞,刘挺,王志伟,陈惠鹏,邵艳秋.汉语文语转换系统中停顿指数的自动标注[J].中文信息学报,2004,18(5):48-55. 被引量：6
3李剑锋,胡国平,王仁华.基于最大熵模型的韵律短语边界预测[J].中文信息学报,2004,18(5):56-63. 被引量：20
4周强,俞士汶.汉语短语标注标记集的确定[J].中文信息学报,1996,10(4):1-11. 被引量：35
5周强.一个汉语短语自动界定模型[J].软件学报,1996,7(A00):315-322. 被引量：9
6M. Chu, Y. Qian, Locating Boundaries for Prosodic Constituents in Unrestricted Mandarin Texts[J]. Computational Linguistics and Chinese Language Processing, February 2001,6(1) :61 - 82.
7Bachenko J, Fitzpatrick E. A computational grammar of discourse-neutral prosodic phrasing in English[J]. Computational Linguistics, 1990, 16(3): 155-170.
8J. Hirschberg, P. Prieto. Training intonational phrasing rules automnatically for English and Spanish text-to-speech[J]. Speech Communication, 1996.
9G. J. Busser, W. Daelemans, Van den Bosch, A. Predicting phrase breaks with memory-based learning[A]. Proceedings 4th ISCA Tutorial and Research Workshop on Speech Synthesis[ C], Perthshire Scotland, August 29th - September 1st, 2001.
10Adam L. Berger, Stephen A. Della Pietra, Vincent J. Della Pietra. A maximum entropy approach to natural language processing[J]. Computational Linguistics 1996, 23(4): 597-618.

共引文献51

1季晓蓓.非英语专业学生使用美语高频问候语的实验语调分析[J].语言与文化研究,2020(2):38-41.
2胡伟.日语口语语料库的应用引介[J].日语教育与日本学,2022(1):134-142. 被引量：1
3胡伟,刘玥.日语语音研究中口语有声语料库的应用——以语料库的语音标注与检索为例[J].高等日语教育,2023(1):76-89.
4夏耕.声调作为二语习得中的韵律意识和声学意识[J].语文学刊（外语教育与教学）,2013(7):137-140.
5赵永贞,刘挺,王志伟,陈惠鹏,邵艳秋.汉语文语转换系统中停顿指数的自动标注[J].中文信息学报,2004,18(5):48-55. 被引量：6
6李剑锋,胡国平,王仁华.基于最大熵模型的韵律短语边界预测[J].中文信息学报,2004,18(5):56-63. 被引量：20
7冯丽萍,焦莉娟.基于最大熵的中文组织机构名识别模型[J].计算机与数字工程,2010,38(12):36-40. 被引量：2
8郑敏,蔡莲红.基于概率频度的普通话韵律结构预测统计模型[J].清华大学学报（自然科学版）,2006,46(1):78-81. 被引量：3
9荀恩东,钱揖丽,郭庆,宋柔.应用二叉树剪枝识别韵律短语边界[J].中文信息学报,2006,20(3):1-5. 被引量：4
10钱揖丽,荀恩东,宋柔.基于SLM的二叉树在语音停顿预测中的应用[J].计算机工程,2006,32(19):23-25. 被引量：2

同被引文献29

1裴雨来,邱金萍,王洪君,吕士楠.基于词类序列的汉语语句韵律结构预测[J].清华大学学报（自然科学版）,2009(S1):1339-1343. 被引量：5
2李剑锋,胡国平,王仁华.基于最大熵模型的韵律短语边界预测[J].中文信息学报,2004,18(5):56-63. 被引量：20
3于春海,樊治平.一种基于三角模糊数多指标信息的聚类方法[J].系统工程理论方法应用,2004,13(5):467-470. 被引量：4
4杨军.ToBI韵律标注体系及其运用[J].现代外语,2005,28(4):360-366. 被引量：14
5郑敏,蔡莲红.基于概率频度的普通话韵律结构预测统计模型[J].清华大学学报（自然科学版）,2006,46(1):78-81. 被引量：3
6荀恩东,钱揖丽,郭庆,宋柔.应用二叉树剪枝识别韵律短语边界[J].中文信息学报,2006,20(3):1-5. 被引量：4
7李剑锋,胡国平,王仁华.基于整句相似性计算的韵律短语预测模型[J].小型微型计算机系统,2006,27(10):1935-1938. 被引量：1
8董宏辉,陶建华,徐波.基于约束模型的韵律短语预测[J].中文信息学报,2007,21(1):54-59. 被引量：6
9李素建,刘群.汉语组块的定义和获取[C]//孙茂松,陈群秀.语言计算与基于内容的文本处理:全国计算语言学联合学术会议(SWCL2003)论文集.北京:清华大学出版社,2003:110-115.
10曹剑芬.汉语韵律切分的语音学和语言学线索[C]//第5届全国现代语音学学术会议论文集,2001:176-179.

引证文献3

1汪丹丹.一种基于多属性模糊决策的英文韵律短语边界预测方法[J].西安文理学院学报（自然科学版）,2018,21(6):64-67.
2钱揖丽,冯志茹.基于语块和条件随机场(CRFs)的韵律短语识别[J].中文信息学报,2014,28(5):32-38. 被引量：6
3钱揖丽,蔡滢滢.采用无标注语料和词“粘连”剔除策略的韵律短语识别[J].计算机科学,2016,43(2):51-56.

二级引证文献6

1钱揖丽,冯志茹.利用AdaBoost-SVM集成算法和语块信息的韵律短语识别[J].计算机工程与科学,2015,37(12):2324-2330. 被引量：2
2孙丽萍,过弋,唐文武,徐永斌.基于构成模式和条件随机场的企业简称预测[J].计算机应用,2016,36(2):449-454. 被引量：3
3钱揖丽,蔡滢滢.采用无标注语料和词“粘连”剔除策略的韵律短语识别[J].计算机科学,2016,43(2):51-56.
4李勇,王柳渝,魏珰.基于依存信息融合特征的汉语韵律预测[J].计算机工程,2018,44(1):306-310. 被引量：1
5李艳玲,颜永红.统计中文口语理解执行策略的研究[J].计算机科学与探索,2017,11(6):980-987. 被引量：4
6杨陈菊,孙俊,皮乾东,邵玉斌,龙华.基于CRF和多元规则的层次化句法分析[J].吉林大学学报（理学版）,2020,58(6):1452-1460. 被引量：2

1钱揖丽,冯志茹.基于语块和条件随机场(CRFs)的韵律短语识别[J].中文信息学报,2014,28(5):32-38. 被引量：6
2钱揖丽,荀恩东.基于分类回归树CART的汉语韵律短语边界识别[J].计算机工程与应用,2008,44(6):169-171. 被引量：3
3李剑锋,胡国平,王仁华.基于最大熵模型的韵律短语边界预测[J].中文信息学报,2004,18(5):56-63. 被引量：20
4荀恩东,钱揖丽,郭庆,宋柔.应用二叉树剪枝识别韵律短语边界[J].中文信息学报,2006,20(3):1-5. 被引量：4
5郑敏,蔡莲红.基于概率频度的普通话韵律结构预测统计模型[J].清华大学学报（自然科学版）,2006,46(1):78-81. 被引量：3
6胡经珍.一种新的网络安全态势评估模型研究[J].计算机安全,2007(8):68-69. 被引量：2
7杨蕊华,郭绍翠.基于BP神经网络的图像分离算法[J].硅谷,2011,4(3):28-29. 被引量：1
8钱揖丽,蔡滢滢.采用无标注语料和词“粘连”剔除策略的韵律短语识别[J].计算机科学,2016,43(2):51-56.
9钱揖丽,冯志茹.利用AdaBoost-SVM集成算法和语块信息的韵律短语识别[J].计算机工程与科学,2015,37(12):2324-2330. 被引量：2
10李曼,冯新喜,陈玉.基于贝叶斯网络的态势估计研究[J].微计算机信息,2008,24(18):233-235. 被引量：2

计算机应用研究

2012年第8期

浏览历史

内容加载中请稍等...

一种改进的基于决策树的英文韵律短语边界预测方法被引量：3

参考文献14

二级参考文献48

共引文献51

同被引文献29

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

一种改进的基于决策树的英文韵律短语边界预测方法 被引量：3

参考文献14

二级参考文献48

共引文献51

同被引文献29

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

一种改进的基于决策树的英文韵律短语边界预测方法被引量：3