面向字音转换的有条件维数扩展算法被引量：2

Conditional mix incrementing algorithm for grapheme-to-phoneme conversion

导出

摘要为克服ID3算法应用于字音转换时,运算速度慢、易受数据稀疏问题影响的缺点,提出了一种面向字音转换的新决策树算法"有条件维数扩展算法"(conditional mixincrementing algorithm,CMI)。在ID3的基础上,CMI使用先验发音学知识指导下的互信息量方法选择决策属性,并引入2个参量,最小可信度与最大支持数,控制叶子节点。实验结果表明,CMI简化了运算过程,降低了稀疏数据对所生成决策树预测性能的影响。相同实验条件下,CMI在运算速度上比ID3提高了3.3倍,在决策树的预测正确率上提高了11.6%。 A decision tree algorithm for grapheme-to-phoneme conversion, the conditional mix incrementing algorithm （CMI）, was developed to improve the slow computational speed and susceptibility to poor data of the ID3 algorithm when used for grapheme-to-phoneme conversion. The algorithm chooses test attributes using information gain guided by prior pronunciation knowledge with the two concepts of minimum confidence （Minconf） and maximum support （maxsup） applied to the control nodes. Test results show that the algorithm simplifies the computations and reduces the impact of poor data on the prediction capability of the resulting decision tree. Tests show that the algorithm is 3.3 times faster than the ID3 algorithm and gives 11, 6% better in prediction accuracy for the tree.

作者赵坤梁维谦刘润生

机构地区清华大学电子工程系

出处《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 2008年第10期1629-1631,共3页 Journal of Tsinghua University(Science and Technology)

基金北京市科技计划项目(Y0105008040111)

关键词决策树字音转换 ID3算法 CMI算法 decision tree grapheme-to phoneme conversion ID3 algorithms CMI （conditional mix incrementing algorithm）

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献7

1XIONG Dongming, YAO Min. A high accuracy approach for word-phoneme translation using neural networks [C]// Neural Networks and Brain, ICNN&B'05, Beijing, 2005(2):1029 - 1031.
2Andersen O, Kuhn R, Lazarides A, et al. Comparison of two tree-structured approaches for grapheme-to-phoneme conversion[C]// Spoken Language, 1996. ICSLP 96. Proceedings. Fourth International Conference. Philadelphia, 1996, (3): 1700-1703.
3Quinlan J R. Introduction of decision trees[J]. Machine Learning, 1986, 1(1): 81 - 106.
4Quinlan J R. Machine Learning: An Artificial Intelligence Approach[M]. Palo Alto, CA: Morgan Kaufmann, 1983: 463 - 482.
5Quinlan J R. Decision trees and decisionmaking [J].IEEE Transaction on Systems, Man and Cybernetics, 1990, 20(2): 339 - 346.
6WU Sen, WU Lingyu, LONG Yu, et al. Improved classification algorithm by minsup and minconf based on ID3 [C]// Management Science and Engineering, ICMSE'06 Lille, 2006:135 - 139.
7Fransen J, Pye D, Robinson T, et al. WSJCAM0 Corpus and Recording Description[EB/OL]. (1994-09-02). ftp: // black, ox. ac. uk.

同被引文献5

1李鹏,徐波.单词自动注音方法的研究[J].清华大学学报（自然科学版）,2008,48(S1):735-740. 被引量：2
2王永生,柴佩琪,宣国荣.英语语音合成中基于DFGA的字音转换算法[J].计算机工程与应用,2006,42(13):158-161. 被引量：3
3冯伟,易绵竹,马延周.基于WFST的俄语字音转换算法研究[J].中文信息学报,2018,32(2):87-93. 被引量：3
4冯伟,易绵竹,马延周.基于TensorFlow的俄语词汇标音系统[J].计算机应用,2018,38(4):971-977. 被引量：5
5王永生,李立贵.基于决策树的德语字素音素转换算法[J].计算机应用与软件,2019,36(1):211-215. 被引量：1

引证文献2

1冯伟,易绵竹,马延周.基于WFST的俄语字音转换算法研究[J].中文信息学报,2018,32(2):87-93. 被引量：3
2曹德智,吴立成,赵悦.知识与数据驱动相融合的朝鲜语自动标音方法研究[J].数据与计算发展前沿,2023,5(5):164-173.

二级引证文献3

1胡希颖,王大东,陈佳欣.基于NAO机器人的BLSTM-CTC的声学模型研究[J].智能计算机与应用,2021,11(3):76-79. 被引量：1
2郑晓琼,汪晓,江海升,樊培培,张超.基于RNN和WFST译码的自动语音识别研究[J].信息技术,2019,43(6):115-120. 被引量：3
3曹德智,吴立成,赵悦.知识与数据驱动相融合的朝鲜语自动标音方法研究[J].数据与计算发展前沿,2023,5(5):164-173.

1范明,胡国平,王仁华.汉语字音转换中的多层面多音字读音消歧[J].计算机工程与应用,2006,42(2):167-170. 被引量：1
2王洁,宋柔.字音转换策略介绍及性能代价评估[J].计算机工程与应用,2007,43(16):26-29.
3高璐,陈琪,李永宏,于洪志.藏语语音合成中文本分析的若干问题研究[J].西北民族大学学报（自然科学版）,2010,31(2):27-32. 被引量：5
4石冰,郑燕峰.改进型关联规则增量式更新算法与实现[J].小型微型计算机系统,2000,21(12):1327-1329. 被引量：9
5钱进,孟祥萍,徐冬寅.一种有效的关联规则增量式更新算法[J].长春工程学院学报（自然科学版）,2003,4(3):11-14. 被引量：4
6李健宏.数据挖掘中关联规则的改进算法[J].南昌高专学报,2009,24(5):153-155.
7张雅琴.关联规则挖掘算法的设计[J].山西电子技术,2005(3):10-12. 被引量：2
8李健宏,余薇.关联规则增量式更新的改进算法[J].南昌大学学报（理科版）,2004,28(3):304-306. 被引量：4
9王辉,张剑飞,王双成.基于预测能力的贝叶斯网络结构学习[J].东北师大学报（自然科学版）,2005,37(1):32-35. 被引量：8
10刘洋徐瑞,陈书明,李勇.一种低开销的复合神经网络分支预测器[J].计算机工程,2011,37(S1):174-175.

清华大学学报（自然科学版）

2008年第10期

浏览历史

内容加载中请稍等...

面向字音转换的有条件维数扩展算法被引量：2

参考文献7

同被引文献5

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

面向字音转换的有条件维数扩展算法 被引量：2

参考文献7

同被引文献5

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

面向字音转换的有条件维数扩展算法被引量：2