基于数据挖掘的普通话韵律规则学习被引量：2

Data Mining for Learning Mandarion Prosodic Models

下载PDF

导出

摘要普通话韵律规则对于语音合成和语音学研究具有重要意义 .为了更有效地进行韵律规则学习 ,该文利用数据挖掘技术从语料库中提取规则 .通过聚类分析进行基频模式提取 ,并以此进行基频序列的离散化 ;由语言学分析的结果得出训练句子中每个音节的参数 ,利用决策树和神经网络学习音节的韵律变化规则 .测试表明基于数据挖掘的韵律规则学习取得了较好的结果 ,证实了方法的有效性 . Mandarin prosodic models are very important in speech research and speech synthe sis, which mainly describess the variation of pitch. The models that are now being u sed in most Chinese Text\|To\|Speech systems are constructed by expert, qualitatively an d with low precision. In this paper, Data Mining is used to extract more accurate prosodic pattern s from actual large mandarin speech database to improve the naturalness and intelligibility of synth esized speech. In data preprocessing, typical prosody models are found by clustering analysis, a nd the original pitches extracted from sentences are discrete with classic pitch models. These clusters together with some linguistic features (including tone combination, word length, part\|of \|speech (POS), syllable position in word, word position in phrase) obtained by text parsing are use to acquire training data. ANN and Decision tree are trained respectively using above integr ated data to learn the variation prosody models of pitch. Two decisino trees are construc ted for predicting the classic pitch model and length of pitch based on C4.5, and BackPropagation(BP) network is used to learn the mapping between the linguistic features and the mean value of pit ch. Encouraging experimental results show the effectiveness of the proposed method base on Data Mining.

作者朱廷劭高文

机构地区中国科学院计算技术研究所哈尔滨工业大学计算机科学与工程系哈尔滨

出处《计算机学报》 EI CSCD 北大核心 2000年第11期1179-1183,共5页 Chinese Journal of Computers

基金国家自然科学基金重点项目!(6 978930 1) 国家"八六三"高技术研究发展计划!(86 3-30 6 -ZD0 3-0 1-2 ) 中科院百人计划资助

关键词数据挖掘语音合成语音学普通话韵律规则 prosodic rule, data mining, clustering, decision tree, neural network

分类号 TN912.33 [电子电信—通信与信息系统] TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献1

1林茂灿,颜景助,孙国华.北京话两字组正常重音的初步实验[J].方言,1984,6(1):57-73. 被引量：82

共引文献81

1殷治纲.汉语节奏研究综述[J].中国语音学报,2022(2):33-50.
2殷治纲.汉语词汇层面的轻重音研究[J].中国语音学报,2021(2):95-109. 被引量：1
3王云丽.上海普通话双音节词基础元音的大样本声学分析[J].语言学论丛,2019(2):246-264.
4张吉生.也论汉语词重音[J].中国语文,2021(1):43-55. 被引量：15
5李智强,李爱军.普通话连续话语中轻重音的层级性和韵律表征[J].韵律语法研究,2022(1):88-114.
6周韧.汉语词重音问题再论[J].韵律语法研究,2021(2):150-170.
7王韫佳.北京话词重音问题散议[J].韵律语法研究,2021(2):130-149.
8马秋武.汉语的词重音及其音系性质[J].韵律语法研究,2021(2):112-129. 被引量：1
9戴庆厦,刘岩.景颇语、德昂语的词重音——兼谈汉语词重音问题[J].韵律语法研究,2021(2):38-54. 被引量：1
10曹剑芬.读《玻璃杯半满抑或半空?汉语重音的另类观》引发的思考[J].韵律语法研究,2021(2):23-37.

同被引文献17

1陆安生,陈永强,屠浩文.决策树C5算法的分析与应用[J].电脑知识与技术（技术论坛）,2005(3):17-20. 被引量：16
2张家旺,韩光胜,张伟.C5.0算法在RoboCup传球训练中的应用研究[J].计算机仿真,2006,23(4):132-134. 被引量：11
3牟吉元等.农业昆虫学[M].北京:中国农业科技出版社.1995.121-168.
4薛微,陈欢歌.Clementine数据挖掘方法及应用[M].北京:电子工业出版社,2010.
5HHLLMANN C A, FOPPEN R P B, VAN TURNHOUT C A M, et al. Declines in insectivorous birds are associated with high neonicotinoid concentrations[J]. Nature, 2014, 511(7509): 341-343.
6SIRAJ A S, SANTOS-VEGA M, BOUMA M J. Altitudinal changes in malaria incidence in highlands of Ethiopia and Colombia[J]. Science, 2014, 343(6175): 1154-1158.
7PIYARATNE M K D K, ZHAO H Y, HU Z Q, et al. A model to analyze weather impact on aphid population dynamics: an application on swallow tail catastrophe model[J]. European Scientific Journal, 2014, 10(18): 1857-7431.
8DEBORAH J T, ART J D, FRAN~OISE A B, et al. Forecasting aphid outbreaks and epidemics of cucumber mosaic virus in lupin crops in a Mediterranean-type environment[J]. Virus Research, 2004, 100(1): 67-82.
9LUO J H, HUANG W J, ZHAO J L, et al. Predicting the probability of wheat aphid occurrence using satellite remote sensing and meteorological data[J]. Optik, 2014, 125(19): 5660-5665.
10QUINLAN J R. Induction of decision trees[J]. Machine Learning, 1985, 1(1): 81-106.

引证文献2

1达哇彭措.基于数据挖掘的藏语韵律规则提取[J].中国科技信息,2008(18):105-105.
2张晴晴,刘勇,牟少敏,温孚江.基于大数据的小麦蚜虫发生程度决策树预测分类模型[J].大数据,2016,2(1):59-67. 被引量：3

二级引证文献3

1程娇,龚静莲,汪深,刘勇.基于随机森林算法构建白眉野草螟监测预警模型[J].植物保护学报,2019,46(3):549-555. 被引量：2
2解锋,王世锋,苏海燕,廖淑霞,胡想顺.陕西杨凌麦长管蚜发生预测模型构建与验证[J].陕西农业科学,2021,67(5):32-34. 被引量：1
3郁凌华,邢程,荀静,缪新伟,王军,曹文昕,岳伟.基于PSO-SVR模型的小麦赤霉病病穗率预测方法[J].麦类作物学报,2023,43(11):1434-1445. 被引量：2

1朱廷劭,高文.基于机器学习的普通话韵律规则提取[J].自动化学报,2001,27(6):763-769. 被引量：4
2平淡.好窗口不挡道[J].电脑爱好者,2006,0(6):25-25.
3朱廷劭,高文,凌晓峰.神经网络在汉语两字词韵律规则学习中的应用[J].计算机研究与发展,1999,36(6):664-667. 被引量：2
4李斌.语言分析和自动化[J].管理观察,1997,0(2):50-50.
5裴静,王安国,刘楠.人工神经网络在天线设计中的应用[J].电子测量技术,2010,33(11):105-109. 被引量：5
6沙洪洲,郭果敢.马尔可夫链用于仓储建模与仿真[J].计算机仿真,2005,22(4):61-63. 被引量：5
7宋黎明,李明,颜永红.谐波显著度的基频提取方法[J].声学学报,2015,40(2):294-299. 被引量：5
8刘建忠,刘心蓉.一种基于简单背景变化规则的图像滤波方法[J].信息网络安全,2014(8):77-81. 被引量：1
9张雪.语言学分析技术探究[J].教育,2016,0(38):35-35.
10胡波,赵青,凌燮亭.基于盲信号分离的信道均衡算法[J].通信学报,1999,20(2):70-74.

计算机学报

2000年第11期

浏览历史

内容加载中请稍等...

基于数据挖掘的普通话韵律规则学习被引量：2

参考文献1

共引文献81

同被引文献17

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于数据挖掘的普通话韵律规则学习 被引量：2

参考文献1

共引文献81

同被引文献17

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于数据挖掘的普通话韵律规则学习被引量：2