基于藤崎模型的汉语语音基频轮廓的参数提取被引量：2

PARAMETER EXTRACTION OF FUNDAMENTAL FREQUENCY CONTOURS OF CHINESE SPEECH BASED ON THE FUJISAKI'S MODEL

下载PDF

导出

摘要基频轮廓就是基频随时间变化的曲线，刻画了汉语中最主要的韵律特征—声调和语调的变化趋势．而藤崎模型则是由日本东京大学藤崎博也教授建立的一种韵律模型，可以用来非常好地逼近汉语语音的基频轮廓（１）．本文提出了一种基于该模型的从汉语单音节的基频轮廓中提取参数的方法．我们首先采用基于小波变换的基音检测技术（３）获取非常准确的给定单字的各基频值，并连接形成基频轮廓，然后根据最小均方误差准则，用藤崎模型来拟合各基频点，最后分析得出模型的最优化参数，作为此基频轮廓的参数． The fundamental frequency contour(f0 contour), which manifests the most important prosody feature ——tone of the spoken Chinese, is the contour of fundamental frequency changing with time. The Fujisaki's Model is a prosodic model set up by H.Fujisaki from Science University of Tokyo in Japan, by which f0 contour of Chinese speech can be well approximated. In this paper we has present a method based on this model for extracting the parameter from f0 contour of the given Chinese syllable. We obtained f0 contour of the given syllable by the pitch extraction method based on the wavelet transform, then the optimal model parameters, which were obtained by minimizing the mean squared error between the extracted f0 contour and the model generated contour, is the parameters of the f0 contour. The validity of the proposed method has been confirmed experimentally.

作者王文剑王长富戴蓓倩陆伟

机构地区中国科技大学电子技术部语音信号处理实验室

出处《小型微型计算机系统》 CSCD 北大核心 1999年第10期756-759,共4页 Journal of Chinese Computer Systems

基金国家自然科学基金

关键词藤崎模型基频轮廓汉语语音参数提联语音合成 Fujisaki's model f0 contour The wavelet transform Minimized mean squared error

分类号 TN912.33 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献3

1杨华中，数值计算方法与C语言工程函数库，1996年
2广濑吉，日本音响学会志，1994年，177页
3Wang Changfu，1994 Japan China Sympo Advanced Information Technology，55页

同被引文献22

1覃福森.英语音高与英语语调关系研究[J].学术问题研究,2007,0(1):76-82. 被引量：6
2闫友彪,陈元琰.机器学习的主要策略综述[J].计算机应用研究,2004,21(7):4-10. 被引量：56
3汪峥,连翰,王建军.说话人识别中特征参数提取的一种新方法[J].复旦学报（自然科学版）,2005,44(1):197-200. 被引量：16
4张万里,刘桥.Mel频率倒谱系数提取及其在声纹识别中的作用[J].贵州大学学报（自然科学版）,2005,22(2):207-210. 被引量：20
5李财莲,赵小阳,王丽娟,岳振军.说话人识别中关键技术的现状与发展[J].军事通信技术,2005,26(2):62-65. 被引量：3
6白莹,赵振东,戚银城,王斌,郭建勇.基于小波神经网络的与文本无关说话人识别方法研究[J].电子与信息学报,2006,28(6):1036-1039. 被引量：7
7王金明,张雄伟.一种模糊高斯混合说话人识别模型[J].解放军理工大学学报（自然科学版）,2006,7(3):214-219. 被引量：5
8H. Fujisaki, S. Ohno, O. Tom Ita. Automatic Parameter Extraction of Fundamental Frequency Contours of Speech Based on a Generative Model[J].Proceedings of ICSP'96,1996,1 : 729-732.
9Paul A. Taylor. The Rise/Fall/Connection Model of Intonation[J].Speech Communication, 1995,15: 169-186.
10IEEE. IEEE recommended practice for speech quality measurements[J]. IEEE Trans. on Audio and Electroacoust Sep. 1969: 227-246.

引证文献2

1朱浩冰,郭东辉.声纹识别系统原理及其关键技术[J].计算机安全,2007(9):14-17. 被引量：15
2王磊,刘加.基于RFC模型的基频曲线导数域编码方法研究[J].中文信息学报,2009,23(6):86-90. 被引量：1

二级引证文献16

1刘勇,刘梦莲.声纹认证在呼叫中心的应用[J].广东通信技术,2009,29(10):72-75. 被引量：2
2聂新平,刘加.基于ARM9的英语发音质量评价系统[J].电声技术,2010,34(8):57-60. 被引量：1
3张汝霞,李苏梅.小规模人员语音辨识系统的研究[J].现代计算机（中旬刊）,2013(1):12-16.
4钟力强,钟飞,马庆增,黄丰.声纹识别与支柱瓷绝缘子的振动声学检测[J].广东电力,2013,26(12):97-101. 被引量：12
5陈泰,张虹冕.安徽省智能语音产业竞争力分析及发展建议[J].管理观察,2014(12):55-57.
6鲁晓倩,关胜晓.基于VQ和GMM的实时声纹识别研究[J].计算机系统应用,2014,23(9):6-12. 被引量：3
7张凯.浅谈广播音频监测的几种应用技术[J].电声技术,2016,40(4):45-47. 被引量：2
8刘苏,徐璐.声纹识别技术在听音知人中的应用[J].通讯世界,2017,23(1):227-228. 被引量：1
9赵凯.关于“声纹鉴定”课程教学的探讨[J].科教文汇,2017(4):75-76.
10李酉杰.三维激光源扫描定位系统的声纹变化识别[J].激光杂志,2017,38(7):204-207. 被引量：1

1田岚,陆小珊,杨霓清.浊声基频轮廓对汉语合成自然度提高的分析与综合[J].山东大学学报（工学版）,2003,33(4):413-416. 被引量：1
2田岚,陆小珊.一种数据驱动的汉语成句语音韵律特征产生模型的研究[J].控制与决策,2003,18(6):656-660. 被引量：2
3熊庆旭.以565Mb/s的码率传输HDTV的压缩编码方案[J].电子学报,1993,21(4):95-97.
4张延平,陈锡先,蔡长年.一种新的全汉语单音节语音识别算法[J].信号处理,1992,8(3):143-151.
5曹洪.一种新型汉语单音节识别方法[J].清华大学学报（自然科学版）,1990,30(4):87-92.
6江太辉.一种改进的语音基频轮廓提取算法[J].五邑大学学报（自然科学版）,2002,16(2):27-30. 被引量：3
7赵春霞,徐近霈.一种汉语单音节基音提取与声调识别方法[J].应用声学,1990,9(3):31-37. 被引量：3
8马晓毅,毛德行.一种汉语单音节粗分类方法[J].电子计算机与外部设备,1997,21(3):2-4.
9付翔,张小飞.基于MUSIC算法的MIMO雷达的角度估计[J].滁州学院学报,2012,14(2):39-41. 被引量：3
10刘云海,虞露,姚庆栋.模型基编码的运动参数估计及误差准则[J].通信学报,2000,21(4):1-7. 被引量：1

小型微型计算机系统

1999年第10期

浏览历史

内容加载中请稍等...

基于藤崎模型的汉语语音基频轮廓的参数提取被引量：2

参考文献3

同被引文献22

引证文献2

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

基于藤崎模型的汉语语音基频轮廓的参数提取 被引量：2

参考文献3

同被引文献22

引证文献2

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

基于藤崎模型的汉语语音基频轮廓的参数提取被引量：2