期刊文献+

基于短时分形维数的汉语语音自动分段技术研究 被引量:3

Study on automatic segmentation of mandarin speech based on short time fractal dimension
下载PDF
导出
摘要 本文根据汉语语音的构成特点 ,提出了一种新的基于短时分形维数的汉语语音自动分段方法。该方法首先用等差尺度网格维数替代传统盒维数计算方法来快速计算语音信号的分形维数 ,然后在统计、分析汉语男女声 2 1种声母和 3 8种韵母语音信号的分形特性基础上 ,利用中心偏离限定算法来实现汉语语音信号的自动分段。仿真实验表明 ,该方法不但能正确实现不同语速条件下的语音自动分段 ,而且具有噪声鲁棒性 ,是一种有效的汉语语音自动分段技术。 In this paper,a new automatic segmentation technology of Mandarin speech,based on short time fractal dimension,is presented according to the characteristics of Mandarin speech signal First,the conventional Box Dimension is substituted by the Arithmetical Progression Scales Gridding Dimension to reduce the computation cost of short time fractal dimension;Second,based on the statistical analysis of fractal properties of 21 consonants and 38 vowels of Mandarin speech,the automatic segmentation of Mandarin speech was implemented by using the RCDSA(Restricting Centroid Deviation Segment Algorithm) Simulation experiment results show that this method is an efficient automatic segmentation technology of Mandarin speech that not only can segment speech signals with variously articulating velocity correctly,but also has good noisy robustness
出处 《通信学报》 EI CSCD 北大核心 2000年第10期6-13,共8页 Journal on Communications
基金 中国人民解放军总装备部资助项目 华中理工大学博士研究生基金资助课题
关键词 汉语语音 自动分段 分形维数 语音信号处理 mandarin speech automatic segmentation fractal dimension
  • 相关文献

参考文献9

  • 1马大猷 沈豪.声学手册[M].科学出版社,1983..
  • 2王东升 曹磊.混沌、分形及其应用[M].合肥:中国科学技术大学出版社,1995..
  • 3杨行峻 迟惠生.语音信号数学处理[M].北京:电子工业出版社,1995.8-21.
  • 4胡光锐.语音处理与识别[M].上海:上海科技文献出版社,1989..
  • 5韦岗,陆以勤,欧阳景正.混沌、分形理论与语音信号处理[J].电子学报,1996,24(1):34-39. 被引量:33
  • 6王东升,混沌、分形及其应用,1995年
  • 7杨行峻,语音信号数字处理,1995年,8页
  • 8胡光锐,语音处理与识别,1989年
  • 9马大猷,声学手册,1983年,404页

二级参考文献7

共引文献115

同被引文献18

  • 1陈亮,张雄伟.基于分形维数实现语音分割和增强[J].北京邮电大学学报,2003,26(z1):112-114. 被引量:8
  • 2韦岗,陆以勤,欧阳景正.混沌、分形理论与语音信号处理[J].电子学报,1996,24(1):34-39. 被引量:33
  • 3步尼思·法尔科内 曾文曲(译).分形几何中的技巧[M].沈阳:东北大学出版社,1999.218-225.
  • 4Seo J.P Kim M.S.,Baek I.C.,Kwon Y.H.,Lee K.S.,Chang S.W.,Yang S.I..Similar speaker recognition using nonlinear analysis[J].Chaos,Solitons and Fractals,July 2004,21(1),p159-164.
  • 5Hou Limin,Wang Shuozhong.Generalized dimensions applied to speaker identification[C].Biometric Technology for Human Identification,Orlando,FL,USA,12-13 April 2004,p555-560.
  • 6Sengupta R.,Dey N.,Dipali N.,Datta A.K..Comparative Study of fractal behavior in quasi-random and quasi-periodic speech wave map[J].Fractal,2001,9(4),p403-414.
  • 7Sabanal S.,Nakagawa M..The fractal properties of vocal sound and their application in the speech recognition model[J],Chaos,Solitons & Fractals,1996,7 (11),p1825-1 843.
  • 8Petry A.,Barone D.A.C..Speaker identification using nonlinear dynamical feature[J].Chaos,Solitons & Fractals,2002,13(2),p221-231.
  • 9Zhou Yuhuan,Wang Jinming,Zhang Xiongwei.Research on Speaker Recognition Based on Multifractal Spectrum Feature[C].ICCMS'09,Sanya,China,Jan 22-24 2010,p463-466.
  • 10Fan Yingle,Yi Li,Tong Qinye.Speaker gender identification based on combining linear and nonlinear features[C].7th World Congress on Intelligent Control and Automation,WCICA'08,Chongqing,China,Jun 25-27 2008,p6739-6744.

引证文献3

二级引证文献9

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部