基于听觉事件检测的汉语语音声韵切分被引量：7

Segmentation of Chinese initials and finals based on auditory event detection

下载PDF

导出

摘要提出了一种基于听觉事件检测的汉语声韵母切分方法。该方法首先使用耳蜗滤波器组对语音进行滤波,然后在每个频带上检测对应于能量突变的听觉事件,最后在不同频率范围对听觉事件进行融合以确定声韵母边界。实验结果表明,对8 kHz采样的干净语音切分准确率可达到88.9%;信噪比10 dB的语音切分准确率可达到82.9%以上。 This paper presents a segmentation method of Chinese initials and finals based on the detection of auditory events.According to this method,the voice should first of all be filtered by using the cochlear filter bank,and then the auditory events corresponding to energy mutation in each band are detected.Finally,the auditory events are integrated in different frequency ranges respectively to determine the boundaries of Chinese initials and finals.The experimental results show that with 8 kHz sampling frequency,the accuracy is 88.9%for clean speech and above 82.9%for noisy speech with the SNR of 10 dB.

作者张宝奇张连海屈丹

机构地区解放军信息工程大学信息工程学院

出处《声学学报》 EI CSCD 北大核心 2010年第6期701-707,共7页 Acta Acustica

基金国家高技术研究发展(863)计划项目<海量语音识别综合处理系统>(2006AA01Z146)

关键词事件检测声韵切分汉语语音听觉语音切分频率范围滤波器准确率

分类号 H11 [语言文字—汉语]

引文网络
相关文献

参考文献9

1栗学丽,丁慧,徐柏龄.基于熵函数的耳语音声韵分割法[J].声学学报,2005,30(1):69-75. 被引量：34
2丁慧,栗学丽,徐柏龄.基于听觉模型的耳语音的声韵切分[J].应用声学,2004,23(2):20-25. 被引量：8
3王帆,郑方,吴文虎.基于多尺度分形维数的汉语语音声韵切分[J].清华大学学报（自然科学版）,2002,42(1):68-71. 被引量：14
4朱维彬,张家.汉语语音资料库的语音学标记及人工切分[J].声学学报,1999,24(3):225-235. 被引量：11
5CHEN Xueqin,ZHAO Heming.The research of endpoint detection and initial/final segmentation for Chinese whispered speech. The 8th International Conference on Signal Processing . 2006
6Guoning Hu,De Liang Wang.Auditory segmentation based on onset and offset analysis. IEEE Transactions on Audio,Speech,and Language Processing . 2007
7STEVEN YOUNG,GUNNAR EVERMANN,MARK GALES et al.The HTK Book. . 2006
8Glasberg B R,Moore B C J.Derivation of Auditory Filter Shapes from Notched-Noise Data. Hearing Research . 1990
9Zioko B,Manandhar S,Wilson R C.Phoneme segmentation of speech. Pattern Recognition 2006 ICPR . 2006

二级参考文献32

1陈韬,李昌立,莫福源.汉语孤立字全音节实时识别系统[J].声学学报,1993,18(3):161-171. 被引量：4
2赵鹤呜,周旭东.一种新的听觉感知模型[J].电子科学学刊,1994,16(5):513-517. 被引量：4
3潘凌云,孙达传,吴美朝.语音识别中基于语谱图的语音音素分割方法[J].杭州大学学报（自然科学版）,1995,22(1):42-46. 被引量：7
4齐士钤张家禄.汉语普通话辅音音长分析[J].声学学报,1982,(1):8-13.
5曹剑芬.现代语音基础知识[M].北京:人民教育出版社,1990..
6秦勇.汉语超大词汇语音识别系统的研究与实现.中国科学院声学研究所博士论文[M].,1996..
7Fant G 张家lu等（译）.言语科学与言语技术[M].北京:商务印书馆,1994..
8[1]Kumar K,Mullick S K.Nonlinear dynamical analysis of speech [J].J Acou stic Soc Amer,1996,100(1): 615-629.
9[2]Maragos P.Fractal aspects of speech signals: dimension and interpolation [A].Proc IEEE Int Conf Acoust,Speech,Signal Proc [C].Piscataway,NJ: IEEE,1991.417-420.[3] Thomas T J.A fini te element model of fluid flow in the vocal tract [J].Comput Speech Lang,198 6,1: 131-151.
10[3]Mandelbort B B.The Fractal Geometry of Nature [M].New York: Freeman,1982.

共引文献56

1茹婷婷,谢湘.耳语音数据库的设计与采集[J].清华大学学报（自然科学版）,2008,48(S1):725-729. 被引量：2
2栗学丽,丁慧,徐柏龄.基于熵函数的耳语音声韵分割法[J].声学学报,2005,30(1):69-75. 被引量：34
3LIXueli,XUBoling.Tone features in whispered Chinese[J].Progress in Natural Science:Materials International,2005,15(3):285-288. 被引量：5
4杨莉莉,李燕,徐柏龄.汉语耳语音库的建立与听觉实验研究[J].南京大学学报（自然科学版）,2005,41(3):311-317. 被引量：13
5刘映杰,马义德,刘悦,袁敏,段磊.连续汉语音流中声韵母切分研究[J].甘肃科学学报,2005,17(3):90-93. 被引量：1
6顾明亮,代春倩.一种新的汉语连续语音统计切分算法[J].徐州师范大学学报（自然科学版）,2005,23(4):45-49. 被引量：1
7林玮,杨莉莉,徐柏龄.基于修正MFCC参数汉语耳语音的话者识别[J].南京大学学报（自然科学版）,2006,42(1):54-62. 被引量：23
8樊星,卢晶,徐柏龄.汉语耳语音转换为正常音的研究[J].电声技术,2005,29(12):44-47. 被引量：11
9彭圆,王晟,王科俊,李雪耀,林良骥,林正青,王建文.感知线性预测在水下目标分类中的应用研究[J].声学学报,2006,31(2):146-150. 被引量：16
10杨莉莉,林玮,徐柏龄.汉语耳语音孤立字识别研究[J].应用声学,2006,25(3):187-192. 被引量：8

同被引文献82

1栗学丽,丁慧,徐柏龄.基于熵函数的耳语音声韵分割法[J].声学学报,2005,30(1):69-75. 被引量：34
2邝航宇,张军,韦岗.一种基于检测元音的孤立词端点检测算法[J].电声技术,2005,29(3):40-43. 被引量：5
3李朝晖,迟惠生.听觉外周计算模型研究进展[J].声学学报,2006,31(5):449-465. 被引量：22
4Lee Chin-Hui. From knowledge-ignorant to knowledge-rich modeling: A new speech research paradigm for next gen- eration automatic speech recognition. In: Proc. Of ICSLP Keynote speech, Jeju Island, Korea, 2004:213 216.
5Toledano D T, Gomez L A H, Grande L V. Automatic phonetic segmentation. IEEE Transactions on A U- DIO SPEECH and LA NG UA GE Processing, 2005; 11 (6): 617-625.
6Malfrere F, Dutiot T. High-quality speech synthesis for phonetic speech segmentation. In: Proc. Eurospeech'97, Rhodes, Greece, 1997:2631-2634.
7Kuo J W, Wang H M. Minimum boundary error training for automatic phonetic segmentation. In: Proc. Of Interspeech, Pittsburgh, USA. 2006:1497-1500.
8Nuo J W, Lo H Y, Wang H M. Improved HMM/SVM methods for automatic phoneme segmentation. In: Proc. of Interspeech, Antwerp, Belgium, 2007(2): 2057-2060.
9Lo H Y, Wang H M. Phonetic boundary refinement using neural network . In: Proc. of ICASSP, Istanbul, Turkey, 2007:3438-3441.
10van Santen J, Sproat R. High accuracy automatic segmentation. In: Proc. Eurospeech'99, Budapest, Hungary, 1999:2809-2812.

引证文献7

1陈斌,张连海,王波,屈丹.基于Seneff听觉谱特征的汉语连续语音声韵母边界检测[J].声学学报,2012,37(1):104-112. 被引量：6
2李皓,唐朝京.采用损失函数和声学特征切分声韵母的方法[J].声学学报,2012,37(3):339-345. 被引量：3
3张连海,陈斌,屈丹.基于发音特性的摩擦音和塞擦音分类算法[J].计算机科学,2012,39(9):211-214. 被引量：1
4李立永,张连海,冯志远.基于语谱能量的音素边界检测[J].太赫兹科学与电子信息学报,2013,11(6):936-941. 被引量：1
5李立永,张连海.基于能量谱熵的英语摩擦音检测方法[J].模式识别与人工智能,2014,27(6):554-560.
6张连海,陈斌,屈丹,李弼程.基于能量变化率的汉语塞音检测算法[J].中文信息学报,2014,28(3):116-122. 被引量：1
7冯志远,张连海.基于音素后验概率和层次凝聚聚类算法的音素边界检测[J].太赫兹科学与电子信息学报,2014,12(2):260-265.

二级引证文献11

1XU Menghan,WU Bo.AN ACOUSTIC MODELING STUDY OF FRICATION LEVELS OF HIGH VOWELS IN CHINESE[J].中国语音学报,2022(1):82-95.
2高桥,张二华.基于基音周期轨迹的连续汉语语音切分技术研究[J].计算机与数字工程,2023,51(1):163-167.
3吴波.江淮官话塞音动态性与变异性的声学分析[J].南开语言学刊,2020(1):103-113.
4张连海,陈斌,屈丹.基于发音特性的摩擦音和塞擦音分类算法[J].计算机科学,2012,39(9):211-214. 被引量：1
5张连海,陈斌,屈丹,李弼程.基于能量变化率的汉语塞音检测算法[J].中文信息学报,2014,28(3):116-122. 被引量：1
6王熙月,黄毅鹏,钱佳慧,何凌,黄华,尹恒.基于声学特征的腭裂语音声韵母切分[J].计算机工程与应用,2018,54(8):123-130. 被引量：3
7李洺宇,金小峰.朝鲜语语音音节自动切分算法的研究[J].延边大学学报（自然科学版）,2019,45(2):128-135.
8朱铮宇,邱华愉,杨春玲,王泳.基于特定韵母发音事件分析的语音唇动一致性判决方法[J].华南理工大学学报（自然科学版）,2020,48(1):139-146. 被引量：4
9李学林,赵冬梅,梁明秀.贵州省中部苗语音素边界检测方法研究[J].现代信息科技,2020,4(3):19-21. 被引量：2
10孙梦娜,李天昊.连续语音声韵母自动分段算法研究[J].测控技术,2020,39(11):73-79.

1王帆,郑方,吴文虎.基于多尺度分形维数的汉语语音声韵切分[J].清华大学学报（自然科学版）,2002,42(1):68-71. 被引量：14
2李欢欢,王金明,尹海明,徐志军,孔磊,张开礼.一种改进的基于Viterbi的语音切分算法[J].通信技术,2015,48(9):1027-1031. 被引量：4
3张文军,谢剑英,李聪.基于贝叶斯方法的鲁棒语音切分[J].数据采集与处理,2002,17(3):260-264. 被引量：2
4丁慧,栗学丽,徐柏龄.基于听觉模型的耳语音的声韵切分[J].应用声学,2004,23(2):20-25. 被引量：8
5何致远,胡起秀,徐光祐.两级决策的开集说话人辨认方法[J].清华大学学报（自然科学版）,2003,43(4):516-520. 被引量：12
6刘鑫,鲍长春.基于耳蜗滤波器倒谱参数的音频频带扩展方法[J].清华大学学报（自然科学版）,2013,53(6):913-916. 被引量：1
7林帆,徐明星.一种改进的基于时域参数的语音切分算法[J].计算机科学,2006,33(4):164-167. 被引量：3
8薛化建,董兴华,周喜,吐尔洪.吾司曼,李晓.基于子字单元的维吾尔语语音识别研究[J].计算机工程,2011,37(20):208-210. 被引量：5
9侯丽敏,张吉庆.一种新型汉语语音声韵母切分方法[J].兰州大学学报（自然科学版）,1998,34(3):40-43.
10谢菠荪.头相关传输函数与虚拟听觉重放[J].中国科学（G辑）,2009,39(9):1268-1285. 被引量：13

声学学报

2010年第6期

浏览历史

内容加载中请稍等...

基于听觉事件检测的汉语语音声韵切分被引量：7

参考文献9

二级参考文献32

共引文献56

同被引文献82

引证文献7

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于听觉事件检测的汉语语音声韵切分 被引量：7

参考文献9

二级参考文献32

共引文献56

同被引文献82

引证文献7

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于听觉事件检测的汉语语音声韵切分被引量：7