基于听觉模型的汉语耳语音声调检测被引量：5

Perceiving of Tone in Whispered Chinese Based on Auditory Model

下载PDF

导出

摘要从听觉感知出发,分析了听觉外周模型对于语音激励的主要响应过程,采取听神经平均发放率为声调感知线索,提出了一种汉语耳语音声调的识别方法.其理论基础是听神经发放信息是听觉中枢的唯一信息来源,它是对于语音激励中声强、频谱、共振峰等多种特征的综合反应,因此适合用作耳语音的声调特征.采用BP神经网络对大量汉语元音耳语四声样本进行训练、识别,得到65.1%的平均识别率,达到了改善汉语耳语音声调识别效果的目的. Based on the analysis of the response of a peripheral auditory model for speech stimulation, the average firing rate of auditory nerves is chosen as the cue for whispered tone. Thus a method for whispered Chinese tone perceiving is proposed. The underlying principle is based on the fact that auditory nerve is the only source of information for central auditory system and it responds to several types of acoustic stimulus such as intensity, formant,etc. Therefore the average firing rate of auditory nerves is a suitable characteristic for the tone of whispered speech. The BP artificial neural network was trained by these proposed parameters to achieve tone recognition. Experiments are performed on a lot of Chinese whispered speech data and the average correct rate reaches 65.1%, which shows that the proposed method is effective for improving the performance of whispered Chinese tone perceiving.

作者陈雪勤赵鹤鸣

机构地区苏州大学电子信息学院

出处《电子学报》 EI CAS CSCD 北大核心 2009年第4期864-867,共4页 Acta Electronica Sinica

基金国家自然基金(No.60572076) 江苏省高校自然科学基金(No.05KJB510113)

关键词声调检测汉语耳语音听觉模型听神经平均发放率 tone detection whispered Chinese auditory model the average firing rate of auditory nerves

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献15

1Morris R W. Enhancement and recognition of whispered speech [ D]. USA: Georgia Institute of Technology ,2002.
2Ito T, Takeda K. Analysis and recognition of whispered speech [ J] .Speech Communication, 2005,45(2) : 139 - 152.
3罗亚飞,鲍长春.基于DCT分带谱熵与信号分解的高精度基音检测算法[J].电子学报,2007,35(1):13-22. 被引量：5
4黄海,潘家强.基于Hilbert-Huang变换的基音周期提取方法[J].声学学报,2006,31(1):35-41. 被引量：11
5Meyer-eppler W. Realization of prosodic features in whispered speech [J]. Journal of Acoustical Society of America, 1957,29 (1) :104- 106.
6Martin Kloster Jenson. Recognition of word tones in whispered speech[ J]. Word, 1958,14:187 - 196.
7沙丹青,栗学丽,徐柏龄.耳语音声调特征的研究[J].电声技术,2003,27(11):4-7. 被引量：21
8Man-gao. Tones in whispered Chinese: articulatory features and perceptual cues[ D ]. Thesis of Master, University of Victoria, Canada, 2002.
9LIXueli,XUBoling.Tone features in whispered Chinese[J].Progress in Natural Science:Materials International,2005,15(3):285-288. 被引量：5
10吴玺宏,迟惠生,王楚.基于听觉外周模型的语音信号听觉神经表示[J].生物物理学报,1997,13(2):213-220. 被引量：6

二级参考文献54

1栗学丽,丁慧,徐柏龄.基于熵函数的耳语音声韵分割法[J].声学学报,2005,30(1):69-75. 被引量：34
2Taisuke Itoh, Kazuya Takeda, Fumitada Itakura. Acoustic Analysis and Recognition of Whispered Speech[J]. ICASSP,2002: 389-392.
3Robert W. Morris, Mark A. Clements. Reconstruction of Speech from Whispers [J]. Medical Engineering & Physics, 200'2,24: 515-520.
4Qian-Jie Fu,Fan-Gang Zeng. Identification of Temporal Envelope Cues in Chinese Tone Recognition [J]. Asia Pacific Journal of Speech, Language and Hearing,2000,(5) :45-57.
5Man Gao. Tones in Whispered Chinese:Articulatory and PerceptualCues. [Master], University of Victoria,2002.
6W Meyer Eppler. Realization of Prosodic Features in Whispered Speech [J]. Journal of Acoustical Society of America, 1957, 29( 1 ) : 104-106.
7林茂灿.普通话声调的声学特性和知觉征兆[J].中国语文,1988,(2):182-193.
8Ross M, Shaffe H, Cohen A, Freudberg R et al. Average magnitude difference function pitch extractor. IEEE Trans on Acoustics, Speech and Signal Processing, 1974; 22(5):353-362
9Rabiner L R. On the use of autocorrelation analysis for pitch detection. IEEE Trans. ASSP, 1977; ASSP-25(1):24-33
10Noll A M. Cepstrum pitch determination. J. Acoust. Soc.Am., 1967; 41(2): 293-309

共引文献43

1李晗菲,冯燕,孟亚茹,彭刚.能量包络和音长对普通话声调感知的影响[J].中国语音学报,2019(1):49-59. 被引量：1
2范影乐,俞祁焰,李轶,庞全.基于Hilbert-Huang变换的含噪语音特征分析[J].传感技术学报,2007,20(10):2288-2293. 被引量：3
3LIXueli,XUBoling.Tone features in whispered Chinese[J].Progress in Natural Science:Materials International,2005,15(3):285-288. 被引量：5
4杨莉莉,李燕,徐柏龄.汉语耳语音库的建立与听觉实验研究[J].南京大学学报（自然科学版）,2005,41(3):311-317. 被引量：13
5宋益丹.汉语声调实验研究回望[J].语文研究,2006(1):41-45. 被引量：17
6樊星,卢晶,徐柏龄.汉语耳语音转换为正常音的研究[J].电声技术,2005,29(12):44-47. 被引量：11
7杨莉莉,林玮,徐柏龄.汉语耳语音孤立字识别研究[J].应用声学,2006,25(3):187-192. 被引量：8
8马勇,顾明亮.基于庞加莱截面的语音基音检测[J].电声技术,2006,30(8):39-42. 被引量：1
9李朝晖,迟惠生.听觉外周计算模型研究进展[J].声学学报,2006,31(5):449-465. 被引量：22
10LIN Wei YANG Lili XU Boling.A new frequency scale of Chinese whispered speech in the application of speaker identification[J].Progress in Natural Science:Materials International,2006,16(10):1072-1078. 被引量：5

同被引文献43

1茹婷婷,谢湘.耳语音数据库的设计与采集[J].清华大学学报（自然科学版）,2008,48(S1):725-729. 被引量：2
2栗学丽,丁慧,徐柏龄.基于熵函数的耳语音声韵分割法[J].声学学报,2005,30(1):69-75. 被引量：34
3林玮,杨莉莉,徐柏龄.基于修正MFCC参数汉语耳语音的话者识别[J].南京大学学报（自然科学版）,2006,42(1):54-62. 被引量：23
4樊星,卢晶,徐柏龄.汉语耳语音转换为正常音的研究[J].电声技术,2005,29(12):44-47. 被引量：11
5陶智,赵鹤鸣,顾济华,吴迪.基于心理声学模型和临界频带子波变换的数字声频水印[J].声学学报,2006,31(2):114-119. 被引量：15
6李国锋,刘莹.利用倒谱方法实现气声发育的重建[J].应用声学,1996,15(5):41-44. 被引量：5
7张翠玲,谭铁军,刘昇.伪装语音的自动话者识别研究[J].刑事技术,2007,32(2):18-21. 被引量：4
8S Furui. Digital Speech Processing, Synthesis, and Recognition [ M]. New York: Marcel Dekker, 2001.
9H Gish, M Schmidt. Text-independent speaker identification [ J]. IEEE Signal Proc, 1994,11 (4): 18 - 32.
10D A Reynolds, et al. The SuperSID project: Exploiting high- level information for high-accuracy speaker recognition [ A ]. International Conference on Acoustics, Speech, and Signal Processing[ C]. Hong Kong, China: IEEE, 2003.4:784 - 787.

引证文献5

1王玥,钱志鸿,王雪,程光明.基于伽马通滤波器组的听觉特征提取算法研究[J].电子学报,2010,38(3):525-528. 被引量：28
2王敏,赵鹤鸣.基于多带解调分析和瞬时频率估计的耳语音话者识别[J].声学学报,2010,35(4):471-476. 被引量：12
3陶智,赵鹤鸣,谈雪丹,顾济华,张晓俊,吴迪.采用扩展型双线性变换法将耳语音转换为正常语音的研究[J].声学学报,2012,37(6):651-658. 被引量：4
4TAO Zhi,ZHAO Heming,TAN Xuedan,GU Jihua,ZHANG Xiaojun,WU Di.Conversion from whispered speech to normal speech using the extended bilinear transformation method[J].Chinese Journal of Acoustics,2013,32(4):425-438. 被引量：1
5龚呈卉,赵鹤鸣,陶智,张庆芳.全局谱参数下的耳语说话人状态因子分析[J].声学学报,2014,39(2):281-288. 被引量：1

二级引证文献44

1李佳芮,洪缨.喘鸣音的声谱图熵特征分析及检测[J].声学学报,2020,45(1):131-136. 被引量：3
2何朝霞,潘平.基于听觉模型的说话人语音特征提取[J].微型机与应用,2012,31(1):37-39. 被引量：2
3王磊,彭圆,林正青,蒋行海,牟林,张凤珍.听觉外周计算模型在水中目标分类识别中的应用[J].电子学报,2012,40(1):199-203. 被引量：21
4黄山奇,张连海,屈丹.一种基于人耳听觉感知和子带补偿滤波的鲁棒语言辨识特征参数提取算法[J].模式识别与人工智能,2012,25(1):166-171. 被引量：2
5黄永明,章国宝,李雄,达飞鹏.全局特征及弱尺度融合策略的小样本语音情感识别[J].声学学报,2012,37(3):330-338. 被引量：9
6张潇丹,包永强,奚吉,赵力,邹采荣.基于MD-CM-SFLA神经网络的耳语音情感识别[J].东南大学学报（自然科学版）,2012,42(5):848-853. 被引量：2
7胡峰松,曹孝玉.基于Gammatone滤波器组的听觉特征提取[J].计算机工程,2012,38(21):168-170. 被引量：29
8陈雪勤,赵鹤鸣.有效高斯分量通用背景模型下耳语音声道系统转换研究[J].声学学报,2013,38(2):195-200. 被引量：5
9颜鑫,李应.利用抗噪幂归一化倒谱系数的鸟类声音识别[J].电子学报,2013,41(2):295-300. 被引量：17
10林琳,陈虹,陈建.基于鲁棒听觉特征的说话人识别[J].电子学报,2013,41(3):619-624. 被引量：10

1陈雪勤,赵鹤鸣,俞一彪.蚁群聚类神经网络的耳语音声调识别[J].应用科学学报,2008,26(5):511-515.
2徐敏,赵鹤鸣,陈雪勤,潘欣裕.基于OSF的汉语耳语音的端点检测[J].苏州大学学报（工科版）,2007,27(3):1-4. 被引量：1
3荣薇,陶智,顾济华,赵鹤鸣.基于概率神经网络的汉语耳语音识别系统[J].计算机工程与应用,2008,44(17):148-150. 被引量：3
4黄泽镇,杨行峻.普通话孤立字四声的一种模式识别方法[J].声学学报,1990,15(1):36-43. 被引量：7
5林玮,杨莉莉,徐柏龄.基于修正MFCC参数汉语耳语音的话者识别[J].南京大学学报（自然科学版）,2006,42(1):54-62. 被引量：23
6荣薇,陶智,顾济华,赵鹤鸣.基于改进LPCC和MFCC的汉语耳语音识别[J].计算机工程与应用,2007,43(30):213-216. 被引量：17
7杨莉莉,林玮,徐柏龄.汉语耳语音孤立字识别研究[J].应用声学,2006,25(3):187-192. 被引量：8
8潘欣裕,赵鹤鸣.中文耳语元音的声调特征研究[J].信号处理,2011,27(10):1525-1530. 被引量：3
9杨莉莉,李燕,徐柏龄.汉语耳语音库的建立与听觉实验研究[J].南京大学学报（自然科学版）,2005,41(3):311-317. 被引量：13
10沙丹青,栗学丽,徐柏龄.耳语音声调特征的研究[J].电声技术,2003,27(11):4-7. 被引量：21

电子学报

2009年第4期

浏览历史

内容加载中请稍等...

基于听觉模型的汉语耳语音声调检测被引量：5

参考文献15

二级参考文献54

共引文献43

同被引文献43

引证文献5

二级引证文献44

相关作者

相关机构

相关主题

浏览历史

基于听觉模型的汉语耳语音声调检测 被引量：5

参考文献15

二级参考文献54

共引文献43

同被引文献43

引证文献5

二级引证文献44

相关作者

相关机构

相关主题

浏览历史

基于听觉模型的汉语耳语音声调检测被引量：5