基于听觉模型的耳语音的声韵切分被引量：8

Initial/final segmentation of Chinese whispered speech based on the auditory model

下载PDF

导出

摘要本文分析了耳语音的特点,并根据生理声学及心理声学的基本理论与实验资料,提出了一种利用听觉模型来进行耳语音声韵切分的方法。这种适用于耳语音声韵切分的听觉感知模型主要分为四个层次:耳蜗对声音频率的分解机理;听觉系统的时域和频域非线性变化;中枢神经系统的侧抑制机理。这种模型能反映在噪声环境下人对低能量语音的听觉感知特性,因而适于耳语音识别,在耳语音声韵母切分实验中得到了满意的结果。 In this paper, the characteristics of whispered speech are discussed, and a new approach for initial/final segmentation of Chinese whispered speech is proposed on the basis of psychological acoustic theories and experiments. With the mainly four levels of signal processing, this model can represent human's perceptual features of low energy speech, so it is more suitable for the whispered speech recognition. With the experiments of the division between the initial and the final of whispered speech included 386 Chinese syllables at 5dB SNR, the results show that the proposed approach can catch the features of whispered speech more accurately.

作者丁慧栗学丽徐柏龄

机构地区南京大学声学所近代声学国家重点实验室

出处《应用声学》 CSCD 北大核心 2004年第2期20-25,44,共7页 Journal of Applied Acoustics

基金国家自然科学基金资助项目(60272037)

关键词耳语音识别声韵切分生理声学心理声学听觉模型 Whispered speech, Auditory model, Initial and final segmentation

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献3

1戴明扬,余凯,徐柏龄,余崇智.强噪声下基于听觉模型的汉语声调提取[J].应用科学学报,2001,19(2):121-126. 被引量：2
2赵鹤呜,周旭东.一种新的听觉感知模型[J].电子科学学刊,1994,16(5):513-517. 被引量：4
3李鸣华.一种基于听觉模型的语音特征提取方法[J].计算机与现代化,2000(3):9-13. 被引量：4

二级参考文献5

1陆生礼,时龙兴,余崇智,魏荣爵.听觉模拟的语音增强方法[J].声学学报,1996,21(6):879-883. 被引量：4
2GB496 385 自由声场纯音标准等响线
3张焱,张杰,黄志同.基于一种听觉模型的特征提取及语音识别[J].南京理工大学学报,1998,22(2):113-116. 被引量：7
4张红,张红,黄泰翼,宋俊寿.一种频域基频提取新方法[J].声学学报,1999,24(4):438-445. 被引量：7
5杨俊,樊昌信.听觉模型及其应用[J].电子科学学刊,1992,14(1):7-14. 被引量：3

共引文献7

1任月平,张大海,张雪英.基于差分过零峰值幅度特征的抗噪语音识别[J].电脑开发与应用,2006,19(8):2-3.
2季连荣.加气混凝土砌块墙体裂缝机理与防治[J].建筑砌块与砌块建筑,2006(6):50-51. 被引量：2
3GUAN Tian,GONG Qin,YE Datian.Electric-stimulus rate encoding algorithm of Mandarin tonal information in cochlear implant[J].Progress in Natural Science:Materials International,2006,16(12):1315-1321. 被引量：2
4赵鹤鸣,周旭东,马廷海,金延庆.语音特征变量统计表示的比较及应用[J].信号处理,1997,13(1):84-88.
5李从清,武方,孙立新,戴士杰.基于分频过零点探测的双耳声源定位[J].河北工业大学学报,2009,38(6):1-5. 被引量：1
6余小清,万旺根,陶安,袁京贤.基于二阶差分耳蜗模型的语音识别新方法[J].应用科学学报,2000,18(1):80-84.
7李俊颉,葛良全.基于SSM的物流管理系统的实现[J].电子制作,2015,23(4Z). 被引量：4

同被引文献93

1陈韬,李昌立,莫福源.汉语孤立字全音节实时识别系统[J].声学学报,1993,18(3):161-171. 被引量：4
2栗学丽,丁慧,徐柏龄.基于熵函数的耳语音声韵分割法[J].声学学报,2005,30(1):69-75. 被引量：34
3杨莉莉,李燕,徐柏龄.汉语耳语音库的建立与听觉实验研究[J].南京大学学报（自然科学版）,2005,41(3):311-317. 被引量：13
4潘凌云,孙达传,吴美朝.语音识别中基于语谱图的语音音素分割方法[J].杭州大学学报（自然科学版）,1995,22(1):42-46. 被引量：7
5周洁,赵力,邹采荣.情感语音合成的研究[J].电声技术,2005,29(10):57-59. 被引量：10
6林玮,杨莉莉,徐柏龄.基于修正MFCC参数汉语耳语音的话者识别[J].南京大学学报（自然科学版）,2006,42(1):54-62. 被引量：22
7樊星,卢晶,徐柏龄.汉语耳语音转换为正常音的研究[J].电声技术,2005,29(12):44-47. 被引量：11
8杨莉莉,林玮,徐柏龄.汉语耳语音孤立字识别研究[J].应用声学,2006,25(3):187-192. 被引量：8
9韩纪庆,邵艳秋.基于语音信号的情感处理研究进展[J].电声技术,2006,30(5):58-62. 被引量：11
10LIN Wei YANG Lili XU Boling.A new frequency scale of Chinese whispered speech in the application of speaker identification[J].Progress in Natural Science:Materials International,2006,16(10):1072-1078. 被引量：5

引证文献8

1栗学丽,丁慧,徐柏龄.基于熵函数的耳语音声韵分割法[J].声学学报,2005,30(1):69-75. 被引量：34
2彭圆,王晟,王科俊,李雪耀,林良骥,林正青,王建文.感知线性预测在水下目标分类中的应用研究[J].声学学报,2006,31(2):146-150. 被引量：16
3杨莉莉,林玮,徐柏龄.汉语耳语音孤立字识别研究[J].应用声学,2006,25(3):187-192. 被引量：8
4何璞.听觉距离的声学因素[J].电声技术,2007,31(11):41-43.
5赵艳,赵力,邹采荣.耳语音的语音处理研究综述[J].声学技术,2008,27(4):562-569. 被引量：4
6谈雪丹,顾济华,赵鹤鸣,陶智,沈圆圆.基于HHT瞬时能频值的含噪耳语音声韵分割[J].通信技术,2010,43(6):207-209. 被引量：1
7张宝奇,张连海,屈丹.基于听觉事件检测的汉语语音声韵切分[J].声学学报,2010,35(6):701-707. 被引量：7
8晁浩,宋成,彭维平.语音识别中声效模式的分析及检测[J].计算机应用研究,2015,32(8):2292-2294. 被引量：3

二级引证文献64

1茹婷婷,谢湘.耳语音数据库的设计与采集[J].清华大学学报（自然科学版）,2008,48(S1):725-729. 被引量：2
2LIXueli,XUBoling.Tone features in whispered Chinese[J].Progress in Natural Science:Materials International,2005,15(3):285-288. 被引量：5
3杨莉莉,李燕,徐柏龄.汉语耳语音库的建立与听觉实验研究[J].南京大学学报（自然科学版）,2005,41(3):311-317. 被引量：13
4林玮,杨莉莉,徐柏龄.基于修正MFCC参数汉语耳语音的话者识别[J].南京大学学报（自然科学版）,2006,42(1):54-62. 被引量：22
5樊星,卢晶,徐柏龄.汉语耳语音转换为正常音的研究[J].电声技术,2005,29(12):44-47. 被引量：11
6杨莉莉,林玮,徐柏龄.汉语耳语音孤立字识别研究[J].应用声学,2006,25(3):187-192. 被引量：8
7国雁萌,付强,颜永红.复杂噪声环境中的语音端点检测[J].声学学报,2006,31(6):549-554. 被引量：16
8王欢良,韩纪庆,李海峰.基于特征似然度加权和维数缩减的Robust语音端点检测[J].声学学报,2007,32(1):62-68. 被引量：7
9GUO Yanmeng FU Qiang YAN Yonghong.Speech endpoint detection in real noise environments[J].Chinese Journal of Acoustics,2007,26(1):39-48. 被引量：5
10钱博,李燕萍,唐振民,徐利敏.基于频域能量分布分析的自适应元音帧提取算法[J].电子学报,2007,35(2):279-282. 被引量：7

1张焱,闵丽娟,黄志同.基于听觉模型的语音特征提取[J].数据采集与处理,2000,15(3):307-311. 被引量：3
2张宝奇,张连海,屈丹.基于听觉事件检测的汉语语音声韵切分[J].声学学报,2010,35(6):701-707. 被引量：7
3荣薇,陶智,顾济华,赵鹤鸣.基于改进LPCC和MFCC的汉语耳语音识别[J].计算机工程与应用,2007,43(30):213-216. 被引量：17
4边缘学科分支最新动向[J].中国无线电电子学文摘,1994(6):111-115.
5刘健.音响漫谈[J].音响技术,2000(4):34-40.
6赵越,林玮.汉语耳元音共振峰与音长特性研究[J].电声技术,2016,40(11):48-52.
7王帆,郑方,吴文虎.基于多尺度分形维数的汉语语音声韵切分[J].清华大学学报（自然科学版）,2002,42(1):68-71. 被引量：14
8祁家堃.音质评价与电、声性能相关性[J].电声技术,2015,39(4):14-16.
9谭泽毅.人如何才能听到声音[J].中学生数理化（八年级物理）（人教版）,2015,0(7):14-15.
10潘平,杨平,何朝霞.基于随机共振的说话人识别方法[J].电信科学,2010,26(S2):74-77. 被引量：5

应用声学

2004年第2期

浏览历史

内容加载中请稍等...

基于听觉模型的耳语音的声韵切分被引量：8

参考文献3

二级参考文献5

共引文献7

同被引文献93

引证文献8

二级引证文献64

相关作者

相关机构

相关主题

浏览历史

基于听觉模型的耳语音的声韵切分 被引量：8

参考文献3

二级参考文献5

共引文献7

同被引文献93

引证文献8

二级引证文献64

相关作者

相关机构

相关主题

浏览历史

基于听觉模型的耳语音的声韵切分被引量：8