基于能量变化率的汉语塞音检测算法被引量：1

Chinese Stop Detection Based on Energy Change Rate

下载PDF

导出

摘要针对爆发谱特征不稳定的问题,论文提出了一种基于能量变化率的汉语塞音检测方法。该方法首先基于Seneff听觉谱提取了一组描述音段能量变化率特性的参数,然后采用Fisherface方法进行特征变换,变换后的特征采用K近邻(KNN)分类器进行分类,实现了塞音的检测,最后利用留一法对模型性能进行交叉验证。实验结果表明,干净语音塞音检测准确率可以达到96.39%,信噪比10dB的语音塞音检测准确率可达到88.07%,模型具有较好的稳定性和泛化性能。 In order to solve the issue of unreliable burst spectrum feature, a Chinese stop detection method based on energy change rate characteristic is proposed. The energy change rate features are first acquired from the Seneff＇s au- ditory spectrum, and then transformed by Fisherface approach. Finally the KNN classifier is implemented to realize stop detection. Tested by leave-one-out cross validation, the results indicate a good performance of high stability and generalization： the accuracy is 96.39% for clean speech and 88.07% for noisy speech with the SNR of 10dB.

作者张连海陈斌屈丹李弼程

机构地区解放军信息工程大学信息工程学院

出处《中文信息学报》 CSCD 北大核心 2014年第3期116-122,共7页 Journal of Chinese Information Processing

基金国家自然科学基金(61175017)

关键词塞音检测能量变化率发音特性 Seneff听觉模型 stop detection energy change rate articulatory characteristic Seneff auditory model

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献18

1Chin-Hui. Lee, From knowledge-ignorant to knowl- edge-rich modeling: A new speech research paradigm for next generation automatic speech recognition[C]// Proceedings of ICSLP Keynote Speech, 2004: 1137- 1140.
2Jurgen T Geiger, Mohamed Anouar Lakhal, Bjorn Schuller, Gerhard Rigoll. Learning new acoustic e- vents in an HMM-based system using MAP adaptation [C]//Proceedings of INTERSPEECH, 2011 : 293-296.
3David Mejia-Navarrete, Ascensian Gallardo-Antolln, Carmen Pelgez-Moreno. Feature Extraction Assess- ment for an Acoustic-Event ClassificationTask Using the Entropy Triangle [C]//Proceedings of INTER- SPEECH, 2011 :309-312.
4张宝奇,张连海,屈丹.基于听觉事件检测的汉语语音声韵切分[J].声学学报,2010,35(6):701-707. 被引量：7
5Almpanidis G, Kotti M, Kotropoulos, and C., Ro- bust Detection of Phone Boundaries Using Model Se- lection Criteria With Few Observations [ J]. IEEE Transactions on Audio, Speech, and Language Pro- cessing, 2009,17(2) :287-298.
6陈斌,张连海,王波,屈丹.基于Seneff听觉谱特征的汉语连续语音声韵母边界检测[J].声学学报,2012,37(1):104-112. 被引量：6
7M F Dorman. Relative spectral change and formant transitions as cues to labial and alveolar place of articu- lation[J]. J. Acoust. Soc. Am. 1996,100(6):3825- 3830.
8A R Jayan and P C Pandey, Detection of stop land- marks using gaussian mixture model of speech spec- trum[C]//Proceedings of ICASSP, 2009:4681-4684.
9Chi-Yueh Lin, Hsiao-Chuan Wang. Using Burst Onset Information To Improve Stop/Affricate Phone Recog- nition[C]//Proceedings of ICASSP[C], 2010: 4,862- 4865.
10Prem C Pandey, Milind S Shah, Estimation of Place of Articulation During Stop Closures of Vowel Conso- nant Vowel Utterances, IEEE Transactions on Audi- o, Speech, and Language Processing, 2009,17 (2) : 277-286.

二级参考文献35

1栗学丽,丁慧,徐柏龄.基于熵函数的耳语音声韵分割法[J].声学学报,2005,30(1):69-75. 被引量：34
2李朝晖,迟惠生.听觉外周计算模型研究进展[J].声学学报,2006,31(5):449-465. 被引量：22
3Lee Chin-Hui. From knowledge-ignorant to knowledge-rich modeling: A new speech research paradigm for next gen- eration automatic speech recognition. In: Proc. Of ICSLP Keynote speech, Jeju Island, Korea, 2004:213 216.
4Toledano D T, Gomez L A H, Grande L V. Automatic phonetic segmentation. IEEE Transactions on A U- DIO SPEECH and LA NG UA GE Processing, 2005; 11 (6): 617-625.
5Malfrere F, Dutiot T. High-quality speech synthesis for phonetic speech segmentation. In: Proc. Eurospeech'97, Rhodes, Greece, 1997:2631-2634.
6Kuo J W, Wang H M. Minimum boundary error training for automatic phonetic segmentation. In: Proc. Of Interspeech, Pittsburgh, USA. 2006:1497-1500.
7Nuo J W, Lo H Y, Wang H M. Improved HMM/SVM methods for automatic phoneme segmentation. In: Proc. of Interspeech, Antwerp, Belgium, 2007(2): 2057-2060.
8Lo H Y, Wang H M. Phonetic boundary refinement using neural network . In: Proc. of ICASSP, Istanbul, Turkey, 2007:3438-3441.
9van Santen J, Sproat R. High accuracy automatic segmentation. In: Proc. Eurospeech'99, Budapest, Hungary, 1999:2809-2812.
10Sorin Dusan, Lawrence Rabiner. On the relation between maximum spectral transition positions and phone boundaries. In: Proc. of Interspeech, Pittsburgh, USA, 2006(1): 1317-1320.

共引文献14

1高桥,张二华.基于基音周期轨迹的连续汉语语音切分技术研究[J].计算机与数字工程,2023,51(1):163-167.
2黄建新.室外场景下目标分割和目标识别算法[J].华侨大学学报（自然科学版）,2005,26(4):353-356. 被引量：1
3卜先锦,阳东升,沙基昌,张维明.作战过程设计策略及其优选模型[J].火力与指挥控制,2006,31(5):8-12. 被引量：6
4陈斌,张连海,王波,屈丹.基于Seneff听觉谱特征的汉语连续语音声韵母边界检测[J].声学学报,2012,37(1):104-112. 被引量：6
5孙树亮,陈忠,刘政连.改进的分支定界算法[J].软件,2011,32(10):32-34. 被引量：1
6李皓,唐朝京.采用损失函数和声学特征切分声韵母的方法[J].声学学报,2012,37(3):339-345. 被引量：3
7张连海,陈斌,屈丹.基于发音特性的摩擦音和塞擦音分类算法[J].计算机科学,2012,39(9):211-214. 被引量：1
8李立永,张连海,冯志远.基于语谱能量的音素边界检测[J].太赫兹科学与电子信息学报,2013,11(6):936-941. 被引量：1
9李立永,张连海.基于能量谱熵的英语摩擦音检测方法[J].模式识别与人工智能,2014,27(6):554-560.
10贺邓超,张宏军,郝文宁,张睿.基于Parzen窗条件互信息计算的特征选择方法[J].计算机应用研究,2015,32(5):1387-1389. 被引量：4

同被引文献3

1冉启斌,石锋.从音轨方程考察普通话不送气塞音声母的协同发音[J].南开语言学刊,2006(2):45-54. 被引量：7
2吴波.汉语舌尖元音的声学模式分析[J].中国语文,2017(4):468-477. 被引量：6
3吴波.汉语促化元音的声学分析[J].声学学报,2018,43(3):410-416. 被引量：2

引证文献1

1吴波.江淮官话塞音动态性与变异性的声学分析[J].南开语言学刊,2020(1):103-113.

1杨建功,汪西莉.一种结合图割与双水平集的图像分割方法[J].计算机工程与应用,2012,48(3):195-197. 被引量：8
2陈斌,张连海,牛铜,王波.基于能量分布和共振峰结构的汉语鼻音检测[J].中文信息学报,2012,26(1):104-109. 被引量：1
3万卫锋,赵峰.HMM非特定人孤立词语音识别系统的FPGA实现[J].信息技术,2008,32(12):89-92.
4李文军,张洪坤,程秀生.基于小波和神经网络的传感器故障诊断[J].吉林大学学报（工学版）,2004,34(3):491-495. 被引量：17
5徐利敏,唐振民,何可可,钱博.说话人识别中基于聚类特征的矢量量化技术[J].计算机工程与应用,2007,43(27):196-198. 被引量：2
6吕方旭,张金成,王泉,王钰.基于傅里叶基的自适应压缩感知重构算法[J].北京航空航天大学学报,2014,40(4):544-550. 被引量：5
7艾斯卡尔.艾木都拉,赛尔达尔.雅力坤,祖丽皮亚.阿曼,地里木拉提.吐尔逊.维吾尔语浊塞音的声学特征分析[J].清华大学学报（自然科学版）,2013,53(6):828-834. 被引量：1
8杨硕,李辉,洪涛.基于2维能量特征和快速SVM的涡轮泵实时故障检测算法[J].弹箭与制导学报,2014,34(4):107-110.
9谭洁,何凌,唐铭,郑谦,尹恒,郭春丽,.腭裂术后腭咽闭合不全患者声门塞音自动识别[J].计算机工程与设计,2016,37(8):2264-2270.
10王力,张雄,仲雪飞,樊兆雯,张玉,孙瀚.时频分析在语言想像脑机接口中的应用[J].东南大学学报（自然科学版）,2014,44(6):1126-1130. 被引量：5

中文信息学报

2014年第3期

浏览历史

内容加载中请稍等...

基于能量变化率的汉语塞音检测算法被引量：1

参考文献18

二级参考文献35

共引文献14

同被引文献3

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于能量变化率的汉语塞音检测算法 被引量：1

参考文献18

二级参考文献35

共引文献14

同被引文献3

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于能量变化率的汉语塞音检测算法被引量：1