基于倒谱距离窗移最小失真分割的语种辨识被引量：2

Language Identification Based on Minimum Distortion of Cepstrum Distance Segmentation

下载PDF

导出

摘要提出一种语种辨识的新方法.采用一种无需对语音文件进行标注的方法,提出基于倒谱距离窗移最小失真分割子词,在语种辨识前端用子词的自动分割方法把语音信号分割成许多子词.对得到的所有子词进行聚类并对每一类建立一个隐马尔可夫模型(HMM),最后利用得到的所有的子词模型对输入语音进行语种辨识.实验表明,该方法是一种简洁而且有效的语种辨识方法. We propose a novel approach to language identification. Generally speaking, an ideal language identification system needs a large number of speech transcriptions at the phoneme level for training the phone model, involving a huge amount of work and cost. In this project, we use a rough segmentation instead of transcription to produce sub-words, and a front-end sub-words recognizer for individual languages to be identified. This is followed by clustering the sub-words and creating an HMM for each cluster. Preliminary results on language identification are provided to demonstrate simplicity and effectiveness of this approach.

作者缪炜侯丽敏

机构地区上海大学通信与信息工程学院

出处《上海大学学报（自然科学版）》 CAS CSCD 北大核心 2007年第2期116-120,共5页 Journal of Shanghai University:Natural Science Edition

关键词隐马尔可夫模型语种辨识子词分割 idden markov model （HMM） language identification sub-words segmentation

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献8

1杜利民.自动语言辨识研究(上)[J].电子科技导报,1996(4):16-19. 被引量：3
2ZISSMAM M A.Comparison of four approaches to automatic language identification of telephone speech[J].Speech and Audio Processing,1996,4:31-44.
3MARTIN T.A syllable-scale framework for hmguage identification[J].Computer Speech and Language,2006,20:276-302.
4JAYRAM A K V,RAMASUBRAMANIAN V,SREENIVAS T V.Lauguage identification using parallel sub-word recognition[C]//ICASSP'03.2003,1:32-35.
5胡光锐,韦晓东.基于倒谱特征的带噪语音端点检测[J].电子学报,2000,28(10):95-97. 被引量：71
6HCONE J.Continuous speech recognition using hidden Markov models[J].ASSP Magazine,Signal Processing Magazine,1990,7(3):26-41.
7NAGARAJAN T,MURTHY H A.Language identification using parallel syllable-like unit recognition[C]//ICASSP'04.2004,1:I-401-4.
8MUTHUSAMY Y K,COLE R A,OSHIKA B T.The OGI multi-langnage telephone speech corpus[C]//ICSLP'92.1992:895-899.

二级参考文献1

1Lee C H，Automatic Speech and speaker recognition-advanced topics，1996年

共引文献72

1马道钧,陈天策,高婕.语音端点检测方法的分析与实现[J].北京电子科技学院学报,2007,15(4):66-69. 被引量：3
2王晓亚,鲁玉海.语音的端点检测处理技术[J].无线电工程,2010,40(2):16-18. 被引量：7
3刘宇红,刘桥,任强.基于改进的模糊ART的语音信号端点检测与切分[J].系统工程与电子技术,2004,26(8):1151-1154. 被引量：6
4于迎霞,史家茂.一种改进的基于倒谱特征的带噪端点检测方法[J].计算机工程,2004,30(19):85-87. 被引量：13
5沈乐君,程小平.基于模式的实时音频流分割与控制系统[J].计算机工程与设计,2004,25(7):1211-1213. 被引量：2
6陈振标,徐波.基于子带能量特征的最优化语音端点检测算法研究[J].声学学报,2005,30(2):171-176. 被引量：22
7胡大雷,刘珩.高噪声环境下的语音活动检测技术[J].中国农业大学学报,2005,10(3):65-68. 被引量：2
8杨胜跃,周宴宇,黄深喜.语音信号端点检测方法与展望[J].信息技术,2005,29(7):5-8. 被引量：4
9李鹏怀,徐佩霞.基于DSP的嵌入式语音识别系统的实现[J].计算机工程,2005,31(16):160-162. 被引量：10
10王博,郭英,李宏伟,韩立峰.基于倒谱距离的语音端点检测改进算法[J].空军工程大学学报（自然科学版）,2006,7(1):59-63. 被引量：10

同被引文献22

1于迎霞,史家茂.一种改进的基于倒谱特征的带噪端点检测方法[J].计算机工程,2004,30(19):85-87. 被引量：13
2王博,郭英,李宏伟,韩立峰.基于倒谱距离的语音端点检测改进算法[J].空军工程大学学报（自然科学版）,2006,7(1):59-63. 被引量：10
3BARKAT D M, VASILESCU I, PELLEGRINO F. Strategies perceptuelles et identification automatique des langues [ J]. Revue Parole, 2003(25/26) : 1-37.
4FARINAS J, PELLEGRINO F, ROUAS J L, et al. Merging segmental and rhythmic features for automatic language identification [ C]// ICASSP' 02. 2002:753-756.
5ROUAS J L, FARINAS J, PELLEGRINO F. Automatic modelling of rhythm and intonation for language identification [ C ] // 15th International Congress of Phonetic Sciences. 2003 : 567-570.
6ADAMI A G, HERMANSKY H. Segmentation of speech for speaker and language recognition [ C ] // Proc Eurospeech. 2003 : 841-844.
7ROUAS J L, FARINAS J, PELLEGRINO F, et al. Rhythmic unit extraction and modelling for automatic language identification [ J ]. Speech Communication, 2005, 47(4) : 436-456.
8PELLEGRINO F, ANDRE O R. From vocalic detection to automatic emergence of vowel systems [ C ] Jj ICASSP' 97. 1997 : 1651-1654.
9JESTEAD W, BACON S P, LEHMAN J R. Forward masking of diotic and dichotic clicks by noise [ J ]. Journal of the Acoustical Society of America, 1982, 72 (4) :1171-1177.
10GREENBERG S. Understanding speech understandingtowards a unified theory of speech perception [ C ]// Proc ESCA Tutorial and Advanced Research Workshop on the Auditory Basis of Speech Perception. 1996:1-8.

引证文献2

1侯丽敏,缪炜.基于韵律信息的语种辨识系统[J].上海大学学报（自然科学版）,2009,15(5):441-444.
2赵新燕,王炼红,彭林哲.基于自适应倒谱距离的强噪声语音端点检测[J].计算机科学,2015,42(9):83-85. 被引量：15

二级引证文献15

1张启志,邱锦波,庄德玉.基于倒谱距离的采煤机煤岩截割振动信号识别[J].工矿自动化,2017,43(1):9-12. 被引量：12
2韩云飞,张太红,白涛.融合Mel系数和kNN的语音端点检测[J].信息技术,2017,41(3):37-41. 被引量：2
3张毅,王可佳,席兵,颜博.基于子带能熵比的语音端点检测算法[J].计算机科学,2017,44(5):304-307. 被引量：11
4田秀丽,黄亚丽.空间噪声下语音信号端点检测仿真研究[J].计算机仿真,2017,34(5):406-409. 被引量：3
5王群,曾庆宁,郑展恒.低信噪比下语音端点检测算法的改进研究[J].科学技术与工程,2017,17(21):50-56. 被引量：8
6张涛,章小兵,朱明星.低信噪比环境下改进的倒谱距离语音端点检测算法[J].电声技术,2017,41(7):108-112. 被引量：2
7李锋,孙文杰,张帆.适应强旋翼噪声环境的语音系统设计与实现[J].信息技术与信息化,2016(12):74-78.
8包永强,梁瑞宇,王青云.音频取证中录音设备识别研究进展[J].数据采集与处理,2018,33(5):779-792. 被引量：3
9苗晓孔,张雄伟.采用骨导语音自适应的语句分割方法[J].应用声学,2019,38(1):68-75.
10杨海燕,吴雷,周萍.基于压缩感知和MFCC的语音端点检测算法[J].测控技术,2019,38(5):88-93. 被引量：2

1邹荣.最小失真图像去雾算法的改进[J].计算机工程,2009,35(21):213-215. 被引量：8
2曾秀花,杨鉴,徐永华.语种辨识的多特征信息应用[J].计算机工程与应用,2010,46(25):146-148. 被引量：2
3成新民.基于帧变换的与文本无关语种辨识系统的实现[J].微电子学与计算机,2004,21(12):131-134. 被引量：1
4何俊红,王彪.基于倒谱距离—频带方差的端点检测方法[J].计算机与数字工程,2014,42(11):2014-2016. 被引量：3
5段金凤.语音端点检测方法探讨[J].电脑与电信,2009(4):91-92.
6武毅博,李霏,黎文.语音端点检测和基于自适应控制的语音噪声滤波[J].工业控制计算机,2015,28(8):93-95.
7赵新燕,王炼红,彭林哲.基于自适应倒谱距离的强噪声语音端点检测[J].计算机科学,2015,42(9):83-85. 被引量：15
8庞全,陈晨方,杨翠容.基于美尔倒谱系数和复杂性的语种辨识[J].计算机工程,2008,34(19):203-205. 被引量：2
9黄剑文.多通道语音增强算法的比较研究[J].福建电脑,2013,29(10):68-69. 被引量：1
10王作英,孙健.一般拓扑结构的非齐次隐含马尔科夫模型及其在中、英文语种辨识中的应用[J].电子与信息学报,2007,29(4):867-869. 被引量：1

上海大学学报（自然科学版）

2007年第2期

浏览历史

内容加载中请稍等...

基于倒谱距离窗移最小失真分割的语种辨识被引量：2

参考文献8

二级参考文献1

共引文献72

同被引文献22

引证文献2

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于倒谱距离窗移最小失真分割的语种辨识 被引量：2

参考文献8

二级参考文献1

共引文献72

同被引文献22

引证文献2

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于倒谱距离窗移最小失真分割的语种辨识被引量：2