基于LDOF准则的自适应高斯后端语种识别方法被引量：3

Adaptive Gaussian back-end based on LDOF criterion for language recognition

下载PDF

导出

摘要针对由语种类内多样性引起的测试样本和训练模型不匹配的问题,提出一种基于局部距离离群因子准则(LDOF,local distance-based outlier factor)的自适应高斯后端语种识别方法。定义LDOF准则,实现有效的参数寻优过程并动态地在多类语种训练集上挑选出与测试样本特性相近的训练样本,调整原高斯后端,进而得到改进的语种识别方法。在NIST LRE 2009的6个易混淆语种任务集上的实验结果表明,所提方法的等错误概率(EER,equal error rate)和平均检测代价有显著提升。 In order to alleviate the mismatch in model between training and testing samples caused by inter-language variations, adaptive Gaussian back-end based on LDOF criterion was proposed for language recognition. The local distance-based outlier factor（LDOF） criterion was defined to find the appropriate model parameters and dynamically select the training data subset similar to the testing samples from multiple class training sets. Then original back-end was adjusted to obtain a more matched recognition model. Experimental results on NIST LRE 2009 easily-confused language data set show that proposed method achieves an obvious performance improvement on both the equal error rate（ERR） and average decision cost function.

作者叶中付戚婷李赛峰宋彦 YE Zhong-fu QI Ting LI Sai-feng SONG Yan(School of Information Science and Technology, University of Science and Technology of China, Hefei 230027, China National Engineering Laboratory for Speech and Language Information Processing, University of Science and Technology of China, Hefei 230027, China State Key Laboratory of Mathematical Engineering and Advanced Computing, Wuxi 214125, China)

机构地区中国科学技术大学信息科学技术学院中国科学技术大学语音及语言信息处理国家工程实验室数学工程与先进计算国家重点实验室

出处《通信学报》 EI CSCD 北大核心 2017年第4期17-24,共8页 Journal on Communications

基金数学工程与先进计算国家重点实验室开放基金资助项目(No.2015A15)~~

关键词语种识别类内多样性自适应高斯后端 LDOF language recognition inter-language variations adaptive Gaussian back-end LDOF

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献2

1杨绪魁,屈丹,张文林.正交拉普拉斯语种识别方法[J].自动化学报,2014,40(8):1812-1818. 被引量：3
2洪新海,宋彦,蒋兵,戴礼荣.采用DBN的TV改进方法在语种识别中的应用[J].信号处理,2015,31(9):1152-1158. 被引量：4

二级参考文献33

1Zissman M A. Comparison of four approaches to automatic language identification of telephone speech. IEEE Transac- tions Speech and Audio Process, 1996, 4(3): 31-44.
2Campbell W M, Sturim D E, Reynolds D A. Support vector machine using GMM supervectors for speaker verification. IEEE Signal Processing Letters, 2006, 13(5): 308-311.
3Kenny P. Factor Analysis of Speaker and Session Variability Theory and Algorithms, Technical Report CRIM-06/08-13 Montreal, CRIM, 2005.
4Kenny P, Boulianne G, Oullet P, Dumouchel P. Joint factor analysis versus eigenchannels in speaker recognition. IEEE Transactions on Audio, Speech, and Language Processing, 2007, 15(4): 1435-1447.
5Martinez D, Plchot O, Burget L, Glembek O, Matejka P. Language Recognition in iVectors Space. In: INTER- SPEECH. Florence, Italy: ISCA, 2011. 861-864.
6Dehak N, Torres P A, Reynolds D, Dehak R. Language recognition via iVectors and dimensionality reduction. In: INTERSPEECH. Florence, Italy: ISCA, 2011. 857-860.
7Tipping M E, Bishop C M. Probabilistic principal compo- nent analysis. Journal of the Royal Statistical Society: Series B (Statistical Methodology), 1999, 61(3): 611-622.
8Turk M, Pentland A P. Face recognition using eigenfaces. In: Proceedings of the IEEE Conference on Computer Vi- sion and Pattern Recognition. Maui, Hawaii: IEEE, 1991. 586-591.
9曾宪华.流形学习的谱方法相关问题研究[博士学位论文],北京交通大学,中国,2009.
10Yang J C, Liang C Y, Yang L, Suo H B, Wang J J, Yan Y H. Factor analysis of Laplacian approach for speaker recogni- tion. In: Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP). Ky- oto, Japan: IEEE, 2012. 4221-4224.

共引文献5

1许美玲,韩敏.多元混沌时间序列的因子回声状态网络预测模型[J].自动化学报,2015,41(5):1042-1046. 被引量：19
2张涛涛,陈丽萍,戴礼荣.说话人确认中以音素为中心的特征端因子分析[J].信号处理,2016,32(10):1213-1219. 被引量：1
3郝洺,徐博,殷绪成,王方圆.基于n-gram频率的语种识别改进方法[J].自动化学报,2018,44(3):453-460. 被引量：5
4孙杰,王宏,吾守尔·斯拉木.结合注意力机制和因果卷积网络的维吾尔语方言识别[J].声学技术,2020,39(6):697-703. 被引量：3
5陈亮,邵玉斌,龙华,杜庆治,彭艺,唐维康.基于时域Gammatone滤波特征的广播语种识别[J].信号处理,2022,38(3):599-608. 被引量：3

同被引文献14

1张卫强,刘加.基于听感知特征的语种识别[J].清华大学学报（自然科学版）,2009(1):78-81. 被引量：21
2吴新忠,夏令祥,张旭,周成.基于谱熵梅尔积的语音端点检测方法[J].北京邮电大学学报,2019,42(2):83-89. 被引量：14
3苗晓晓,张健,索宏彬,周若华,颜永红.应用于短时语音语种识别的时长扩展方法[J].清华大学学报（自然科学版）,2018,58(3):254-259. 被引量：7
4郝洺,徐博,殷绪成,王方圆.基于n-gram频率的语种识别改进方法[J].自动化学报,2018,44(3):453-460. 被引量：5
5金马,宋彦,戴礼荣.基于卷积神经网络的语种识别系统[J].数据采集与处理,2019,34(2):322-330. 被引量：7
6梁春燕,袁文浩,李艳玲,夏斌,孙文珠.基于判别邻域嵌入算法的说话人识别[J].电子与信息学报,2019,41(7):1774-1778. 被引量：4
7吴敏,马延周.语种识别技术概论[J].现代计算机,2019,25(19):36-40. 被引量：5
8刘大运,房国志,骆天依,魏华杰,王倩,李修政,李骜.基于BiLSTM-Attention唇语识别的研究[J].计算技术与自动化,2020,39(1):150-155. 被引量：2
9张青博,王斌,崔宁宁,宋晓旭,秦婧.基于注意力机制的规范化矩阵分解推荐算法[J].软件学报,2020,31(3):778-793. 被引量：24
10任凯龙,汪毅,陈晓冬,蔡怀宇.用于腹腔镜扶持器控制的特定人语音识别算法[J].激光与光电子学进展,2020,57(18):374-382. 被引量：3

引证文献3

1梁春燕,曹伟.基于邻域保持嵌入算法的语种识别[J].陕西师范大学学报（自然科学版）,2020,48(2):38-42. 被引量：3
2王延凯,龙华,邵玉斌,杜庆治,王瑶.基于联合端点检测和动态范围控制的语种识别[J].激光与光电子学进展,2022,59(13):195-202. 被引量：2
3迪力扎提·伊力哈木,米吉提·阿不里米提,郑方,艾斯卡尔·艾木都拉.跨信道环境下语种识别方法的研究[J].现代电子技术,2022,45(24):37-43.

二级引证文献5

1赵小强,刘凯.基于动态MDONPE算法的间歇过程故障检测[J].兰州理工大学学报,2022,48(2):90-96.
2段云,邵玉斌,刘晶,龙华,杜庆治.一种基音频率归一化的语种识别方法[J].微电子学与计算机,2023,40(5):20-28.
3李燕燕,闫德勤.一种优化的近邻保持嵌入降维算法研究[J].计算机技术与发展,2023,33(6):28-34.
4陈荣观.基于时频域动态压缩器的IP话机智能功放算法[J].电声技术,2023,47(7):97-99.
5周大春,邵玉斌,张昊阁,龙华,彭艺.应用于噪声环境下语种识别的GFCC改进算法[J].云南大学学报（自然科学版）,2024,46(2):246-254.

1承健.高清不清[J].个人电脑,2006,12(7):115-115.
2王珏,路友荣,戴岚.基于编码特征参数的ADPCM压缩信号的识别[J].电信技术研究,2007(5):12-15.
3杨义先.纠错编码的译码错误概率[J].通信技术,1992(2):9-12.
4匡俊华,吴一亮.LRE与PoE双管齐下提升远距离视频监控品质[J].电子测试（新电子）,2006(4):38-40.
5深圳科地推出LRE＋POE创新产品[J].中国公共安全,2008,0(15):48-48.
6Wang Kun Wu Meng.DBLAR:A DISTANCE-BASED LOCATION-AIDED ROUTING FOR MANET[J].Journal of Electronics(China),2009,26(2):152-160. 被引量：3
7黄石磊,匡镜明,谢湘.基于SVM的置信度综合方法在语音识别中的应用[J].北京理工大学学报,2007,27(3):255-259. 被引量：1
8无延迟输出的32位SAR ADC[J].今日电子,2016,0(11):65-65.
9何燕,胡捍英,周山.一种新的TOA无线定位算法[J].无线电通信技术,2004,30(1):56-58. 被引量：2
10刘怀林.从模拟电视到数字电视分辨力的论述[J].现代电视技术,1999(6):62-67.

通信学报

2017年第4期

浏览历史

内容加载中请稍等...

基于LDOF准则的自适应高斯后端语种识别方法被引量：3

参考文献2

二级参考文献33

共引文献5

同被引文献14

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于LDOF准则的自适应高斯后端语种识别方法 被引量：3

参考文献2

二级参考文献33

共引文献5

同被引文献14

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于LDOF准则的自适应高斯后端语种识别方法被引量：3