基于多码本矢量量化的非限定文本的联机话者辨认方法被引量：1

AN APPROACH BASED ON MULTIPLE VECTOR QUANTIZATION FOR ON LINE TEXT INDEPENDENT SPEAKER IDENTIFICATION

下载PDF

导出

摘要传统的利用话者的一个时期的语音作为训练语音，进行话者码本训练的方法，识别系统往往不够稳定．为了适应话者自身语音的时变性，文中提出了利用话者不同时期的语音进行训练话者的模型，每个话者具有多个码本．这些码本是采用逐渐减小误识率的优化过程得到的．为了补偿不同信道对系统识别性能的影响，文中给出了一种信道补偿方法．同时提出以一帧高能的浊音语音特征代替一个浊音音素的特征，实现了在线浊音特征提取，利用两级矢量量化及码本索引策略减少了４４％的识别计算量．这些方法大大增加了系统的识别速度和鲁棒性．文中比较了用ＰＬＰ分析和ＬＰＣ倒谱分析进行话者辨认的识别结果． The traditional approach for training speaker codebooks only uses one session training speech samples, but the recognition system based on this approach is usually not robust. To adapt to the intraspeaker variations, the paper here introduces an approach for training speaker codebooks using multiple session training speech samples,with every speaker having multiple codebooks. These codebooks are trained based on the minimum recognition error rate.To compensate for the variations arising from transmission conditions, an approach to compensation of the variation presented. To speed up recognition speed, an on line feature extraction method for voiced sounds and two level vector quantization and codebook index strategy are used. These techniques increase the robustness of the speech feature and speed up the training and identification procedure greatly. Finally, the identification results of comparison using the perceptually based linear predictive(PLP) analysis and the LPC cepstrum analysis are given.

作者马继涌高文姚鸿勋

机构地区哈尔滨工业大学计算机科学系

出处《计算机研究与发展》 EI CSCD 北大核心 1999年第6期712-716,共5页 Journal of Computer Research and Development

基金国家"八六三"计划国家自然科学基金

关键词联机话者辨认多码本矢量量化语音识别 on line text independent speaker identification, multiple codebooks quantization, transmission compensation

分类号 TN912.34 [电子电信—通信与信息系统] TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1Kao Yuhuang，Proc ’93 IEEE Int Conf Acoustics，1993年，379页
2Openshaw J P，Proc ’93 IEEE Int Conf Acoustics，1993年，371页

同被引文献9

1郭铭,陈云凤.自动发音人识别中测试文本选择的研究[J].声学学报,1993,18(2):148-153. 被引量：3
2韦岗,陆以勤,欧阳景正.混沌、分形理论与语音信号处理[J].电子学报,1996,24(1):34-39. 被引量：33
3牟晓隆,胡起秀,吴文虎.与文本无关的复合策略说话人辨识系统[J].清华大学学报（自然科学版）,1997,37(3):16-19. 被引量：6
4包威权,陈珂,迟惠生.基于HMM/MLFNN混合结构的说话人辨认研究[J].北京大学学报（自然科学版）,1997,33(3):359-367. 被引量：5
5袁中选,徐柏龄,余崇智.基于模糊神经网络的话者辩认研究[J].声学学报,1997,22(4):329-337. 被引量：4
6陶伟忠,岳喜才,郑崇勋.离散时间域的 Gabor 谱分析及其在语音处理中的应用[J].西安交通大学学报,1997,31(6):27-31. 被引量：1
7林宝成,陈永彬.基于ARMA模型的汉语讲话者识别[J].声学学报,1998,23(3):229-234. 被引量：6
8岳喜才,伍晓宇,郑崇勋,叶大田.一种大类别数分类的神经网络方法[J].计算机研究与发展,2000,37(3):278-283. 被引量：7
9岳喜才,伍晓宇,郑崇勋.用神经阵列网络进行文本无关的说话人识别[J].声学学报,2000,25(3):230-234. 被引量：14

引证文献1

1岳喜才,叶大田.文本无关的说话人识别:综述[J].模式识别与人工智能,2001,14(2):194-200. 被引量：8

二级引证文献8

1艾佳琪,左毅,刘君霞,贺培超,李铁山,陈俊龙.基于余弦相似度的动态语音特征提取算法[J].计算机应用研究,2020,37(S02):147-149. 被引量：9
2毛大伟,曹华,木拉提.哈米提,童勤业.基于美尔倒谱系数和复杂性的说话人识别[J].生物医学工程学杂志,2006,23(4):882-886. 被引量：2
3唐建,何劲松.模糊相关性文本无关矢量量化说话人辨认研究[J].系统仿真学报,2009,21(14):4351-4355.
4张喜宁.说话人识别技术——语音特征参数提取及组合[J].科技资讯,2009,7(34):231-232. 被引量：2
5蒋晔,唐振民.GMM文本无关的说话人识别系统研究[J].计算机工程与应用,2010,46(11):179-182. 被引量：27
6陈建涛,陈维娜.基于文本无关的话者识别技术综述[J].电脑知识与技术,2016,0(1):189-191. 被引量：1
7梁宏宇,李通旭.基于最大团的防骗贷算法研究[J].信息安全研究,2017,3(11):1017-1019.
8Wei Cao,Chunyan Liang,Shuxin Cao.Speaker Verification Based on Log-Likelihood Score Normalization[J].Journal of Computer and Communications,2020,8(11):80-87.

1陈强,娄震,杨静宇.非限定手写汉字的分割研究[J].南京理工大学学报,2004,28(1):95-98. 被引量：1
2陈勇.稀疏的,非限定设计系统的结构诊断及分解算法[J].贵州航天,1997(3):42-60.
3薛舫时.GaAs/AlGaAs量子阱中的Г-X混和及谐振态和非限定态的研究[J].Journal of Semiconductors,1989,10(11):805-811. 被引量：1
4刘真,吴泉源.非限定表格信息提取系统的研究[J].计算机学报,1995,18(11):808-813. 被引量：3
5俞振利,张礼和.一种非限定语音说话人实时识别的方法及其实现[J].信号处理,1990,6(3):183-190.
6张松滨.应用对数面积比参数做非限定内容的话者辨识[J].哈尔滨电工学院学报,1991,14(1):75-79.
7管沄嘉.体验设计——非限定空间的感受与限定空间中的表达[J].装饰,2003(6):25-25.
8吴仁彪,保铮.具有较强推广能力的空时二维自适应滤波训练的方法[J].空载雷达,1995(4):44-49.
9张俊吉,姜丽杰.汉语时制的短语结构[J].呼伦贝尔学院学报,2005,13(1):30-34.
10向新,王勇,易克初,田红心.广义UWB-ATR接收机[J].电路与系统学报,2007,12(3):147-150.

计算机研究与发展

1999年第6期

浏览历史

内容加载中请稍等...

基于多码本矢量量化的非限定文本的联机话者辨认方法被引量：1

参考文献2

同被引文献9

引证文献1

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于多码本矢量量化的非限定文本的联机话者辨认方法 被引量：1

参考文献2

同被引文献9

引证文献1

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于多码本矢量量化的非限定文本的联机话者辨认方法被引量：1