基于DSP开集说话人识别系统的实时实现被引量：2

Realtime Implementation of Open-Set Speaker-Recognition System by DSP

下载PDF

导出

摘要为了给说话人识别系统的应用提供一个较为重要的技术途径,利用美国TI公司生产的TMS320VC5402DSP作为CPU开发的DSP(D igital S ignal Processor)系统,实时实现了一个基于说话人自适应的开集说话人识别系统。为了提高系统的处理速度和识别的准确性,系统采用少量的语音数据产生说话人模型,在改进的矢量量化方法的基础上,利用一种说话人自适应的阈值处理算法,有效地提高了系统的识别率。同时对降低算法的计算量、数据的存储量进行了较深入的研究。从说话人识别的响应时间、训练时间等综合方面考虑,使真正意义上的说话人识别系统在DSP芯片上实现成为可能。实验表明,该系统在普通机房条件下,可以取得较好的实验效果,系统识别时间小于1 s,完全满足实时性的要求。 In order to provide an important method for the practical applications of a speaker-recognition system, this paper presents an open-set speaker-recognition Real-time system based on speaker adaptive dynamic threshold, which has realized with TMS320VC5402 digital signal processor. In order to improve the processing speed and the recognition precision, it uses the little speech data to get the speaker＇s voice model, and based on the revised vector quantization algorithm, it presents a dynamic threshold method, which can improve the recognition accuracy greatly. At the same time, the research of the decreasing the amount of operation and storage has been conducted thoroughly. On the consideration of some factors, such as the respond time and train time of the system, it is possible to realize a real speaker recognition system by Digital Signal Processor. Experiment results show that the recognition rate of this system is satisfied, and the recognition time of the system is less than 1 second, which can meet the requirement of real-time system.

作者林琳王树勋王秀丽

机构地区吉林大学通信工程学院

出处《吉林大学学报（信息科学版）》 CAS 2006年第3期252-258,共7页 Journal of Jilin University（Information Science Edition）

基金长春市科技计划基金资助项目(05GG18)

关键词说话人识别开集说话人自适应阈值 MEL倒谱系数数字信号处理器 speaker recognition system open-set speaker adaptive dynamic threshold Mel-frequency cepstral coefficients digital signal processor

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献16

1DENG Jiu-qing,HU Qi-xiu.Open Set Text-Independent Speaker Recognition Based on Set-Score Pattern Classification [ C ]//IEEE International Conference on Acoustics,Speech,and Signal Processing.Hong Kong:IEEE Press,2003,2:73-76.
2REYNOLDS D A.An Overview of Automatic Speaker Recognition Technology [ C ] // IEEE International Conference on Acoustics,Speech,and Signal Processing.Orlando,Florida:IEEE Press,2002:4072-4075.
3PRZYBOCKI MARK,ALVIN MARTIN.The NIST Speaker Recognition Evaluation-Overview,Methodology,Systems,Results,Perspective [J].Speech Communications,2000,31:225-254.
4REAL E C,BAUMANN A H.Open Set Classification Using Tolerance Intervals [ C ] // Signals,Systems and Computers,Conference Record of the Thirty-Fourth Asilomar Conference.Pacific Grove,USA:IEEE Press,2000,(2):1217-1221.
5SOVKA P,POLLAK P,KIBIC J.Extended Spectral Subtraction [ C ] // Signal Processing Ⅷ:Theories and Applications (Proceedings of EUSIPCO-96).Trieste,Italy:European Association for Signal Processing (EURASIP),1996:963-966.
6何致远,胡起秀,徐光祐.两级决策的开集说话人辨认方法[J].清华大学学报（自然科学版）,2003,43(4):516-520. 被引量：12
7王让定,柴佩琪.语音倒谱特征的研究[J].计算机工程,2003,29(13):31-33. 被引量：50
8李霄寒,戴蓓倩,方绍武,刘鸣.高阶MFCC的话者识别性能及其噪声鲁棒性[J].信号处理,2001,17(2):124-129. 被引量：14
9邵央,刘丙哲,李宗葛.基于MFCC和加权矢量量化的说话人识别系统[J].计算机工程与应用,2002,38(5):127-128. 被引量：34
10FURUI SADAOKI.Recent Advances in Speaker Recognition [J].Pattern Recognition Letters,1997 (18):859-872.

二级参考文献26

1何致远.说话人确认和辨认的研究与实现[D].北京:清华大学,2002.
2何致远胡起秀姚志宏.基于HMM的数字串提示文本的说话人确认[A]..第九届全国多媒体技术学术会议论文集[C].北京,2000.215—219.
3SI Luo, HU Qixiu. Two-stage speaker identification system based on VQ and NBDGMM [A]. Proc of the Sixth Inter Conf on Spoken Language Processing [C]. Beijing, 2000.
4Fakotakis N, Sirigos J. A high performance text independent speaker recognition system based on vowel spotting and neural nets [A]. Proc Inter Conf on Acoustics, Speech and Signal Processing[C]. Atlanta, USA. 1996. 661-664.
5Furui S. Recent advances in speaker recognition [J]. Lecture Notes in Computer Science, 1997, 1206:237-252.
6Li Qi, Juang Biinghwang, Lee Chinhui, et al. Recent advancements in automatic speaker authentication [J]. IEEE Robotics and Automation Magazine, 1999, 3:24 - 34.
7Furui S. Cepstral analysis technique for automatic speaker verification [J]. IEEE Trans on Acoustics, Speech and Signal Processing, 1981, 29(2) : 254 - 272.
8JIN Qin, SI Luo, HU Qixiu. A high-performance text-independent speaker identification system based on BCDM [A]. Proc of the Fifth Inter Conf on Spoken Language Processing[C]. Sydney, Australia. 1998.
9Huang Xuedong, Acero A, Hon H W. Spoken Language Processing.Prentice Hall,2001.
10Young S, Kershaw D, Odell J, et al. The HTK Book.Microsoft Corporation &CUED,2000.

共引文献111

1蒋磊,马六章,杨克虎,许政.基于MFCC和FD-CNN卷积神经网络的综放工作面煤矸智能识别[J].煤炭学报,2020,45(S02):1109-1117. 被引量：7
2王伟,邓辉文.基于MFCC参数和VQ的说话人识别系统[J].仪器仪表学报,2006,27(z3):2253-2255. 被引量：30
3于哲舟,周春光,李佳慧,杨佳东.一种简单有效的说话人身份认证方法[J].吉林大学学报（信息科学版）,2003,21(S1):29-33. 被引量：1
4张超琼,苗夺谦,岳晓冬.基于高斯混合模型的语音性别识别[J].计算机应用,2008,28(S2):360-362. 被引量：1
5李波,王成友,杨聪,蔡宣平,张尔扬.基于语音频谱包络抽取的MFCC算法[J].国防科技大学学报,2004,26(4):42-45. 被引量：4
6于哲舟,杨佳东,蒲东兵,周春光,王纲巧.多门限声纹识别方法[J].吉林大学学报（信息科学版）,2005,23(2):216-220. 被引量：1
7李战明,王贞.基于小波包分析特征参数的说话人识别系统[J].电声技术,2005,29(6):46-49. 被引量：5
8张一清,李轶.基于矢量量化方法的说话人识别技术[J].杭州电子科技大学学报（自然科学版）,2005,25(4):58-61.
9蔡艺,张军,韦岗.改进的MKM算法及其在语音识别中的应用[J].计算机工程与应用,2005,41(25):65-67. 被引量：1
10董志峰,汪增福.基于动态MFCC的说话人识别算法[J].模式识别与人工智能,2005,18(5):596-601. 被引量：7

同被引文献6

1陈黎,徐东平.基于SVM-GMM的开集说话人识别方法[J].计算机工程,2011,37(14):172-174. 被引量：5
2酆勇,熊庆宇,石为人,曹俊华.一种基于受限玻尔兹曼机的说话人特征提取算法[J].仪器仪表学报,2016,37(2):256-262. 被引量：19
3张翠玲,谭铁君.基于贝叶斯统计推理的法庭证据评价[J].刑事技术,2018,43(4):265-271. 被引量：33
4Nan Jiang,Ting Liu.Research on Voiceprint Recognition of Camouflage Voice Based on Deep Belief Network[J].International Journal of Automation and computing,2021,18(6):947-962. 被引量：4
5申铉京,秦俊,吕颖达,王瑞卿,刘翔.完全线性多阈值Otsu快速算法[J].吉林大学学报（工学版）,2019,49(1):268-274. 被引量：4
6何致远,胡起秀,徐光祐.两级决策的开集说话人辨认方法[J].清华大学学报（自然科学版）,2003,43(4):516-520. 被引量：12

引证文献2

1李旭东,周林华.基于大津算法和深度学习的开集声纹识别自适应阈值计算方法[J].吉林大学学报（理学版）,2021,59(4):909-914. 被引量：7
2胡成宇,李柏汕,顾明波.声纹鉴定中自动声纹比对阈值设定技术研究与实践[J].科学与信息化,2024(6):22-25.

二级引证文献7

1江楠,陈洁,肖潘,唐文强,林志泉.基于声纹识别的电力会议多角色语音的分离和识别研究[J].高电压技术,2023,49(S01):40-46. 被引量：1
2张鹏.遗传优化RBF神经网络背景下的声纹识别研究[J].信息与电脑,2022,34(1):159-161. 被引量：1
3杨波,张立娜,韩霄松.基于LBP和GLCM的肠道肿瘤图像特征提取方法[J].吉林大学学报（理学版）,2022,60(4):911-918. 被引量：3
4霍鑫,何长春,张华,赵辉.基于模型挖掘机的实践平台设计与教学应用[J].实验技术与管理,2023,40(5):176-179.
5宋玉,钱晓松,彭凌钰,叶紫寒,覃京燕.AIGC中式美学文创设计研究[J].包装工程,2023,44(24):1-8. 被引量：7
6李珂嘉,张璐薇,马跃洋,尹昱东,杨帆,张璐.基于机器视觉的钢轨表面面型缺陷分类实验设计[J].实验室研究与探索,2024,43(3):122-127.
7梁铃,马建伟,周忠强,王平,陈智祺.声纹识别下的电网调度指令自动化校验方法[J].电子设计工程,2024,32(18):136-140.

1宋珏,林立.光波分复用技术讲座——第四章波分复用系统的安装与测试[J].广东通信技术,1999,19(5):22-26.
2李纪,顾学迈.基于DSP的小卫星高速通信控制器的设计方法[J].通信技术,2002,35(10X):16-17.
3何致远,胡起秀,徐光祐.两级决策的开集说话人辨认方法[J].清华大学学报（自然科学版）,2003,43(4):516-520. 被引量：12
4卜红霞,胡永杰,齐焱焱,闫若颖.基于DSP的频谱分析系统的设计与实现[J].微计算机信息,2008,24(20):208-209. 被引量：6
5张云雁,张建军,赵风光,吴龙梅.一种基于改进的矢量量化算法的说话人识别方法[J].上海大学学报（自然科学版）,2005,11(4):368-371. 被引量：1
6吴增荣,夏志忠.基于闪存的TMS320VC5402 DSP独立系统的实现[J].电子产品世界,2003,10(05B):62-64. 被引量：2
7杨洁,张勇.与文本无关的说话人识别系统的设计与实现[J].山东科学,2008,21(4):57-61. 被引量：1
8戴育良,吴宁.DSP8位并行引导的设计与实现[J].福建电脑,2011,27(9):170-171.
9胡国元,段春丽,宋智军,段铸红,温富刚.高速双通道光电耦合器OC-5631的研制[J].微电子学与计算机,1998,15(1):10-14.
10俞兴明.正弦信号发生器的DSP实现方法及比较[J].福建电脑,2009,25(9):11-12.

吉林大学学报（信息科学版）

2006年第3期

浏览历史

内容加载中请稍等...

基于DSP开集说话人识别系统的实时实现被引量：2

参考文献16

二级参考文献26

共引文献111

同被引文献6

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于DSP开集说话人识别系统的实时实现 被引量：2

参考文献16

二级参考文献26

共引文献111

同被引文献6

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于DSP开集说话人识别系统的实时实现被引量：2