法庭语音比对中话者自身变化性建模方法研究被引量：2

Study on Modeling Method of Inter-Speaker Variability in Forensic Voice Comparison

下载PDF

导出

摘要针对法庭说话人识别中待鉴定人员语音样本不足的问题,提出了一种新的对说话人自身变化性建模的替代性方法以及相应的方差控制算法。使用同条件下的参考数据库构建识别系统的多个相同说话人得分模型,代替检验需要的多个非同期的带检验人员语音样本比较时的得分模型,以获得能反映说话人自身变化性的统计模型。基于目前最新的法庭证据评估的似然比证据强度评估体系,使用MFCC(Mel Frequency Cepstral Coefficients)和GFCC(Gammatone Frequency Cepstral Coefficients)特征对该方法的有效性进行了验证,并对上述特征进行了特征级和决策级融合。实验结果表明:该方法在纯净语音环境和噪声环境下都具有很高的识别率和稳定性,并且特征级融合能进一步提高识别系统的性能。 Focusing on the lack of voice samples of a person to be examined in forensic speaker recognition, this paper proposes a new alternative method modeling the self-variability of target speaker and corresponding variance control algorithm. The method constructs multiple same-speaker scores of recognition system from a reference database under similar condition to take the place of multiple non-contemporaneous voice samples needed in examinations. The aim is to obtain the statistical model that can reflect the self-variability of the target speaker. MFCC and GFCC are used to test the performance of the proposed method in state-of-art evidence estimation framework based on likelihood ratio, and feature fusion and decision fusion are also been applied in the experiment. Results show that the proposed method has a very high rate of recognition and stability under the condition of clean voice and noisy voice, and feature fusion can further improve recognition performance.

作者王华朋姜囡刘恩晁亚东 WANG Huapeng;JIANG Nan;LIU En;CHAO Yadong(Department of Audio-Visual Data Inspection Technology, Criminal Investigation Police University of China, Shenyang 110854, China)

机构地区中国刑事警察学院声像资料检验技术系

出处《计算机工程与应用》 CSCD 北大核心 2019年第8期110-115,214,共7页 Computer Engineering and Applications

基金 2016国家社会科学基金重点项目(No.16AYY015) 辽宁省重点研发计划项目(No.2017231006) 公安部公安理论及软科学项目(No.2017231006)

关键词似然比证据强度建模梅尔频率倒谱系数(MFCC) 伽马通频率倒谱系数(GFCC) likelihood ratio evidence strength modeling Mel Frequency Cepstral Coefficients(MFCC) Gammatone Frequency Cepstral Coefficients (GFCC)

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1王华朋.基于听觉模型的法庭语音证据特征量化[J].中国刑警学院学报,2018(1):119-122. 被引量：6
2Huapeng Wang,Cuiling Zhang.Forensic Automatic Speaker Recognition Based on Likelihood Ratio Using Acoustic-phonetic Features Measured Automatically[J].Journal of Forensic Science and Medicine,2015,1(2):119-123. 被引量：4
3王华朋,杨洪臣.声纹识别特征MFCC的提取方法研究[J].中国人民公安大学学报（自然科学版）,2008,14(1):28-30. 被引量：20
4茅正冲,王正创,黄芳.基于GFCC与RLS的说话人识别抗噪系统研究[J].计算机工程与应用,2015,51(10):215-218. 被引量：5
5熊冰峰,曾以成,谢小娟.一种改进的听觉特征参数应用于说话人识别[J].计算机应用,2016,36(A01):82-85. 被引量：5

二级参考文献26

1肖哲.基于Matlab的RLS自适应语音噪声对消系统的设计与实现[J].长沙大学学报,2006,20(2):83-86. 被引量：4
2[1]Ahmed Mezghani,Douglas.Speaker verification using a new representation based on a CMFCC and formants[J].IEEE Electrical and Computer Engineering,2005,22:1469-1472.
3[2]Minh N Do.An automatic apeaker recognition system[J].Swiss Federal Institute of Technology,2001,6:122-124.
4杨畅.基于听觉掩蔽效应的改进谱减法算法研究[D].西安:西安电子科技大学,2009.
5Shao Yang, Jin Zhaozhang, Wang Deliang.An auditory-based feature for robust speech recognition[C]//IEEE Interna- tional Conference on Acoustics, Speech and Signal Pro- cessing.United States, Institute of Electrical and Electronics Engineers Inc, 2009 : 4625-4628.
6Zhao Xiaojia, Shao Yang, Wang Deliang.CASA-based robust speaker identification[C]//IEEE Transactions on Audio, Speech and Language Processing.United States, Institute of Electrical and Electronics Engineers Inc,2012,20(5): 1608-1616.
7KARUPPUSWAMY R, ARUMUGAM K, SWATHI P M. Folded ar- chitecture for digital Gammatone fiher used in speech processor of cochlear implant[ J]. ETRI Journal, 2013, 35 (4) : 697 - 705.
8王赞松.FIR.数字滤波器设计[D].西安:西安电子科技大学,2012:7-9.
9IMMERSEEL L V, PEETERS S. Digital implementation of linear Gammatone filters: Comparison of design methods[J]. Acoustics Research Letters Online, 2003, 4(3):59-64.
10SHAO Y, WANG D. Robust speaker identification using auditory features and computational auditory scene analysis[ C]//ICASSP 2008: Proceedings of the 2008 IEEE International Conference on Acoustics, Speech and Signal Processing. Piscataway: IEEE, 2008:1589 - 1592.

共引文献33

1周燕.遗传算法与BP神经网络相结合的说话人识别系统[J].传感器与微系统,2009,28(6):98-100. 被引量：7
2周燕,胡志峰.基于免疫聚类的RBF网络在说话人识别中的应用[J].声学技术,2010,29(2):184-187. 被引量：3
3刘建,闫仁武.基于遗传优化RBF神经网络的声纹识别研究[J].信息技术,2012,36(5):168-170. 被引量：4
4杨勇,郭兴明.基于心音信号的生物识别技术研究[J].山西警官高等专科学校学报,2013,21(2):90-93. 被引量：1
5兰胜坤,石翼波.说话人识别系统中MFCC参数的改进算法[J].洛阳理工学院学报（自然科学版）,2013,23(4):51-55. 被引量：1
6丁冬冬,佘玉梅,江涛,庄丽,王米利,刘敬凤.融合SS、MFCC和PMC技术的语音去噪方法[J].云南民族大学学报（自然科学版）,2014,23(3):232-234. 被引量：1
7蒋翠清,邵宏波.基于MFCC与改进ACF的汽车声音识别算法研究[J].计算机技术与发展,2015,25(2):140-143. 被引量：6
8王博丞,李金龙.声纹识别在媒体数据处理中的技术研究[J].有线电视技术,2015,22(10):46-48.
9茅正冲,龚熙.基于EMD与RLS的说话人识别抗噪算法[J].计算机应用与软件,2016,33(5):231-234.
10李怀畅.电台广告智能监播系统设计[J].电声技术,2016,40(10):20-25. 被引量：3

同被引文献11

1贺前华,王志锋,Alexander I Rudnicky,朱铮宇,李新超.基于改进PNCC特征和两步区分性训练的录音设备识别方法[J].电子学报,2014,42(1):191-198. 被引量：9
2裴安山,王让定,严迪群.基于设备本底噪声频谱特征的手机来源识别[J].电信科学,2017,33(1):85-94. 被引量：9
3裴安山,王让定,严迪群.基于语音静音段特征的手机来源识别方法[J].电信科学,2017,33(7):103-111. 被引量：6
4裴安山,王让定,严迪群.基于语音频谱融合特征的手机来源识别[J].计算机应用,2018,38(3):884-890. 被引量：3
5张翠玲.法庭语音证据评价的新范式[J].中国人民公安大学学报（自然科学版）,2018,24(1):25-30. 被引量：11
6秦天芸,王让定,裴安山.基于线性预测梅尔频率倒谱系数的设备来源识别[J].数据通信,2018(4):20-25. 被引量：2
7林景栋,吴欣怡,柴毅,尹宏鹏.卷积神经网络结构优化综述[J].自动化学报,2020,46(1):24-37. 被引量：120
8施剑,马宁.民族资产解冻类诈骗案件侦防对策研究[J].广州市公安管理干部学院学报,2020,30(2):17-25. 被引量：2
9张翠玲,朱宝娜.不同言语风格对法庭说话人识别的影响[J].中国刑警学院学报,2020(3):118-122. 被引量：7
10公安部部署开展“云剑2020”行动严厉打击电信网络诈骗、民族资产解冻类诈骗等违法犯罪行为[J].中国防伪报道,2020(6):8-10. 被引量：3

引证文献2

1武钦芳,吴张倩,苏兆品,张国富.遗传算法优化时间卷积网络的手机来源识别[J].计算机工程与应用,2022,58(3):151-158. 被引量：1
2张艳云,谭天航.法庭说话人识别技术应用实证研究——以一起典型民族资产解冻诈骗案为例[J].警学研究,2022(6):42-51.

二级引证文献1

1聂青青,万定生,朱跃龙,李致家,姚成.基于时域卷积网络的水文模型[J].计算机应用,2022,42(6):1756-1761. 被引量：2

1杜非霏.基于权值合理分配的电子音乐智能分类模型[J].现代电子技术,2018,41(13):168-171. 被引量：1
2张翠玲,Geoffrey Stewart Morrison,Ewald Enzinger.法庭说话人识别新范式实证研究[J].中国人民公安大学学报（自然科学版）,2018,24(3):30-37. 被引量：6
3周萍,沈昊,郑凯鹏.基于MFCC与GFCC混合特征参数的说话人识别[J].应用科学学报,2019,37(1):24-32. 被引量：42
4张翠玲.法庭语音证据评价的新范式[J].中国人民公安大学学报（自然科学版）,2018,24(1):25-30. 被引量：11
5彭芳菲,孙秋碧,黄文彬.P2P网络借贷平台风险实证研究[J].闽商文化研究,2017(1):69-77.
6罗璐,罗丽娜,胡小池.超声和钼靶X线在中国女性2 cm以内乳腺癌早期临床诊断效果的系统评价[J].沈阳医学院学报,2019,21(2):116-119. 被引量：7
7周永塔,廖大强.面向云服务选择的信任网络建模方法研究[J].信息与电脑,2019,31(2):40-41.
8翟晓婧.基于动态条件得分模型的风险测度和MCS检验[J].时代金融,2019,0(2):91-93.
9顾雪玲,刘明娟.基于因子分析的江苏省新三板挂牌企业的成长性研究[J].产业与科技论坛,2018,17(23):82-84.
10李艳忠,杨凯麟,雷晓明.桃红四物汤干预新鲜骨折有效性安全性的系统评价和Meta分析[J].中国中医基础医学杂志,2018,24(11):1607-1613. 被引量：10

计算机工程与应用

2019年第8期

浏览历史

内容加载中请稍等...

法庭语音比对中话者自身变化性建模方法研究被引量：2

参考文献5

二级参考文献26

共引文献33

同被引文献11

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

法庭语音比对中话者自身变化性建模方法研究 被引量：2

参考文献5

二级参考文献26

共引文献33

同被引文献11

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

法庭语音比对中话者自身变化性建模方法研究被引量：2