基于MFCC相关系数的语音感知哈希认证算法被引量：8

Perceptual Hashing Based on Correlation Coefficient of MFCC for Speech Authentication

导出

摘要提出了一种基于梅尔频率倒谱系数相关性的语音感知哈希内容认证算法.该算法提取分段语音的声纹梅尔频率倒谱系数作为感知特征.为提高算法的安全性,算法利用伪随机序列作为密钥,计算得到梅尔频率倒谱系数与伪随机之间的相关度,最后量化相关值并加密生成感知哈希序列.语音认证过程中,采用相似性度量函数来衡量哈希序列之间的距离,同时与汉明距离方法进行了比较.仿真结果表明,该算法对语音内容保持操作,如重采样、MP3压缩等具有较好的鲁棒性,相似性度量函数也对语音篡改检测定位具有较高的灵敏性. A perceptual hashing algorithm for speech content authentication based on correlation coefficient of mel-frequency cepstrum coefficients （MFCC） was proposed. The MFCC of the framed speech signal is extracted as perceptual feature. The correlation coefficients between MFCC and a pseudo-random sequence, which is generated by keys for security, were calculated. Hash sequence is generated by quantifying the correlation coefficients and then scrambling. For audio authentication procedure, a new method, similarity metric, was used to measure the distance of hashes, which is compared with the hamming distance method. Simulations show that the algorithm is robust against content-preserving manipulations such as re-sampling, MP3 compression, and so on. It is very sensitive to tamper of speech by similarity metric.

作者李金凤吴涛王宏霞

机构地区西南交通大学信息科学与技术学院北京邮电大学信息与通信工程学院

出处《北京邮电大学学报》 EI CAS CSCD 北大核心 2015年第2期89-93,共5页 Journal of Beijing University of Posts and Telecommunications

基金国家自然科学基金项目(61170226 61373180)

关键词感知哈希梅尔频率倒谱系数语音认证相关系数篡改检测 perceptual Hashing Mel-frequency cepstrum coefficients speech authentication correlation coefficient tamper detection

分类号 TN929.53 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献10

1牛夏牧,焦玉华.感知哈希综述[J].电子学报,2008,36(7):1405-1411. 被引量：98
2Tang Zhenjun, Zhang Xianquan, Huang Liyan, et al. Robust image Hashing using ring-based entropies [ J ]. Signal Processing, 2013, 93 (7): 2061-2069.
3Li Yuenan, Lu Zheming, Zhu Ce, et al. Robust image Hashing based on random Gabor filtering and dithered lat- tice vector quantization [ J 1. Image Processing, IEEE Transactions on, 2012, 21(4): 1963-1980.
4陈慧婷,覃团发,唐振华,常侃.综合纹理统计模型与全局主颜色的图像检索方法[J].北京邮电大学学报,2011,34(S1):100-103. 被引量：3
5Jiao Yuhua, Ji Liping, Niu Xiamu. Robust speech Has- hing for content authentication [ J ]. Signal Processing Letters, IEEE, 2009, 16(9): 818-821.
6Chen Ning, Wan Wanggen. Robust speech Hash function [Jl. ETRIJournal, 2010, 32(2): 345-347.
7Chen Ning, Wan Wanggen. Speech Hashing algorithm based on short-time stability [ C] //Artificial Neural Net- works-ICANN 2009. Cyprus: Artificial Neural Networks, 2009 : 426-434.
8Nouri M, Farhangian N. Conceptual authentication speech hashing base upon hypotr- ochoid graph [ C] /// Telecommunications (IST), Sixth International Symposi- um on. Tehran: IEEE, 2012: 1136-1141.
9Tang Zhenjun, Wang Shuozhong, Zhang Xinpeng, et al. Structural feature-based image hashing and similarity met- ric for tampering detection [ Jl. Fundamenta Informati- cae, 2011, 106(l): 75-91.
10Chen Ning, Wan Wanggen. Robust audio hashing based on discrete-wavelet-transform and non-negative matrix factorization [ J ]. Communications IET, 2010, 4 ( 14 ) : 1722-1731.

二级参考文献36

1王海霞,覃团发.综合MPEG-7中颜色特征的图像检索方法[J].计算机应用研究,2005,22(3):164-165. 被引量：20
2王甦汪安圣.认知心理学[M].北京:北京大学出版社,1992..
3A W M Smeulders, et al. Content-based image retrieval at the end of the early years[ J] .IEEE Transactions on Pattern Analysis and Machine Intelligence,2000, 22(12) : 1349 - 1380.
4B B Zhu,M D Swanson, A H Tewfik.When seeing isn't believing[ J] .IEEE Signal Processing Magazine,2004,21 (2):40 - 49.
5H G Schaathun. On watermarking/fingerprinting for copyright protection[ A]. Proc. of 1st International Conference on Innovative Computing, Infonnation and Control (ICICIC) [ C .]. Beijing: IEEE, 2006. (3) :50 - 53.
6J Haitsma, T Kalker. A highly robust audio fingerprinting system[A]. Proc of 3rd International Conference on Music Informarion Retrieval(ISMIR) [ C ]. Paris: IRCAM, 2002.107 - 115.
7P Cano, E Batlle, T Kalker, J Haitsma. A review of audio fingerprinting [ J ]. Journal of VLSI Signal Processing, 2005,41 : 271 - 284.
8H Ozer, B Sankur, N Memon, E Anarim. Perceptual audio hashing functions[ J]. EURASIP Journal on Applied Signal Processing, 2005,12:1780- 1793.
9http://isis. poly. edu/index. php? page = 1&project = 1094.
10P Cano,E Batlle,et al.Robust sound modeling for song detectionin broadcast audio[ A]. Proc of AES 112th Internation Convention[ C]. Munich: AES, 2002.1 - 7.

共引文献99

1韩琦,王志芳,牛夏牧,李琼.针对索引图像的人脸区域分级加密算法[J].电子学报,2008,36(B12):25-29. 被引量：2
2王阿川,陈海涛.基于离散余弦变换的鲁棒感知图像哈希技术[J].中国安全科学学报,2009,19(4):91-96. 被引量：9
3刘亚多,李伟,李晓强,汪竹蓉,冯瑞.压缩域鲁棒音乐指纹算法研究[J].电子学报,2010,38(5):1172-1176. 被引量：9
4古今,郭立,梁惠,程龙.一种高效鲁棒的语音感知认证算法[J].小型微型计算机系统,2010,31(7):1461-1465. 被引量：1
5孙锐,闫晓星,高隽.基于视皮层全局感知特征的顽健图像散列方法[J].通信学报,2011,32(6):60-66.
6欧阳杰,高金花,文振焜,张盟,刘朋飞,杜以华.融合HVS计算模型的视频感知哈希算法研究[J].中国图象图形学报,2011,16(10):1883-1889. 被引量：7
7曾勇,孙树森,夏爱军.基于图像归一化和DCT的感知图像哈希算法[J].浙江理工大学学报（自然科学版）,2012,29(1):84-88. 被引量：6
8倪问尹,王建新,陈顺平.基于感知哈希的多媒体数据内容检测系统设计[J].制造业自动化,2012,34(2):137-138.
9赵春晖,刘巍.基于分块压缩感知的图像半脆弱零水印算法[J].自动化学报,2012,38(4):609-617. 被引量：36
10吴懿晨,方昱春,谭盈.基于模糊循环随机映射的人脸生物特征加密算法[J].计算机科学,2012,39(5):249-253.

同被引文献27

1艾佳琪,左毅,刘君霞,贺培超,李铁山,陈俊龙.基于余弦相似度的动态语音特征提取算法[J].计算机应用研究,2020,37(S02):147-149. 被引量：10
2牛夏牧,焦玉华.感知哈希综述[J].电子学报,2008,36(7):1405-1411. 被引量：98
3邵松年,黄征,徐彻,施少培,杨旭.数字音频与录制设备的相关性研究[J].计算机工程,2009,35(19):224-226. 被引量：6
4何朝霞,潘平.说话人识别中改进的MFCC参数提取方法[J].科学技术与工程,2011,11(18):4215-4218. 被引量：6
5汪竹蓉,李伟,朱碧磊,李晓强.基于音乐内容分析的音频认证算法[J].计算机研究与发展,2012,49(1):158-166. 被引量：2
6潘平,何朝霞.基于duffing随机共振的说话人特征提取方法[J].计算机工程与应用,2012,48(35):123-125. 被引量：4
7刘育明,姚陈果,孙才新,袁智勇,Liu Yilu.基于电网频率的数字录音真伪鉴别研究[J].仪器仪表学报,2013,34(6):1434-1440. 被引量：4
8罗辉,潘平,王洋.基于量子模距离的说话人识别方法[J].计算机工程与科学,2014,36(1):39-43. 被引量：2
9张贺,沈天飞,滕秋霞.小词汇量孤立词语音识别系统多种特征组合参数的选择方法研究[J].电子测量技术,2015,38(3):48-53. 被引量：7
10黄羿博,张秋余,袁占亭,杨仲平.融合MFCC和LPCC的语音感知哈希算法[J].华中科技大学学报（自然科学版）,2015,43(2):124-128. 被引量：16

引证文献8

1赵珊,李永思.基于主成分分析的图像哈希算法[J].北京邮电大学学报,2019,42(2):36-41. 被引量：6
2张秋余,省鹏飞,黄羿博,董瑞洪,杨仲平.多格式音频感知哈希算法[J].北京邮电大学学报,2016,39(4):77-82. 被引量：4
3张秋余,胡文进,乔思斌,张涛.基于LP-MMSE的高效语音感知哈希认证算法[J].华中科技大学学报（自然科学版）,2016,44(12):127-132. 被引量：1
4张秋余,乔思斌,张涛,黄羿博.基于能零比的多格式音频感知哈希认证算法[J].华中科技大学学报（自然科学版）,2017,45(9):33-38. 被引量：2
5何朝霞,潘平,罗辉.复制粘贴音频信号的篡改检测技术研究[J].中国测试,2016,42(7):107-111. 被引量：1
6张永兵,米保全,周亮,张涛.基于短时自相关的语音感知哈希认证算法[J].无线电工程,2019,49(10):899-904. 被引量：2
7贾子龙,潘士杰,郭子昊,唐进,姚燕.基于FPGA的声纹识别系统设计[J].电子器件,2022,45(4):997-1003. 被引量：2
8战王雷,张宁.基于GAMMATONE的音频感知哈希认证[J].网络安全技术与应用,2022(11):33-35.

二级引证文献18

1赵珊,李永思.基于主成分分析的图像哈希算法[J].北京邮电大学学报,2019,42(2):36-41. 被引量：6
2张秋余,乔思斌,张涛,黄羿博.基于能零比的多格式音频感知哈希认证算法[J].华中科技大学学报（自然科学版）,2017,45(9):33-38. 被引量：2
3曾春艳,王志锋,王静,田元,叶俊民,左明章.数字音频篡改被动检测研究综述[J].计算机工程与应用,2019,55(2):1-11. 被引量：5
4张永兵,米保全,周亮,张涛.基于短时自相关的语音感知哈希认证算法[J].无线电工程,2019,49(10):899-904. 被引量：2
5钟臻,张楷旋,马啸.基于Hash算法的大数据架构下电力系统风险评估研究[J].电力大数据,2019,22(9):49-57. 被引量：7
6兰秀芝,吴娟,蒋朝红,郑铭铭.针对大学生身体素质问题对高校食堂关于营养均衡及健康饮食的改善计划[J].饮食科学,2019,0(18):62-63.
7阮晓龙,刘海滨.一种设备业务故障分级检测与预警聚合分析模式研究[J].计算机与数字工程,2021,49(5):961-965. 被引量：1
8胡颖杰,张秋余,李昱州.基于声母和深度哈希的密文语音全文检索方法[J].华中科技大学学报（自然科学版）,2021,49(12):83-88. 被引量：2
9张皓斐,张皓博.基于卡尔曼滤波的乐音基频小波自相关检测法[J].电子设计工程,2022,30(7):77-81. 被引量：1
10王青云.多媒体英语听力自动评价系统设计[J].计算机应用与软件,2022,39(10):141-146.

1夏西泉,王平.一种基于线性预测的语音认证算法[J].火力与指挥控制,2015,40(10):72-74. 被引量：1
2李宏松,苏健民,黄英来,于慧伶.基于声音信号的特征提取方法的研究[J].信息技术,2006,30(1):91-94. 被引量：25
3李哲军,周萍,景新幸.基于改进噪声估计的谱减法应用于说话人识别[J].计算机测量与控制,2016,24(4):155-158.
4舒若,李世宝,潘辛.SVAC音频编码的特征参数量化器改进[J].信息技术,2014,38(6):50-54.
5张秋余,胡文进,乔思斌,张涛.基于LP-MMSE的高效语音感知哈希认证算法[J].华中科技大学学报（自然科学版）,2016,44(12):127-132. 被引量：1
6胡峰松,张璇.基于梅尔频率倒谱系数与翻转梅尔频率倒谱系数的说话人识别方法[J].计算机应用,2012,32(9):2542-2544. 被引量：21
7魏君颖,魏维.说话人识别特征提取算法改进[J].成都信息工程学院学报,2014,29(S1):67-70. 被引量：1
8潘海琦,杨震,徐珑婷,朱俊华.一种基于压缩感知的说话人识别参数分析[J].数据采集与处理,2015,30(2):399-407. 被引量：2
9陆伟,戴蓓蒨,李辉,刘青松.MFCC中的基音频率信息对说话人识别系统性能的影响[J].中国科学技术大学学报,2009,39(8):859-863. 被引量：11
10杨俊成,李淑霞.基于MFCC特征和隐马尔可夫模型的咳嗽信号自动识别[J].内蒙古师范大学学报（自然科学汉文版）,2016,45(6):799-801. 被引量：1

北京邮电大学学报

2015年第2期

浏览历史

内容加载中请稍等...

基于MFCC相关系数的语音感知哈希认证算法被引量：8

参考文献10

二级参考文献36

共引文献99

同被引文献27

引证文献8

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

基于MFCC相关系数的语音感知哈希认证算法 被引量：8

参考文献10

二级参考文献36

共引文献99

同被引文献27

引证文献8

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

基于MFCC相关系数的语音感知哈希认证算法被引量：8