基于压缩感知和音频指纹的固定音频检索方法被引量：2

Specific Audio Retrieval Method Based on Compressed Sensing and Audio Fingerprint

下载PDF

导出

摘要针对现有音频检索中样本音频特征库数据量较大且检索速率慢问题,本文提出一种基于压缩感知和音频指纹降维的固定音频检索方法.在音频检索的训练阶段,首先,对样本音频信号进行稀疏化处理,并通过压缩感知算法对稀疏化后的音频数据进行压缩;其次,提取压缩信号的音频指纹;再次,引入音频指纹离散基尼系数通过计算音频指纹各维度的离散基尼系数对指纹实施降维,最终得到检索特征库.在音频检索阶段用和训练阶段相同的算法提取待检音频的特征与音频特征库数据匹配得出检索结论.实验结果表明,所提音频检索方法在确保较好的检索准确率的基础上,大幅度减小了样本音频数据库的存储量,提高了音频的检索速率. In order to solve the problem of large amount of data and slow retrieval speed in the existing audio retrieval,a fixed audio retrieval method is proposed in this study based on compressed sensing and audio fingerprint dimensionality reduction.In the training stage of audio retrieval,the sample audio signal is sparse processed,and the sparse audio data is compressed by the compression sensing algorithm,then the audio fingerprint is extracted,and then the audio fingerprint discrete Gini coefficient is introduced to reduce the dimension of the fingerprint by calculating the discrete Gini coefficient of each dimension of the audio fingerprint.In the recognition stage of audio retrieval,we use the same algorithm as in the training stage to process the audio to be tested and match with the sample audio fingerprint.The experimental results show that the proposed audio retrieval method greatly reduces the storage of the sample audio database and improves the audio retrieval speed on the basis of ensuring a better retrieval accuracy.

作者赵文兵贾懋珅王琪 ZHAO Wen-Bing;JIA Mao-Shen;WANG Qi(Faculty of Information Technology,Beijing University of Technology,Beijing 100124,China)

机构地区北京工业大学信息学部

出处《计算机系统应用》 2020年第8期165-172,共8页 Computer Systems & Applications

基金国家自然科学基金(61971015)。

关键词音频检索压缩感知离散基尼系数音频指纹 audio retrieval compressed sensing discrete Gini coefficient audio fingerprinting

分类号 TP391.3 [自动化与计算机技术—计算机应用技术] TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献8

1叶蕾,杨震,王天荆,孙林慧.行阶梯观测矩阵、对偶仿射尺度内点重构算法下的语音压缩感知[J].电子学报,2012,40(3):429-434. 被引量：22
2王蓉芳,焦李成,刘芳,杨淑媛.利用纹理信息的图像分块自适应压缩感知[J].电子学报,2013,41(8):1506-1514. 被引量：33
3李秀梅,吕军.基于压缩感知的信号时频表示重构[J].计算机系统应用,2016,25(7):176-181. 被引量：1
4张卫强,刘加,陈恩庆.一种基于仿生模式识别思想的固定音频检索方法[J].自然科学进展,2008,18(7):808-813. 被引量：6
5齐晓倩,陈鸿昶,黄海.基于K-L距离的两步固定音频检索方法[J].计算机工程,2011,37(19):160-162. 被引量：7
6于云,周伟栋.基于压缩感知的鲁棒性说话人识别参数研究[J].计算机技术与发展,2016,26(3):18-22. 被引量：1
7王晖楠,魏娇.基于人工智能识别的音乐片段指纹检索技术研究[J].自动化与仪器仪表,2019(5):119-122. 被引量：6
8张卫强,刘加.网络音频数据检索技术[J].通信学报,2007,28(12):152-155. 被引量：10

二级参考文献119

1王守觉,潘晓霞,徐春燕,陈旭,安冬,曹文明.一种基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别的研究[J].电子学报,2005,33(10):1790-1793. 被引量：7
2Wang Y, Liu Z, Huang JC. Multimedia content analysis-using both audio and visual clues. IEEE Signal Processing Magazine, 2000, 17(6): 12-36
3Foote J. An overview of audio information retrieval. Multimedia Systems, 1999, 7(1):2-10
4Hansen JHL, Huang R, Zhou B, et al. Speechfind.. Advances in spoken document retrieval for a national gallery of the spoken word. IEEE Transactions on Speech and Audio Processing, 2005, 13(5): 712-730
5Kashino K, KurozumiT, Murase H. A quick search method for audio and video signals based on histogram pruning. IEEE Transactions on Multimedia, 2003, 5(3) : 348-357
6Kim KM, Kim SY, Jeon JK, et al. Quick audio retrieval using multiple feature vectors. IEEE Transactions on Consumer Electronics, 2006, 52(1): 200-205
7Zhang WQ, Liu J. Two-stage method for specific audio retrieval. IEEE International Conference on Acoustics, Speech, and Signa Processing(ICASSP), Hawaii, 2007. New Jersey: IEEE Press 2007, Ⅳ 85-88
8Wang SJ, Liu YY. An algorithm for removing facial makeup disturbances based on high dimensional imaginal geometry. Chinese Journal of Electronics, 2006, 15(4A): 789-792
9Haykin S著,宋铁成,等译.通信系统.北京:电子工业出版社,2003,56-58
10Kay SM著,罗鹏飞,等译.统计信号处理基础估计与检测理论.北京:电子工业出版社,2003,409-411

共引文献73

1刘哲,张鹤妮,张永亮,郝珉慧.基于弱选择正则化正交匹配追踪的图像重构算法[J].光子学报,2012,41(10):1217-1221. 被引量：12
2杨继臣,王伟凝.一种基于随机段的固定音频检索方法[J].计算机应用,2010,30(1):230-232. 被引量：4
3齐晓倩,陈鸿昶,黄海.基于K-L距离的两步固定音频检索方法[J].计算机工程,2011,37(19):160-162. 被引量：7
4谈会星,陈福才,李邵梅.基于模板子空间的快速固定音频检索方法[J].计算机工程,2012,38(20):260-263. 被引量：3
5季云云,杨震.脉冲噪声环境下高斯稀疏信源贝叶斯压缩感知重构[J].电子学报,2013,41(2):363-370. 被引量：10
6王天荆,郑宝玉,杨震.基于滤波的压缩感知信号采集方案[J].仪器仪表学报,2013,34(3):573-581. 被引量：23
7于志华,张兴明,杨镇西,张丽.一种高性能固定语音识别并行处理架构[J].计算机应用研究,2013,30(8):2419-2421. 被引量：1
8叶蕾,杨震,孙林慧,郭海燕.行阶梯观测矩阵下语音压缩感知观测序列的Volterra+Wiener模型研究[J].信号处理,2013,29(7):816-822. 被引量：3
9章宗标.一种基于PCA-BP 神经网络的示例优选方法[J].计算机工程与应用,2013,49(19):108-111. 被引量：4
10曹杨.基于压缩感知观测序列的语音信号基音周期提取[J].电讯技术,2013,53(10):1327-1330. 被引量：1

同被引文献10

1远飞.4k视频和音频信号的传输技术分析[J].电子技术（上海）,2021,50(9):16-17. 被引量：3
2闫经宇.电视播出系统信号源故障应急处理的现状与新变化[J].黑龙江广播电视技术,2021(4):18-20. 被引量：2
3屠彬彬,于凤芹.基于EMD的改进MFCC的语音情感识别[J].计算机工程与应用,2012,48(18):119-122. 被引量：6
4王雪梅.电视节目播出中几种事故应急处理方法[J].辽宁广播电视技术,2006(2):22-22. 被引量：1
5毕超,冯玉田,李园辉,刁志蕙.基于HHT的声频传感器车辆分类识别[J].电声技术,2016,40(6):48-52. 被引量：6
6王茹斐,徐帆云.平稳音频信号中非稳态噪声的时频分析检测方法[J].电声技术,2018,42(2):76-80. 被引量：1
7闫锋,吕双祺.基于SVM理论的航空发动机飞行数据可视化建模[J].科技创新与应用,2020,0(12):6-10. 被引量：1
8孙曜,张有坤.音频监测系统技术在广播电视中的应用[J].采写编,2021(7):15-16. 被引量：3
9陈永,汪子枫.多通道音频信号采集系统仿真研究[J].工业控制计算机,2022,35(7):118-120. 被引量：2
10刘光斌,陈少卿,程敬之.呼吸系统的声特性及临床应用[J].应用声学,1992,11(6):26-29. 被引量：1

引证文献2

1常峥,罗萍,杨波,张晓晓.基于HHT-MFCC和短时能量的慢性阻塞性肺病患者呼吸声识别[J].计算机应用,2021,41(2):598-603. 被引量：4
2蒋峥.电视播出中音频信号异常检测及应急方法分析[J].通信电源技术,2022,39(17):173-175.

二级引证文献4

1陈娟.心音信号的MFCC特征参数提取方法[J].岳阳职业技术学院学报,2021,36(4):75-78. 被引量：1
2刘慧,李小霞,何宏森.基于多分辨率特征和时频注意力的环境声音分类[J].计算机应用研究,2021,38(12):3569-3573. 被引量：3
3徐建新,赵树杰,马超,巴翔.基于EWT-熵值方法的发动机风扇叶片损伤监控[J].航空动力学报,2023,38(1):23-31.
4陈晓,曾昭优.基于特征融合和B-SVM的鸟鸣声识别算法[J].声学技术,2024,43(1):119-126.

1谢黛安.基于人工智能的乐器识别研究综述[J].南京工程学院学报（自然科学版）,2020,18(2):66-75. 被引量：6
2吴亚文,赵家龙,侯金波,辜丽川,何屿彤,焦俊.基于改进压缩感知的生猪音频信号处理[J].江苏农业科学,2020,48(10):250-255. 被引量：4
3杨露,宋焕生,张朝阳.基于轨迹稀疏聚类的高速公路车辆检测[J].计算机工程与应用,2020,56(15):251-258. 被引量：1
4张天,靳聪,帖云,李小兵.面向跨模态检索的音频数据库内容匹配方法研究[J].信号处理,2020,36(6):966-976. 被引量：4
5杨东红,贺红梅,徐畅.移动音频有声阅读平台用户知识付费行为研究[J].情报科学,2020,38(7):105-111. 被引量：17
6李海峰,孙聪珊,马琳,薄洪健,徐忠亮.基于TVF-EMD的乐器音质特征分析方法及其应用[J].信号处理,2020,36(6):932-941. 被引量：2
7夏茂,刘播阳,张政,陈智超,孔明明.基于凝聚式层次聚类的调频广播自动识别[J].西华大学学报（自然科学版）,2020,39(4):104-112. 被引量：1
8毛雪宇,彭艳兵.基于通道裁剪的YOLOv3模型[J].电子设计工程,2020,28(16):137-141. 被引量：3
9王苗,肖明芳,康凯,张林科.基于灰色关联和故障逻辑的维修案例检索方法[J].计算机应用与软件,2020,37(8):289-295. 被引量：1
10金汉均,吴静.基于深度柯西哈希的图像检索研究[J].电子测量技术,2020(9):104-108. 被引量：1

计算机系统应用

2020年第8期

浏览历史

内容加载中请稍等...

基于压缩感知和音频指纹的固定音频检索方法被引量：2

参考文献8

二级参考文献119

共引文献73

同被引文献10

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于压缩感知和音频指纹的固定音频检索方法 被引量：2

参考文献8

二级参考文献119

共引文献73

同被引文献10

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于压缩感知和音频指纹的固定音频检索方法被引量：2