一种基于随机段的固定音频检索方法被引量：4

Method of specific audio retrieval based on randomly segment

下载PDF

导出

摘要在固定音频检索的整体检索方法中,当检索目标较长时,检索时间会变得很长。为了减小检索时间,提出了一种基于随机段的音频检索方法。把整个检索过程分成随机段检索和整体匹配两个阶段:随机段检索是从参考模板中随机选择一段(随机段)作为检索目标进行检索;整体匹配是在随机段检索出的基础上,判断潜在目标信号是否为参考模板。把这种随机检索的方法应用到计算特征距离和直方图交集方法中,结果证明该检索方法的准确率可以达到90%以上,而且平均检索时间可以降低到随机段与参考模板的比值和整体检索时间的积。 This paper proposed a specific audio retrieval method based on random segment in order to decrease the retrieval time for relatively long object in the total retrieval of audio retrieval. The whole retrieval process was composed of random segment retrieval and total matching： the first was to select a segment from template model as object to retrieve in stored signal and the second was to judge whether the potential object signal was the template model based on random segment. Then using this method in computing feature distance directly and histogram intersection retrieval, the experimental results show retrieval accuracy over 90% and average retrieval time declined to the ratio of random segment to template model multiplying total retrieval time.

作者杨继臣王伟凝

机构地区华南理工大学电子与信息学院

出处《计算机应用》 CSCD 北大核心 2010年第1期230-232,共3页 journal of Computer Applications

基金国家自然科学基金资助项目(60972132 60602014)

关键词直方图交集法特征距离过零率 histogram intersection feature distance Zero Crossing Rate （ZCR）

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献11

1FOOTE J. An overview of audio information retrieval[ J]. Multimedia Systems, 1999, 7(1) : 2 - 10.
2HANSEN J H L, HUANG RONGQING. SpeechFind: Advances in spoken document retrieval for a national gallery of the spoken word [J]. IEEE Transactions on Speech and Audio processing, 2005, 13 (5): 712-730.
3CHECHIL G, LE E, REHN M, et al. Large-scale content-based audio retrieval from text queries[ C]//Proceedings of 1st ACM International Conference on Multimedia Information Retrieval. New York: ACM, 2008:105 - 112.
4张卫强,刘加.网络音频数据检索技术[J].通信学报,2007,28(12):152-155. 被引量：10
5张卫强,刘加,陈恩庆.一种基于仿生模式识别思想的固定音频检索方法[J].自然科学进展,2008,18(7):808-813. 被引量：6
6SMITH G, MURASE H, KASHINO K. Quick audio retrieval using active search[C]// IEEE International Conference on Acoustics, Speech and Signal Processing. New York: IEEE, 1998, 6:3777 - 3780,.
7KASHINO K, KUROZUMI T, MURASE H. A quick search method for audio and video signals based on histogram pruning[ J]. IEEE Transactions on Multimedia, 2003, 5 (3) : 384 - 357.
8郑贵滨,韩纪庆,李海峰,郑铁然.基于分段的实时声频检索方法[J].声学学报,2006,31(2):101-108. 被引量：5
9ZHANG W Q, LIY J. two-stage method for specific audio retrieval [ C]// IEEE International Conference on Acoustics, Speech and Signal Processing. New York: IEEE, 2007, 4:85 - 88.
10YAO J C, WAN W W, YU X Q, et al. A quick specific audio retrieval algorithm based on general prediction[ C]// IEEE 2008 International Conference on Audio, Language and Image Processing. New York: IEEE, 2008, 1180 - 1184.

二级参考文献34

1吕成国,韩纪庆,王承发.动态时间规正与差别子空间相结合的变异语音识别方法[J].声学学报,2005,30(3):229-234. 被引量：2
2王守觉,潘晓霞,徐春燕,陈旭,安冬,曹文明.一种基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别的研究[J].电子学报,2005,33(10):1790-1793. 被引量：7
3Wang Y, Liu Z, Huang JC. Multimedia content analysis-using both audio and visual clues. IEEE Signal Processing Magazine, 2000, 17(6): 12-36
4Foote J. An overview of audio information retrieval. Multimedia Systems, 1999, 7(1):2-10
5Hansen JHL, Huang R, Zhou B, et al. Speechfind.. Advances in spoken document retrieval for a national gallery of the spoken word. IEEE Transactions on Speech and Audio Processing, 2005, 13(5): 712-730
6Kashino K, KurozumiT, Murase H. A quick search method for audio and video signals based on histogram pruning. IEEE Transactions on Multimedia, 2003, 5(3) : 348-357
7Kim KM, Kim SY, Jeon JK, et al. Quick audio retrieval using multiple feature vectors. IEEE Transactions on Consumer Electronics, 2006, 52(1): 200-205
8Zhang WQ, Liu J. Two-stage method for specific audio retrieval. IEEE International Conference on Acoustics, Speech, and Signa Processing(ICASSP), Hawaii, 2007. New Jersey: IEEE Press 2007, Ⅳ 85-88
9Wang SJ, Liu YY. An algorithm for removing facial makeup disturbances based on high dimensional imaginal geometry. Chinese Journal of Electronics, 2006, 15(4A): 789-792
10Haykin S著,宋铁成,等译.通信系统.北京:电子工业出版社,2003,56-58

共引文献13

1齐晓倩,陈鸿昶,黄海.基于K-L距离的两步固定音频检索方法[J].计算机工程,2011,37(19):160-162. 被引量：7
2谈会星,陈福才,李邵梅.基于模板子空间的快速固定音频检索方法[J].计算机工程,2012,38(20):260-263. 被引量：3
3于志华,张兴明,杨镇西,张丽.一种高性能固定语音识别并行处理架构[J].计算机应用研究,2013,30(8):2419-2421. 被引量：1
4章宗标.一种基于PCA-BP 神经网络的示例优选方法[J].计算机工程与应用,2013,49(19):108-111. 被引量：4
5曹雪昭,杜秀华,曹俊.基于压缩感知的固定音频检索方法[J].实验室研究与探索,2015,34(6):50-54. 被引量：2
6高晓芳,罗森林,吕英,罗志军,潘丽敏.双哈希索引的高精度大规模音频样例检索[J].声学学报,2015,40(6):886-893. 被引量：1
7陈阳,覃鸿,李卫军,周新奇,董肖莉,张丽萍,李浩光.仿生模式识别技术研究与应用进展[J].智能系统学报,2016,11(1):1-14. 被引量：4
8孙卫国,夏秀渝,乔立能,叶于林.面向音频检索的音频分割和标注研究[J].微型机与应用,2017,36(5):38-41. 被引量：5
9乔立能,夏秀渝,叶于林.基于音频指纹的两步固定音频检索[J].计算机系统应用,2017,26(5):266-271. 被引量：1
10赵文兵,贾懋珅,王琪.基于压缩感知和音频指纹的固定音频检索方法[J].计算机系统应用,2020,29(8):165-172. 被引量：2

同被引文献36

1史泽林,康娇,孙锐.基于BP神经网络的大视场成像畸变校正方法[J].光学精密工程,2005,13(3):348-353. 被引量：24
2郑贵滨,韩纪庆,李海峰,郑铁然.基于分段的实时声频检索方法[J].声学学报,2006,31(2):101-108. 被引量：5
3Wang Yao, Liu Zhu, Huang Jincheng. Multimedia Content Analysis Using Both Audio and Visual Clues[J]. IEEE Signal Processing Magazine, 2000, 17(6): 12-36.
4Foote J. An Overview of Audio Information Retrieval[J]. Multi- media Systems, 1999, 7(1): 2-10.
5Kashino K, Kurozumi T, Murase H. A Quick Search Method for Audio and Video Signals Based on Histogram Pruning[J]. IEEE Trans. on Multimedia, 2003, 5(3): 348-357.
6Zhang Weiqiang, Liu Jia. Two-stage Method for Specific Audio Retrieval[C] //Proc. of IEEE International Conference on Acoustics, Speech, and Signal Processing. [S. l.] : IEEE Press, 2007: 85-88.
7Kim K M, Kim S Y, Jeon J K, et al. Quick Audio Retrieval Using Multiple Feature Vectors[J]. IEEE Trans. on Consumer Electronics, 2006, 52(1): 200-205.
8Cheng Deyuan, Gersho A, Ramamurthi B, et al. Fast Search Algorithm for Vector Quantization and Pattern Matching[C] //Proc. of IEEE International Conference on Acoustics, Speech, and Signal Processing. [S. l.] : IEEE Press, 1984: 372-375.
9Huang X, Alex A, Hon H W. Spoken Language Processing[M]. New Jersey, USA: Prentice Hall, 2001.
10Yao Jincao, Wan Wanggen, Yu Xiaoqing, et al. A Quick Specific Audio Retrieval Algorithm Based on General Prediction[C] //Proc. of IEEE International Conference on Audio, Language and Image Processing. New York, USA: IEEE Press, 2008: 1180-1184.

引证文献4

1谈会星,陈福才,李邵梅.基于模板子空间的快速固定音频检索方法[J].计算机工程,2012,38(20):260-263. 被引量：3
2于志华,张兴明,杨镇西,张丽.一种高性能固定语音识别并行处理架构[J].计算机应用研究,2013,30(8):2419-2421. 被引量：1
3章宗标.一种基于PCA-BP 神经网络的示例优选方法[J].计算机工程与应用,2013,49(19):108-111. 被引量：4
4乔立能,夏秀渝,叶于林.基于音频指纹的两步固定音频检索[J].计算机系统应用,2017,26(5):266-271. 被引量：1

二级引证文献9

1金国平,余宗桥,郭延文,蒋和.基于GPU加速的音频检索技术[J].计算机工程,2014,40(5):266-269.
2马永军,袁赢,李灏.面向CPU+GPU异构平台的模板匹配目标识别并行算法[J].天津科技大学学报,2014,29(4):48-52. 被引量：2
3唐勇波.改进特征样本方法的KPCA变压器故障检测模型[J].计算机工程与应用,2014,50(21):4-7. 被引量：8
4赵薇,Xie Qianli,Wu Yin,Zhang Qin.Research of multi-channel impulse noise detection algorithms based on template[J].High Technology Letters,2015,21(2):147-154.
5谈元鹏,许刚,赵妙颖.电力工程造价的随机权深度神经学习估算方法[J].计算机工程与应用,2015,51(21):213-218. 被引量：6
6李芬,刘迪,胡超,马年骏,闫全全,陈正洪.基于PCA-LMBP神经网络的北京地区直散分离预测[J].水电能源科学,2017,35(4):208-212. 被引量：5
7乔立能,夏秀渝,叶于林.基于音频指纹的两步固定音频检索[J].计算机系统应用,2017,26(5):266-271. 被引量：1
8姜智堯,黄巍,薛扬帆,杜志敏,晋欣桥.屋顶机空调远程监测软硬件系统设计与故障诊断[J].制冷技术,2021,41(6):15-20. 被引量：2
9何蕊伽,夏秀渝.基于LSTM的关键词识别系统设计[J].计算机与网络,2022,48(2):64-69. 被引量：2

1李荆生,王树伟,万时华.固定音频检索方法在广播监测中的应用[J].广播与电视技术,2007,34(7):105-106.
2张军英.一种基于与噪声特征距离最大的语音识别方法[J].应用声学,1992,11(3):12-17.
3谈会星,陈福才,李邵梅.基于AWS_VFR的语音特征提取方法[J].计算机工程与应用,2013,49(16):192-195. 被引量：1
4张卫强,刘加,陈恩庆.一种基于仿生模式识别思想的固定音频检索方法[J].自然科学进展,2008,18(7):808-813. 被引量：6
5邢伟利.图像检索中颜色的特征提取及匹配算法[J].微机发展,2004,14(2):86-88. 被引量：22
6王一寰,檀柏梅.基于太阳能的白光LED照明技术[J].光电技术应用,2007,22(4):38-41.
7陈茂霖,卢维欣,万幼川,田思忆,杨威.无附加信息的地面激光点云自动拼接方法[J].中国激光,2016,43(4):212-220. 被引量：17
8高雄,李霖,郭观星,吕俊男,李进.阶梯型缺陷地的超宽带共模抑制滤波器[J].无线电通信技术,2014,40(4):67-69.
9刘子龙,丁淑娟,孙广俊,李铁成.基于二阶锥规划的宽带波束形成器设计[J].计算机工程与应用,2013,49(5):195-199. 被引量：4
10梁庆然.浅谈专利检索中的噪声[J].电声技术,2015,39(4):58-60.

计算机应用

2010年第1期

浏览历史

内容加载中请稍等...

一种基于随机段的固定音频检索方法被引量：4

参考文献11

二级参考文献34

共引文献13

同被引文献36

引证文献4

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

一种基于随机段的固定音频检索方法 被引量：4

参考文献11

二级参考文献34

共引文献13

同被引文献36

引证文献4

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

一种基于随机段的固定音频检索方法被引量：4