一种基于倒排索引的音频检索方法被引量：8

An Inverted Index Based Audio Retrieval Method

下载PDF

导出

摘要传统的基于实例的音频检索算法采用顺序索引,检索时需遍历数据库并导致难以忍受的等待时间。针对传统的顺序的索引方法,该文提出基于倒排索引的音频检索算法。该方法首先利用多种音频特征构成的超向量,通过多层音频分割方法将连续音频流分割为特征数值波动幅度小的短时音频段;然后利用事先训练好的音频字典,将短时音频段序列转换为可以表征音频内容的音频字序列,并建立倒排索引;检索时,将用户提交的查询转换为音频字后利用倒排索引无须遍历数据库即可直接定位候选段落,并根据候选段落与查询的内容相似度大小对候选段落进行排序,将排好序的列表作为检索结果。仿真实验以匹配项排名、同类检索结果比例、定位准确性和检索用时4个方面作为评价指标,实验结果显示,该算法能够在平均1.101 s时间内实现92.58%的检索准确率。 Traditional example based audio retrieval algorithms use forward index, with which, retrieval processing need to traverse the whole database, resulting in intolerable response time. This paper proposes an inverted-index based audio retrieval method. Through constructing super-vector comprising several audio features, audio stream is first segmented into short segments with small feature fluctuation; Based on a pre-trained audio word dictionary, short audio segment sequence is then transformed into audio word sequence, from which inverted index is constructed; During the retrieval phase, the query audio sample is transformed into audio words and retrieval is carried out, candidate segments are ranked according to the similarity with the query. Match term ranking, same type ratio, overlap ratio and retrieval time are used to evaluate the performance of the proposed algorithm. The experiment gives 92.58% retrieval precision within average response time of 1.101 s.

作者张雪源贺前华李艳雄叶婉玲

机构地区华南理工大学电子与信息学院

出处《电子与信息学报》 EI CSCD 北大核心 2012年第11期2561-2567,共7页 Journal of Electronics & Information Technology

基金国家自然科学基金(60972132 61101160)资助课题

关键词音频信号处理音频检索内容相似度倒排索引 Audio signal processing Audio retrieval Content similarity Inverted index

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献15

1Heryanto H, Akbar S, and Sitohang B. Direct access in content-based audio information retrieval: a state of the art and challenges[C]. 2011 International Conference on Electrical Engineering and Informatics, Bandung, Indonesia, July 17-19, 2011: 1-6.
2Ghoraani B and Krishnan S. Time-frequency matrix feature extraction and classification of environmental audio signals[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2011, 19(7): 2197-2209.
3Fu Zhou-yu, Lu Guo-jun, Ting Kai-ming, et al.. Music classification via the bag-of-features approach[J]. Pattern Recognition Letters, 2011, 32(14): 1768-1777.
4Su Ja-hwung, Wu Cheng-we, Fu Shao-yu, et al.. Empirical analysis of content-based music retrieval for music identification[C]. 2011 International Conference on Multimedia Technology, Hangzhou, China, July 26-28, 2011: 3516-3519.
5Jurkas P, Stefina M, Novak D, et al.. Audio similarity retrieval engine[C]. Proceedings of the Third International Conference on Similarity Search and Applications, Istanbul, Turkey,Sep. 18-19, 2010: 121-122.
6Kashino K, Kurozumi T, and Murase H. A quick search method for audio and video signals based on histogram pruning[J]. IEEE Transactions on Multimedia, 2003, 5(3): 348-357.
7Matthews B, Chaudhari U, and Ramabhadran B. Fast audio search using vector space modeling[C]. IEEE Workshop on Automatic Speech Recognition & Understanding, Kyoto, Japan, Dec. 9-13, 2007: 641-646.
8Cha Guang-ho. An effective and efficient indexing scheme for audio fingerprinting[C]. 5th FTRA International Conference on Multimedia and Ubiquitous Engineering, Loutraki, Greece June 28-30, 2011: 48-52.
9Bardeli R. Similarity search in animal sound databases[J]. IEEE Transactions on Multimedia, 2009, 11(1): 68-76.
10黄少林,王华,张玉红,蒋一峰.基于Lucene的索引系统的设计与实现[J].现代情报,2009,29(7):169-171. 被引量：11

二级参考文献4

1孙西全,马瑞芳,李燕灵.基于Lucene的信息检索的研究与应用[J].情报理论与实践,2006,29(1):125-128. 被引量：20
2管建和,甘剑峰.基于Lucene全文检索引擎的应用研究与实现[J].计算机工程与设计,2007,28(2):489-491. 被引量：70
3李刚,宋伟,邱哲.Ajax+Lucene构建搜索引擎[M].北京:人民邮电出版社,2006:204-217.
4王莉云,王华,陈刚,姚乃明.基于Lucene的全文检索系统的设计与实现[J].计算机工程与设计,2007,28(24):5959-5961. 被引量：14

共引文献10

1龚磊,武友新.Lucene全文检索系统的研究与实现[J].计算机与数字工程,2010,38(5):64-67. 被引量：5
2李立,王小磊,赵东升.生物医学专题信息跟踪与服务系统的设计与实现[J].军事医学科学院院刊,2010,34(4):373-375. 被引量：1
3崔晓玲,曹春萍,王学义.Lucene在博客垂直搜索引擎个性化检索中的应用[J].微计算机信息,2011,27(2):217-218.
4聂琰.校园网多数据源信息检索系统的设计与实现[J].中国教育信息化（高教职教）,2011(3):50-52.
5张俊三,瞿有利.信息检索中相关实体发现综述[J].计算机工程与设计,2011,32(12):4035-4038. 被引量：2
6王剑,周国民,丘耘,王健.国家农业科学数据中心站内搜索引擎技术研究[J].中国农学通报,2011,27(30):270-274. 被引量：2
7王菊.网络信息检索系统的设计与技术分析[J].网友世界,2012(4):50-52.
8时亚南,束文杰,于国欣.倒排文件页式存储方法[J].计算机系统应用,2015,24(5):253-256. 被引量：1
9张吴波,史旅华,李贵荣.全文检索引擎Lucene系统模型与应用研究[J].软件导刊,2015,14(6):127-129. 被引量：3
10李致远,冯琳.一种基于Lucene的高效索引建立方法[J].工业控制计算机,2020,33(1):77-78. 被引量：3

同被引文献56

1陶雪娇,胡晓峰,刘洋.大数据研究综述[J].系统仿真学报,2013,25(S1):142-146. 被引量：338
2田华娟.在数据结构中如何使用二分查找[J].中国科技信息,2005(5):136-136. 被引量：1
3Ghulam Muhammad,Khaled Alghathbar. Environment recognition from audio using mprg-7 features[A].2009.1-6.
4Malik H,Farid H. Audio forensics from acoustic reverberation[A].2010.1710-1713.
5Ikram S,Malik H. Digital audio forensics using background noise[A].2010.106-110.
6Kraetzer C,Oermann A,Dittmann J. A digital audio forensics:A first practical evaluation on microphone and environment classification[A].2007.63-74.
7Bucholz R,Kraetzerr C,Dittmann J. Microphone classification using fourier coefficients[A].2009.236-246.
8Kraetzer C,Dittmann J. Mel-cepstrum based steganalysis for voIPsteganography[A].2007.6505.
9Ngai Ewt,Hu Yong,Wong Yh. The application of data mining techniques in financial fraud detection:A classification framework and an academic review of literature[J].{H}Decision Support Systems,2011,(03):559-569.
10Uri Nodelman,Christian R,Daphne Koller. Expectation maximization and complex duration distributions for continuous time bayesian networks[A].2012.421-430.

引证文献8

1何少岩,陈蕉容,陈舜儿.基于录制环境检测的数字音频取证研究[J].计算机工程与设计,2013,34(12):4142-4145. 被引量：2
2李峰,卫乃兴.基于大数据倒排索引技术的外语写作教学辅助系统研究与实现[J].外语电化教学,2015(3):31-37. 被引量：2
3林静,杨继臣,张雪源,李新超.一种基于指纹因子的鲁棒音频检索方法[J].数据采集与处理,2016,31(5):1020-1027. 被引量：3
4孙卫国,夏秀渝,乔立能,叶于林.面向音频检索的音频分割和标注研究[J].微型机与应用,2017,36(5):38-41. 被引量：5
5孙甲松,张菁芸,杨毅.基于子带频谱质心特征的高效音频指纹检索[J].清华大学学报（自然科学版）,2017,57(4):382-387. 被引量：5
6乔立能,夏秀渝,叶于林.基于音频指纹的两步固定音频检索[J].计算机系统应用,2017,26(5):266-271. 被引量：1
7张学帅,邹学强,胡琪,张鹏远.基于指纹权重的音频模板检索方法[J].中国科技论文,2018,13(20):2295-2300. 被引量：3
8贺前华,张雪源,杨继臣,林沛.基于感知子空间分解模型的音频特征提取方法[J].华中科技大学学报（自然科学版）,2015,43(3):83-88.

二级引证文献21

1孙彦楠,夏秀渝.基于深度神经网络的关键词识别系统[J].计算机系统应用,2018,27(5):41-48. 被引量：7
2周金傲,龙华.基于音频特征参数的多语种分类算法[J].通信技术,2018,51(10):2350-2355. 被引量：3
3赵修文,刘伍颖,李甫玉,黄心怡.基于音频指纹特征的高效音乐检索方法[J].武警工程大学学报,2018,34(4):27-32.
4彭俊.基于音频检索的广播监播系统研究[J].西部广播电视,2017,38(12):196-196.
5曾春艳,王志锋,王静,田元,叶俊民,左明章.数字音频篡改被动检测研究综述[J].计算机工程与应用,2019,55(2):1-11. 被引量：5
6王晓茹.基于个性化推荐的英语辅助教学系统设计[J].微型电脑应用,2019,35(5):35-38. 被引量：12
7陆雄,夏秀渝,蔡良,孙文慧.声乐主旋律的自动提取[J].太赫兹科学与电子信息学报,2019,17(3):482-488. 被引量：1
8黄立冬.分布式搜索引擎中关键词倒排索引方法仿真[J].计算机仿真,2019,36(8):380-383. 被引量：5
9刘景天,姜囡.基于混合特征的说话人语音分割聚类研究[J].光电技术应用,2019,34(5):37-41. 被引量：3
10邹红.基于TED语料库的大学英语写作实证研究[J].智库时代,2019,0(47):184-185. 被引量：1

1尹相楠,钱良,丁良辉,杨峰.基于内容流行度与相似度的无线NDN转发策略[J].信息技术,2017,41(4):32-36. 被引量：1
2杨浩,安国成,陈向东,吴镇扬.一种基于实例的文本图像超分辨率重建算法[J].东南大学学报（自然科学版）,2008,38(2):191-194. 被引量：5
3林静,杨继臣,张雪源,李新超.一种基于指纹因子的鲁棒音频检索方法[J].数据采集与处理,2016,31(5):1020-1027. 被引量：3
4杜军.基于模板的音频检索方法研究[J].山东师范大学学报（自然科学版）,2008,23(2):139-140. 被引量：2
5叶志雄,朱丽芳,刘钢庭,李启文,王丹弘.基于Hadoop平台的内容相似度与PageRank的垃圾短信识别融合模型[J].广东通信技术,2016,36(9):5-9.
6用事实诠释未来[J].现代表面贴装资讯,2004(1).
7张振宇,曾凡鑫,葛利嘉.跳时序列与跳频序列的性能比较[J].通信技术,2003,36(1):85-88. 被引量：1
8孙德才,王晓霞.一种基于Bigram二级哈希的中文索引结构[J].电子设计工程,2014,22(12):1-4. 被引量：2
9刘超.“智”由“智”在分享海尔N6E的智能生活[J].移动信息,2011(6):28-29.
10鲁智深.待机超过30天长虹800-Ⅲ[J].大众数码,2008,0(4):81-81.

电子与信息学报

2012年第11期

浏览历史

内容加载中请稍等...

一种基于倒排索引的音频检索方法被引量：8

参考文献15

二级参考文献4

共引文献10

同被引文献56

引证文献8

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

一种基于倒排索引的音频检索方法 被引量：8

参考文献15

二级参考文献4

共引文献10

同被引文献56

引证文献8

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

一种基于倒排索引的音频检索方法被引量：8