基于特征的音频比对技术被引量：15

Feature-based Comparison of Audio

下载PDF

导出

摘要音频比对有别于语音识别,音频比对不存在音频重构.在保证音频主要信息不丢失的前提下,采用二阶Haar小波变换压缩原始音频,以音频帧的方式提取出能代表音频主要信息特征的质心、均方根和前12个Mel倒谱系数,并分别计算这3类参数的欧氏距离,根据欧氏距离的值与阀值ε之间的关系,完成音频间的比对任务.经实践证明,这套方案对于音频比对具有较高的准确性和较好的实时性. Audio comparison, different from speech recognition, does not have the necessity of audio reconstruction. Under keeping the major audio information, the original audio frequency is compressed in the way of Haar wavelet transform . Based on audio frames, the centroids reflect the features of major audio information, RMS, and the first 12 Mel-Frequency Cepstral Coefficients are extracted, and the Euclidean Distance of these three parameters is computed respectively. Finally audio comparison is accomplished according to the relationship between the value of Euclidean Distance and Threshold Value . The experiments show that this algorithm has a nigh accuracy and efficiency. It will play an active role in computer-bases audio rec- ognition and speech recognition.

作者郭兴吉范秉琪

机构地区绵阳师范学院物理与电子信息工程系郑州大学电气工程学院

出处《河南师范大学学报（自然科学版）》 CAS CSCD 北大核心 2006年第2期35-38,共4页 Journal of Henan Normal University(Natural Science Edition)

基金四川省教育厅青年重点基金项目(2002A117)

关键词小波变换音频参数欧氏距离音频相似度 wavelet transform audio parameter Euclidean Distance audio similarity

分类号 TP391.42 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1林福宗.小波与小波变换[D].北京:清华大学,2001.
2郑方,吴文虎,方棣棠.汉语语音听写机中的语音识别基元[C].第四届全国人机语音通讯学术会议,北京:1996.
3卢坚,陈毅松,孙正兴,张福炎.基于隐马尔可夫模型的音频自动分类[J].软件学报,2002,13(8):1593-1597. 被引量：47
4李国辉,李恒峰.基于内容的音频检索:概念和方法[J].小型微型计算机系统,2000,21(11):1173-1177. 被引量：52
5赵雪雁,吴飞,庄越挺,刘骏伟.基于模糊聚类表征的音频例子检索及相关反馈[J].浙江大学学报（工学版）,2003,37(3):264-268. 被引量：15
6李俊毅.语音评分[D].新竹:台湾清华大学,1998.
7杜利民,侯自强.汉语语音识别研究面临的一些科学问题[J].电子学报,1995,23(10):110-116. 被引量：21

二级参考文献44

1[1]Feiten, B., Frank, R., Ungvary, T. Organization of sounds with neural nets. In: Proceedings of the 1991 International Computer Music Conference, International Computer Music Association. San Francisco, 1991. 441～444.
2[2]Feiten, B., Günzel, S. Automatic indexing of a sound database using self-organizing neural nets. Computer Music Journal, 1994,18(3):53～65.
3[3]Wold, E., Blum, T., Keislar, D., et al. Content-Based classification, search and retrieval of audio. IEEE Multimedia Magazine, 1996,3(3):27～36.
4[4]Foote, J.T. Content-Based retrieval of music and audio. Multimedia Storage and Archiving Systems II, 1997,32(29):138～147.
5[5]Li, S.Z. Content-Based classification and retrieval of audio using the nearest feature line method. IEEE Transactions on Speech and Audio Processing, 2000,8(5):619～625.
6[6]Li, S.Z., Guo, Guo-dong. Content-Based audio classification and retrieval using SVM learning. In: Proceedings of the 1st IEEE Pacific-Rim Conference on Multimedia. 2000.
7[7]Jiang, Hao, Lin, Tony, Zhang, Hong-jiang. Video segmentation with the support of audio segmentation and classification. In: Proceedings of the IEEE International Conference on Multimedia and Expo (ICME 2000), Vol 3. NY: IEEE, 2000. 1507～1510.
8[8]He, Li-wei, Sanocki, E., Gupta, A., et al. Auto-Summarization of audio-video presentations. In: Proceedings of the 7th ACM International Conference on Multimedia. Orlando: ACM Press, 1999. 489～498.
9[9]Patel, N., Sethi, I. Audio characterization for video indexing. In: Proceedings of the SPIE on Storage and Retrieval for Still Image and Video Databases, Vol 2670. 1996. 373～384.
10[10]Liu, Zhu, Huang, J., Wang, Y. Classification of TV programs based on audio information using hidden Markov model. In: Proceedings of the IEEE Signal Processing Society 1998 Workshop on Multimedia Signal Processing. IEEE, 1998. 27～32.

共引文献121

1齐俊英,孙劲光,高爱东.基于内容的音频自动分类方法[J].辽宁工程技术大学学报（自然科学版）,2005,24(z1):170-172. 被引量：5
2郑继明,李瑞仙,蒲兴成.基于单状态HMM的音频分类方法研究[J].计算机应用,2009,29(2):392-394.
3张宜.汉语语音识别技术的研究与发展[J].广西广播电视大学学报,2003,14(4):18-22. 被引量：3
4陈姗姗.未来广播中的音频检索技术[J].视听界（广播电视技术）,2010(3):62-64.
5李国辉,王辰,柳伟.基于内容的多媒体数据库系统引擎CDB[J].小型微型计算机系统,2004,25(7):1113-1118. 被引量：4
6赵丕锡,王秀坤,李国辉,田宏.视频概要的分类与综合评价方法[J].计算机应用研究,2004,21(11):5-7. 被引量：3
7焦玉英,周华敏.基于音频内容的交互渐进式音乐检索系统的设计[J].情报科学,2004,22(12):1458-1460. 被引量：3
8周燕,张友纯,王蕾.连续数字语音识别系统的定点DSP实时实现[J].中国科教博览,2004(11):61-63.
9张红燕,姚建华,喻飞.一种基于音频检索的有线电视网信息审核系统[J].中国有线电视,2005(7):669-673.
10柳群英.基于内容的音频信息检索技术[J].现代情报,2005,25(6):91-93. 被引量：7

同被引文献40

1樊波.利用网络音频矩阵构建音频比对系统[J].声屏世界,2019,0(S01):47-48. 被引量：4
2艾佳琪,左毅,刘君霞,贺培超,李铁山,陈俊龙.基于余弦相似度的动态语音特征提取算法[J].计算机应用研究,2020,37(S02):147-149. 被引量：10
3张万里,刘桥.Mel频率倒谱系数提取及其在声纹识别中的作用[J].贵州大学学报（自然科学版）,2005,22(2):207-210. 被引量：20
4谢湘.语音识别技术[EB/OL].[2011-03-20].http://itrjY.5d6d.com/thread-318-1-1.html.
5吴香琴.试论数字水印技术及其发展[M].兰台世界,2009(4):20-21.
6姚天认.数字语音处理[M].武汉:华中科技大学出版社,2002.
7同济大学应用数学系.线性代数[M].4版.北京:高等教育出版社,2006.
8张华熊,朱诗威,章晨衍.基于音频匹配的广告智能监播算法[J].电子器件,2008,31(2):669-671. 被引量：3
9梁达先.一种射频视音频中断监测器[J].电视技术,2008,32(6):90-92. 被引量：4
10王东,陈俊龙,张鸿贤.基于音频比对的声纹识别技术[J].佛山科学技术学院学报（自然科学版）,2008,26(4):1-5. 被引量：3

引证文献15

1王东,陈俊龙,张鸿贤.基于音频比对的声纹识别技术[J].佛山科学技术学院学报（自然科学版）,2008,26(4):1-5. 被引量：3
2崔文冲.应用于广播电视音频监测系统的技术分析[J].电视技术,2011,35(22):76-77. 被引量：5
3王红旗.基于音频包络比对的信号同步切换技术分析[J].西部广播电视,2014,35(21):155-157. 被引量：2
4张梅霞.应用于广播电视音频监测系统的技术分析[J].中国科技博览,2016,0(1):250-250.
5何小林.论音频比对技术在广播播控系统中的应用[J].电声技术,2016,40(7):81-83. 被引量：12
6李晓辉.音频比对技术在安全播出中的发展与应用[J].新媒体研究,2016,2(21):41-42. 被引量：6
7王晟.频谱分析在广播监测领域中的应用探讨[J].电声技术,2017,41(3):88-91. 被引量：1
8张琳,周韬,杜庆治,邵玉斌,龙华.基于物理特征的音频相似度比对算法研究[J].电视技术,2017,41(11):110-114. 被引量：9
9吴锦晶.网络多媒体分析系统的分析与设计[J].电脑知识与技术,2019,15(5Z):189-190. 被引量：1
10邵玉斌,唐传林,赵至柔,龙华,杜庆治.基于倒谱分析的实时广播音频相似度快速比对算法[J].工程科学与技术,2020,52(3):178-185. 被引量：4

二级引证文献44

1薛祥玉,管江勇,曹冠忠,王长刚.基于知识图谱的智慧热水器节能低碳运行技术研究及应用[J].家电科技,2022(S01):679-681.
2王论衡.隧道广播覆盖系统音频比对技术应用[J].黑龙江广播电视技术,2023(3):43-48.
3张旻,李明,李政,蒋嘉林.基于声纹的Android手机访问控制及文件加密系统[J].信息网络安全,2013(4):19-24. 被引量：2
4王红旗.基于音频包络比对的信号同步切换技术分析[J].西部广播电视,2014,35(21):155-157. 被引量：2
5张凯.浅谈广播音频监测的几种应用技术[J].电声技术,2016,40(4):45-47. 被引量：2
6刘海芳.广播电视音频处理器应用探究[J].西部广播电视,2016,37(7):181-181.
7周冲,李婧,李曼.探讨电台播控系统监测平台的建设[J].中国有线电视,2017(10):1191-1194. 被引量：1
8周冲,关洁,叶远.运用AES+AoIP的异构并行传输模式构建广播总控平台[J].广播电视信息,2018,25(3):24-26.
9张琳,周韬,杜庆治,邵玉斌,龙华.基于物理特征的音频相似度比对算法研究[J].电视技术,2017,41(11):110-114. 被引量：9
10马玉忠.防插播错播技术在中短波发射中的应用[J].中国传媒大学学报（自然科学版）,2018,25(B09):103-107.

1杨得国,王荣萍.基于音频特征的自适应数字盲音频水印算法[J].江西师范大学学报（自然科学版）,2014,38(1):108-110.
2王庆岭,冯德成.基于小波域的自适应数字水印算法的研究[J].自动化与仪器仪表,2015(1):13-16 19. 被引量：6
3孙逊,王占丰,周玉明,王佳.流比对技术在P2P流量分析系统中的应用[J].计算机安全,2009(12):30-32.
4步天宇.引领5.1时代漫步者新S5.1评测[J].电脑迷,2008,0(12):25-27.
5卢良进.基于词袋模型的微课视频跨媒体检索研究[J].软件导刊,2016,15(2):123-125.
6徐秀芳,徐森,徐静,安晶.基于谱聚类算法的音频聚类研究[J].软件导刊,2016,15(11):36-38. 被引量：1
7王九经.人脸识别技术在金融机构的应用研究[J].中国公共安全,2011(8):158-160.
8胡伟俭.浅谈云计算在反病毒软件中的应用[J].牡丹江教育学院学报,2009(4):101-102. 被引量：5
9宫晓东.人像比对技术在生物特征识别领域中的应用探析[J].智能建筑,2016(5):41-45.
10王芳.试分析图形图像压缩的常见方法技巧[J].电脑知识与技术,2016,12(4X):199-200. 被引量：2

河南师范大学学报（自然科学版）

2006年第2期

浏览历史

内容加载中请稍等...

基于特征的音频比对技术被引量：15

参考文献7

二级参考文献44

共引文献121

同被引文献40

引证文献15

二级引证文献44

相关作者

相关机构

相关主题

浏览历史

基于特征的音频比对技术 被引量：15

参考文献7

二级参考文献44

共引文献121

同被引文献40

引证文献15

二级引证文献44

相关作者

相关机构

相关主题

浏览历史

基于特征的音频比对技术被引量：15