基于EMGD_HMM的音频自动分类被引量：3

Automatic Audio Classification Based on EMGD_HMM

下载PDF

导出

摘要音频自动分类是解决音频结构化问题和提取音频内容语义的重要手段之一,是当前基于内容的音频检索领域的一个研究热点。在考察音频数据特征的基础上,针对左-右密度隐马尔可夫模型(left-right DHMM)不能很好反映音频中状态反复的缺点,提出了一种基于各态历经混合高斯密度隐马尔可夫模型(EMGD_HMM)的分类器,并应用于语音、音乐和它们的混合声音的分类。实验结果表明,EMGD_HMM的分类精度要优于left-right DHMM。 Automatic audio classification is one of the significant methods to extract content semantics from audio. An improved classifier based on EMGD_HMM（Ergodic Mixed Gaussian Density Hidden Markov Model） is proposed to classify audio in speech, music, and their mixture. The experimental results show that compared with left-right DHMM（left-right Density Hidden Markov Model）, EMGD HMM achieves better classification accuracy.

作者王超吴亚锋

机构地区西北工业大学数据处理中心

出处《电声技术》 2007年第11期52-54,60,共4页 Audio Engineering

关键词音频自动分类 left-right DHMM模型 EMGD_HMM模型 MEL倒谱系数 automatic audio classification left-right DHMM EMGD_HMM Mel frequency cepstrnm coefficient

分类号 TN912 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献5

1LU G, HANKINSON T. A technique towards automatic audio classification and retrieval[C]// Proceedings of the 4th International Conference on Signal Processing. [S.l.]: IEEE Press, 1998,12:1 142-1 145.
2ZHANG T, KUO J C-C. Heuristic approach for generic audio data segmentation and annotation[C]// Proceedings of the 7th ACM International Conference on Multimedia.Orlando : [s.n,], 1999:67-76.
3卢坚,陈毅松,孙正兴,张福炎.基于隐马尔可夫模型的音频自动分类[J].软件学报,2002,13(8):1593-1597. 被引量：47
4LIU Z, WANG Y, CHEN T. Audio feature extraction and analysis for scene segmentation and classification[J]. Journal of VLSI Signal Processing Systems for Signal, Image,and Video Technology, 1998,20(1/2) :61-79.
5LAWRENCE R, RABINER A. Tutorial on hidden Markov models and selected applications in speech recognition[J]. Proceedings of the IEEE, 1989,77(2) :257-286.

二级参考文献18

1[1]Feiten, B., Frank, R., Ungvary, T. Organization of sounds with neural nets. In: Proceedings of the 1991 International Computer Music Conference, International Computer Music Association. San Francisco, 1991. 441～444.
2[2]Feiten, B., Günzel, S. Automatic indexing of a sound database using self-organizing neural nets. Computer Music Journal, 1994,18(3):53～65.
3[3]Wold, E., Blum, T., Keislar, D., et al. Content-Based classification, search and retrieval of audio. IEEE Multimedia Magazine, 1996,3(3):27～36.
4[4]Foote, J.T. Content-Based retrieval of music and audio. Multimedia Storage and Archiving Systems II, 1997,32(29):138～147.
5[5]Li, S.Z. Content-Based classification and retrieval of audio using the nearest feature line method. IEEE Transactions on Speech and Audio Processing, 2000,8(5):619～625.
6[6]Li, S.Z., Guo, Guo-dong. Content-Based audio classification and retrieval using SVM learning. In: Proceedings of the 1st IEEE Pacific-Rim Conference on Multimedia. 2000.
7[7]Jiang, Hao, Lin, Tony, Zhang, Hong-jiang. Video segmentation with the support of audio segmentation and classification. In: Proceedings of the IEEE International Conference on Multimedia and Expo (ICME 2000), Vol 3. NY: IEEE, 2000. 1507～1510.
8[8]He, Li-wei, Sanocki, E., Gupta, A., et al. Auto-Summarization of audio-video presentations. In: Proceedings of the 7th ACM International Conference on Multimedia. Orlando: ACM Press, 1999. 489～498.
9[9]Patel, N., Sethi, I. Audio characterization for video indexing. In: Proceedings of the SPIE on Storage and Retrieval for Still Image and Video Databases, Vol 2670. 1996. 373～384.
10[10]Liu, Zhu, Huang, J., Wang, Y. Classification of TV programs based on audio information using hidden Markov model. In: Proceedings of the IEEE Signal Processing Society 1998 Workshop on Multimedia Signal Processing. IEEE, 1998. 27～32.

共引文献46

1齐俊英,孙劲光,高爱东.基于内容的音频自动分类方法[J].辽宁工程技术大学学报（自然科学版）,2005,24(z1):170-172. 被引量：5
2郑继明,李瑞仙,蒲兴成.基于单状态HMM的音频分类方法研究[J].计算机应用,2009,29(2):392-394.
3陈姗姗.未来广播中的音频检索技术[J].视听界（广播电视技术）,2010(3):62-64.
4柳群英.基于内容的音频信息检索技术[J].现代情报,2005,25(6):91-93. 被引量：7
5郑贵滨,韩纪庆,李海峰,郑铁然.基于分段的实时声频检索方法[J].声学学报,2006,31(2):101-108. 被引量：5
6郭兴吉,范秉琪.基于特征的音频比对技术[J].河南师范大学学报（自然科学版）,2006,34(2):35-38. 被引量：15
7郑贵滨,韩纪庆.基于直方图的树与链表相结合的音频索引方法[J].哈尔滨工业大学学报,2006,38(11):1915-1918. 被引量：1
8郭兴吉.隐马尔科夫模型在音频波形识别中的应用研究[J].福建电脑,2007,23(3):13-14.
9黄光球,汪晓海.基于BP-HMM的网络入侵检测方法研究[J].计算机工程,2007,33(10):131-133. 被引量：2
10郑怡文.典型的音频分类算法[J].计算机与现代化,2007(8):59-63. 被引量：3

同被引文献11

1齐俊英,孙劲光,高爱东.基于内容的音频自动分类方法[J].辽宁工程技术大学学报（自然科学版）,2005,24(z1):170-172. 被引量：5
2胡艳芳,吴及,刘慧星.基于MLER的语音/音乐分类方法[J].清华大学学报（自然科学版）,2008,48(S1):720-724. 被引量：6
3陈功,王振力,张建兵.基于短时能量的语音/音乐快速分类[J].电子技术应用,2006,32(1):53-55. 被引量：3
4Vapnik V. The nature of statistical learning theory [M] New York Springer-Verlag,1995.
5杨靓,苗振江.wEB音频自动分类的研究[J].第十一届全国人机语音通讯学术会议.
6史东承,韩玲艳,于明会.基于HMM/SVM的音频自动分类[J].长春工业大学学报,2008,29(2):178-182. 被引量：9
7张新彩,张德同,耿国华,王小凤,吴江.基于PCA和CHMM的音频自动分类[J].计算机应用研究,2009,26(4):1257-1259. 被引量：4
8陈红红,刘加.基于MLER和GMM的语音音乐分类[J].电声技术,2011,35(10):47-50. 被引量：2
9万玉龙,周若华,颜永红.快速准确的自动音乐/语音分段方法[J].清华大学学报（自然科学版）,2013,53(6):878-882. 被引量：2
10卢坚,陈毅松,孙正兴,张福炎.基于隐马尔可夫模型的音频自动分类[J].软件学报,2002,13(8):1593-1597. 被引量：47

引证文献3

1陈戈珩,胡明辉,吴天华.基于支持向量机和HMM的音频信号分类算法[J].长春工业大学学报,2015,36(4):369-373. 被引量：5
2赵芳.基于OSGWT-SNHMM模型的音频分类[J].北方音乐,2015,35(21):157-157.
3郑清杰,龙华,邵玉斌,杜庆治.基于节拍谱的语音音乐分类模型[J].通信技术,2020,53(11):2675-2679. 被引量：1

二级引证文献6

1林雪云.基于游戏玩家流失预警的改进决策树算法[J].长春工业大学学报,2016,37(2):182-186.
2赵宏旭,张一闻,杨文帅.基于支持向量机的混合车辆音频信号的车型识别研究[J].激光杂志,2018,39(9):133-137. 被引量：8
3金恒康,张一闻,王耀杰.无人机飞行声特征与提取方法比较[J].现代电子技术,2019,42(22):103-107. 被引量：4
4张婷.基于节拍识别的音乐表演机器人构建研究[J].自动化与仪器仪表,2022(12):211-215.
5马宝霖,胡茜.基于改进SMOTE的不平衡数据分类算法[J].长春工业大学学报,2024,45(3):259-264.
6孙慧芳,龙华,邵玉斌,杜庆治.基于过零率及频谱的语音音乐分类算法[J].云南大学学报（自然科学版）,2019,0(5):925-931. 被引量：19

1卢坚,陈毅松,孙正兴,张福炎.基于隐马尔可夫模型的音频自动分类[J].软件学报,2002,13(8):1593-1597. 被引量：47
2陈剑赟,李云浩,吴玲达,老松扬,白亮.辅助足球视频切分的音频自动分类与分段[J].国防科技大学学报,2004,26(6):49-53. 被引量：2
3李子,蔡跃明.Rayleigh衰落信道的仿真模型[J].解放军理工大学学报（自然科学版）,2004,5(2):1-8. 被引量：11
4胡宗福.环程光程随机扰动时光纤环形腔的有效带宽[J].光学学报,2000,20(4):472-477.
5吴春辉,陈洪生.基于内容的音频检索关键技术研究与设计[J].咸宁学院学报,2007,27(6):66-68. 被引量：2
6匡锦瑜,卫发强.多分量混合高斯密度的一种参数估计算法[J].北京师范大学学报（自然科学版）,1991,27(2):180-186.
7王佑民,江城,吴丰博.用FPGA实现基于内容的音频检索系统[J].中国制造业信息化（学术版）,2007,36(9):66-68. 被引量：1
8卢坚,陈毅松,孙正兴,张福炎.语音/音乐自动分类中的特征分析[J].计算机辅助设计与图形学学报,2002,14(3):233-237. 被引量：26
9朱爱红,李连.基于内容的音频检索综述[J].微机发展,2003,13(12):58-60. 被引量：11
10龚英姬,胡维平.基于HHT变换的病态嗓音特征提取及识别研究[J].计算机工程与应用,2007,43(34):217-219. 被引量：7

电声技术

2007年第11期

浏览历史

内容加载中请稍等...

基于EMGD_HMM的音频自动分类被引量：3

参考文献5

二级参考文献18

共引文献46

同被引文献11

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于EMGD_HMM的音频自动分类 被引量：3

参考文献5

二级参考文献18

共引文献46

同被引文献11

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于EMGD_HMM的音频自动分类被引量：3