足球比赛中的音频信息提取与自动分类被引量：1

Automatic extraction and classification of audio information in soccer game

下载PDF

导出

摘要按照MEPG-7的音频特征规范,设计了帧层次和段层次上的音频特征提取算法.在深入分析足球比赛中各类音频信息的不同特点的基础上,通过有针对性地选取特征,构造特征向量,设计并实现了一种基于决策树的层次化分类算法.该算法可以自动将足球比赛中的音频信息分为噪音、解说员语音、哨音、欢呼声和带背景音的解说员语音等5个类别.实验表明:该算法提取的特征有效,分类效果良好. The extraction algorithm of frame-level and clip-level audio features is designed according to the MPEG-7 audio standard.By deeply analyzing the characteristics of audio information in soccer game,the feature vector is formed and a hierarchical audio classifier is realized based on decision tree.The decision tree audio classifier divides audio information in soccer game into five classes： noise,commentator speech,whistle,cheer and commentator speech with background noise.The experiment results show that the selected features are effective for audio classification,and the classification accuracy is reasonable.

作者于俊清崔玉强何云峰

机构地区华中科技大学计算机科学与技术学院

出处《华中科技大学学报（自然科学版）》 EI CAS CSCD 北大核心 2007年第10期35-38,45,共5页 Journal of Huazhong University of Science and Technology(Natural Science Edition)

基金湖北省自然科学基金资助项目(2005ABA256) 华为基金资助项目(YJCB20050241N)

关键词特征提取音频分类决策树足球比赛 feature extraction audio classification decision tree soccer game

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献8

1Jiang Hao,Lin Tony,Zhang Hongjiang.Video segmentation with the support of audio segmentation and classification[C]//Proceedings of ICME' 2000-IEEE International Conference on Multimedia and Expo.New York:Institute of Electrical and Electronics Engineers Inc,2000:1 507-1 510.
2Xu M,Maddage N,Xu C,et al.Creating audio keywords for event detection in soccer video[C]//Proceeding of IEEE International Conference on Multimedia and Expo.Baltimore:IEEE Computer Society,2003:281-284.
3Jasinschi R S,Louie J.Automatic TV program genre classification based on audio patterns[C]//Proceeding of the 27th EUROMICRO Conference.Warsaw:IEEE Computer Society,2001:370-375.
4Menaka R,Lonce W.Generic audio classification using a hybrid model based on GMMs and HMMs[C]//Proceedings of the 11th International Conference of Multimedia Modelling.Washington D C:IEEE Computer Society,2005:53-58.
5白亮,老松杨,陈剑赟,吴玲达.音频自动分类中的特征分析和抽取[J].小型微型计算机系统,2005,26(11):2029-2034. 被引量：13
6Lefevre S,Maillard B.Vincent N.3 classes segmentation for analysis of football audio sequences[C]//IEEE International Conference on Digital Signal Processing.Santorini:RFAI Publication,2002:975-978.
7MPEG Audio Group.ISO/IEC 15938-4,Multimedia content description interface-part 4:audio[S].Singapore:ISO/IEC,2001.
8Richard O D,Peter E H,David G S.Pattern classification[M].2nd Edition.New York:John Wiley & Sons,2001.

二级参考文献1

1卢坚,陈毅松,孙正兴,张福炎.语音/音乐自动分类中的特征分析[J].计算机辅助设计与图形学学报,2002,14(3):233-237. 被引量：26

共引文献12

1杨圣云,袁德辉,赖国明.基于串核的音乐风格聚类[J].计算机工程与设计,2008,29(3):687-689.
2朱映映,明仲,周景洲.一种面向基于内容视频检索的音频场景分割方法[J].小型微型计算机系统,2008,29(3):557-562.
3史东承,韩玲艳,于明会.基于HMM/SVM的音频自动分类[J].长春工业大学学报,2008,29(2):178-182. 被引量：9
4杨圣云,赖国明,袁德辉.基于串核的音乐分类研究[J].计算机工程与应用,2008,44(16):243-245. 被引量：1
5张小梅,杨鼎才.基于支持向量机模型的环境音分类研究[J].电子测量技术,2008,31(9):121-123. 被引量：4
6李志忠,滕光辉.基于改进MFCC的家禽发声特征提取方法[J].农业工程学报,2008,24(11):202-205. 被引量：24
7张新彩,张德同,耿国华,王小凤,吴江.基于PCA和CHMM的音频自动分类[J].计算机应用研究,2009,26(4):1257-1259. 被引量：4
8朱双华,金鑫,朱立新.大词汇量连续语音声像情报处理系统框架[J].指挥信息系统与技术,2012,3(1):20-24. 被引量：2
9王晓峰,蒋先涛.基于APR-SVM的音频分类方法[J].计算机技术与发展,2012,22(10):59-61.
10李颜汐.基于情感特征的背景音乐分类方法[J].现代电子技术,2017,40(15):115-118. 被引量：5

同被引文献6

1齐俊英,孙劲光,高爱东.基于内容的音频自动分类方法[J].辽宁工程技术大学学报（自然科学版）,2005,24(z1):170-172. 被引量：5
2吕萍,颜永红.广播新闻语料识别中的自动分段和分类算法[J].电子与信息学报,2006,28(12):2292-2295. 被引量：2
3张一彬,周杰,边肇祺,郭军.基于内容的音频与音乐分析综述[J].计算机学报,2007,30(5):712-728. 被引量：18
4郑怡文.典型的音频分类算法[J].计算机与现代化,2007(8):59-63. 被引量：3
5贾兰兰,冯小平.一种稳健的语音/音乐分类法[J].电声技术,2009,33(1):55-57. 被引量：3
6卢坚,陈毅松,孙正兴,张福炎.语音/音乐自动分类中的特征分析[J].计算机辅助设计与图形学学报,2002,14(3):233-237. 被引量：26

引证文献1

1容宝华.基于最小距离的音频分类方法的研究[J].电声技术,2012,36(11):46-51. 被引量：3

二级引证文献3

1辛欣,陈曙东,仝明磊,胡文皓,刘陈伟,葛浩栋.采用潜在概率语义模型和K近邻分类器的音频分类算法[J].华侨大学学报（自然科学版）,2016,37(2):196-200. 被引量：1
2陈琼,张守劲.基于多媒体混声效果的音频扩声系统研究分析[J].广播电视信息,2017,0(4):35-37. 被引量：1
3孙慧芳,龙华,邵玉斌,杜庆治.基于过零率及频谱的语音音乐分类算法[J].云南大学学报（自然科学版）,2019,0(5):925-931. 被引量：19

1陆阳,杨文泉,陈蕾.MEPG视频图像版权保护方法的研究[J].计算机工程,2003,29(6):67-68.
2李隆.三诺第Ⅱ代独立功放音响iFi-725新品亮相[J].电脑爱好者,2010(13):100-100.
3Jon,Wallace,李昂(BI7LNQ).“哨音”接收机[J].电子制作,2012(6):14-16.
4友达展出14英寸全高清有机EL面板[J].光电技术,2010(1):36-36.
5西铁城电子改进高输出功率白色LED[J].稀土信息,2006,12(3):38-38.
6三诺 iFi601[J].日用电器,2006(3):20-20.
7李冬梅.多媒体应用中的视觉信息描述与压缩技术[J].现代电视技术,2001(8):31-46. 被引量：3
8孙凌.比的后项可以是“0”吗？[J].开心学数学（小学版）,2009(11):9-9.
9洪磊,熊凡.竞赛与科技的第四次亲密接触[J].IT经理世界,2014,0(13):48-50.
10潘杉.《豪门盛宴》虚拟解说员Mr.Goal诞生记——用非技术手段打造文化创意精品[J].现代电视技术,2014(8):22-26.

华中科技大学学报（自然科学版）

2007年第10期

浏览历史

内容加载中请稍等...

足球比赛中的音频信息提取与自动分类被引量：1

参考文献8

二级参考文献1

共引文献12

同被引文献6

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

足球比赛中的音频信息提取与自动分类 被引量：1

参考文献8

二级参考文献1

共引文献12

同被引文献6

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

足球比赛中的音频信息提取与自动分类被引量：1