基于注意力胶囊网络的家庭活动识别被引量：7

Domestic Activity Recognition Based on Attention Capsule Network

下载PDF

导出

摘要本文提出了一种注意力胶囊网络的新框架利用录音识别家庭活动.胶囊网络可以通过动态路由算法来选择基于每个声音事件的代表性频带.为了进一步提高其能力,我们在胶囊网络中加入注意力机制,它通过加权来增加对重要时间帧的关注.为了评估我们的方法,我们在声学场景和事件的检测和分类(Detection and Classification of Acoustic Scenes and Events, DCASE)2018挑战任务5数据集上进行测试.结果表明, F1平均得分可达92.1%,优于几个基线方法的F1得分. In this paper, a novel framework of attention capsule network is proposed, which uses sound recordings to identify domestic activities. The capsule network can select a representative frequency band based on each sound event by the dynamic routing algorithm. To further improve its ability, we add attention mechanism to the capsule network. It can increase the focus on significant time frames by weighting. To evaluate our approach, we test it on the dataset of task 5 of the Detection and Classification of Acoustic Scenes and Events(DCASE) 2018 Challenge. The results show that the average F1 score can reach92.1 %, outperforming several baselines.

作者王金甲纪绍男崔琳夏静杨倩 WANG Jin-Jia;JI Shao-Nan;CUI Lin;XIA Jing;YANG Qian(School of Information Science and Engineering,Yanshan Univer-sity,Qinhuangdao 066004;Hebei Key Laboratory of Information Transmission and Signal Processing,Qinhuangdao 066004)

机构地区燕山大学信息科学与工程学院河北省信息传输与信号处理重点实验室

出处《自动化学报》 EI CSCD 北大核心 2019年第11期2199-2204,共6页 Acta Automatica Sinica

基金国家自然科学基金(61473339) 首批“河北省青年拔尖人才”项目([2013]17) 京津冀基础研究合作专项(F2019203583)资助~~

关键词 DCASE 2018挑战声音事件分类家庭活动识别胶囊网络注意力 DCASE 2018 challenge sound event classification domestic activity recognition capsule network attention

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献1

1朱煜,赵江坤,王逸宁,郑兵兵.基于深度学习的人体行为识别算法综述[J].自动化学报,2016,42(6):848-857. 被引量：129

二级参考文献51

1Fujiyoshi H, Lipton A J, Kanade T. Real-time human mo- tion analysis by image skeletonization. IEICE Transactions on Information and Systems, 2004, 87-D(1): 113-120.
2Chaudhry R, Ravichandran A, Hager G, Vidal R. His- tograms of oriented optical flow and Binet-Cauchy kernels on nonlinear dynamical systems for the recognition of hu- man actions. In: Proceedings of the 2009 IEEE Conference on Computer Vision and Pattern Recognition. Miami, FL: IEEE, 2009. 1932-1939.
3Dalal N, Triggs B. Histograms of oriented gradients for human detection. In: Proceedings of the 2005 IEEE Con- ference on Computer Vision and Pattern Recognition. San Diego, CA, USA: IEEE, 2005. 886-893.
4Lowe D G. Object recognition from local scale-invariant fea- tures. In: Proceedings of the 7th IEEE International Confer- ence on Computer Vision. Kerkyra: IEEE, 1999. 1150-1157.
5Schuldt C, Laptev I, Caputo B. Recognizing human actions: a local SVM approach. In: Proceedings of the 17th In- ternational Conference on Pattern Recognition. Cambridge: IEEE, 2004. 32-36.
6Dollar P, Rabaud V, Cottrell G, Belongie S. Behavior recog- nition via sparse spatio-temporal features. In: Proceedings of the 2005 IEEE International Workshop on Visual Surveil- lance and Performance Evaluation of Tracking and Surveil- lance. Beijing, China: IEEE, 2005.65-72.
7Rapantzikos K, Avrithis Y, Kollias S. Dense saliency-based spatiotemporal feature points for action recognition. In: Proceedings of the 2009 IEEE Conference on Computer Vision and Pattern Recognition. Miami, FL: IEEE, 2009. 1454-1461.
8Knopp J, Prasad M, Willems G, Timofte R, Van Gool L. Hough transform and 3D SURF for robust three dimensional classification. In: Proceedings of the llth European Confer- ence on Computer Vision (ECCV 2010). Berlin Heidelberg: Springer. 2010. 589-602.
9Klaser A, Marszaeek M, Schmid C. A spatio-temporal de- scriptor based on 3D-gradients. In: Proceedings of the 19th British Machine Vision Conference. Leeds: BMVA Press, 2008. 99.1-99.10.
10Wang H, Ullah M M, Klaser A, Laptev I, Schmid C. Evalua- tion of local spatio-temporal features for action recognition. In: Proceedings of the 2009 British Machine Vision Confer- ence. London, UK: BMVA Press, 2009. 124.1-124.11.

共引文献128

1建中华,南静,刘鑫,代伟.基于时空张量融合的人体骨架行为自适应识别方法[J].仪器仪表学报,2023,44(6):74-85.
2谈咏东,王永雄,陈姝意,缪银龙.(2+1)D多时空信息融合模型及在行为识别的应用[J].信息与控制,2019,48(6):715-722. 被引量：3
3贾双成,杨凤萍.基于神经网络的人体动态行为智能识别方法[J].科技通报,2020(1):60-63. 被引量：1
4柴晋,乔加飞,孙灏,梁占伟,张千.神经网络算法在脱硫系统优化中的应用进展[J].洁净煤技术,2021,27(S02):27-32. 被引量：3
5王明松,秦永佩,张鑫鑫.基于TensorFlow的动作行为识别原理与实践[J].电子技术（上海）,2021,50(4):112-113. 被引量：1
6吴松平,王天一.基于神经网络和迁移学习的视频人体行为识别[J].智能计算机与应用,2021,11(12):153-157. 被引量：4
7王鹏.氦氖激光照射耳穴治疗冠心病30例[J].中华理疗杂志,2000,23(2):119-120.
8杨观赐,杨静,苏志东,陈占杰.改进的YOLO特征提取算法及其在服务机器人隐私情境检测中的应用[J].自动化学报,2018,44(12):2238-2249. 被引量：21
9陈友东,刘嘉蕾,胡澜晓.人机协作中人的动作终点预测[J].北京航空航天大学学报,2019,45(1):35-43. 被引量：3
10毕晓君,冯雪赟.结合CNN的人体行为识别特征特取模型的改进[J].黑龙江科技信息,2017(4):79-81. 被引量：1

同被引文献42

1李萌,陆爽,陈岱民.基于小波神经网络的滚动轴承智能故障诊断系统[J].仪器仪表学报,2005,26(z1):609-610. 被引量：11
2洪佳明,陈炳超,印鉴.一种结合半监督Boosting方法的迁移学习算法[J].小型微型计算机系统,2011,32(11):2169-2173. 被引量：4
3陈炳超,洪佳明,印鉴.基于迁移学习的图分类[J].小型微型计算机系统,2011,32(12):2379-2382. 被引量：4
4张涛,杨剑,宋文爱,宋超峰.关于改进的激活函数TReLU的研究[J].小型微型计算机系统,2019,40(1):58-63. 被引量：9
5庄福振,罗平,何清,史忠植.迁移学习研究进展[J].软件学报,2015,26(1):26-39. 被引量：450
6刘重晋,王瀚,封举富.基于Gabor相位和图像质量评价的高分辨率掌纹细节点提取算法[J].北京大学学报（自然科学版）,2015,51(3):384-390. 被引量：2
7王伟,韩纪庆,郑铁然,郑贵滨,陶耀.基于Fisher判别字典学习的说话人识别[J].电子与信息学报,2016,38(2):367-372. 被引量：6
8曾毅,刘成林,谭铁牛.类脑智能研究的回顾与展望[J].计算机学报,2016,39(1):212-222. 被引量：121
9金小强,李新民,陈焕,张先辉.基于神经网络的直升机自动倾斜器轴承故障诊断方法[J].南京航空航天大学学报,2016,48(2):230-237. 被引量：12
10袁建虎,韩涛,唐建,安立周.基于小波时频图和CNN的滚动轴承智能故障诊断方法[J].机械设计与研究,2017,33(2):93-97. 被引量：91

引证文献7

1朱佳丽,宋燕.基于迁移学习的注意力胶囊网络[J].智能计算机与应用,2021,11(2):44-49. 被引量：1
2韩广,卜桐,王明明,郑海青,孙晓云,金龙.基于双通道双向长短时记忆网络的铁路行车事故文本分类[J].铁道学报,2021,43(9):71-79. 被引量：3
3杨立东,胡江涛.多优化机制下深度神经网络的音频场景识别[J].信号处理,2021,37(10):1969-1976. 被引量：1
4陈晨,韩纪庆,陈德运,何勇军.文本无关说话人识别中句级特征提取方法研究综述[J].自动化学报,2022,48(3):664-688. 被引量：3
5吴碧巧,王天一.基于注意力胶囊网络的高分辨率掌纹图像识别[J].计算机仿真,2022,39(9):234-238.
6瞿红春,朱伟华,高鹏宇,王超,周大鹏,丁凯.基于注意力循环胶囊网络的滚动轴承故障诊断[J].振动．测试与诊断,2022,42(6):1108-1114. 被引量：4
7杨立东,赵飞焱.基于并行胶囊网络的声学场景分类[J].传感器与微系统,2023,42(12):155-159.

二级引证文献12

1张博旭.铁路事故灰色关联分析[J].中国安全科学学报,2022,32(S02):60-63.
2林海香,赵正祥,陆人杰,卢冉,白万胜,胡娜娜.基于字词融合的高铁道岔多级故障诊断组合模型[J].电子测量与仪器学报,2022,36(10):217-226. 被引量：1
3尚麟宇,尹明,肖畅,程君.基于BLS的铁路安全事件文本分类研究[J].中国安全科学学报,2022,32(6):103-108. 被引量：2
4王猛,张鹏远.融合多尺度特征的短时音频场景识别方法[J].声学学报,2022,47(6):717-726. 被引量：1
5张霞,刘乾,郭倩,梁新彦,钱宇华,畅江.强调信息传播和特征分布的说话人验证模型:EIPFD-ResNet[J].小型微型计算机系统,2023,44(3):463-470. 被引量：1
6孙海蓉,李帅.改进胶囊网络的小样本光伏热斑识别方法[J].中国测试,2023,49(2):106-112. 被引量：2
7席青云,孙同日,陶佰睿,杨文博,苗凤娟.PCA-VQ融合降维的SMO-SVM说话人识别研究[J].传感技术学报,2023,36(2):275-279.
8韩小棒,孙伦业.改进型深度残差网络在轴承故障诊断中的应用研究[J].佳木斯大学学报（自然科学版）,2023,41(3):75-80. 被引量：1
9李晋.一种结合帧级特征预测的多任务学习声纹确认方法[J].长江信息通信,2023,36(6):1-4.
10韩小棒,孙伦业.改进型深度残差网络在轴承故障诊断中的应用研究[J].萍乡学院学报,2023,40(3):22-27.

1张丽娅,殷惟.“太阳之子”的爱[J].辅导员,2019,0(24):46-47.
2独具特色的挪威传统[J].创新作文（小学3-4年级）,2019,0(11):40-41.
3曹阳,甄峰,姜玉培.基于活动视角的城市建成环境与居民健康关系研究框架[J].地理科学,2019,39(10):1612-1620. 被引量：23
4栾雨石.短视频带货不能靠“抖机灵”[J].记者观察（中）,2019,0(7):1-1.
5余传明,王峰,胡莎莎,安璐.基于生成对抗网络的跨语言文本情感分析[J].情报理论与实践,2019,42(11):135-141. 被引量：5
6曾品红.员工工作与生活平衡问题及应对策略[J].管理观察,2019,0(29):93-94. 被引量：3
7黄河,周步祥,张致强,刘治凡,袁岳,邹家惠.基于FBE算法的非侵入式事件检测方法[J].水电能源科学,2019,37(10):158-162.
8汇智资讯[J].智能城市,2019,5(22).
9社会工作服务剪影[J].中国社会工作,2019,0(31).
10谷义龙.一种超宽波束的宽带天线阵列设计[J].信息化研究,2019,45(5):52-56.

自动化学报

2019年第11期

浏览历史

内容加载中请稍等...

基于注意力胶囊网络的家庭活动识别被引量：7

参考文献1

二级参考文献51

共引文献128

同被引文献42

引证文献7

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

基于注意力胶囊网络的家庭活动识别 被引量：7

参考文献1

二级参考文献51

共引文献128

同被引文献42

引证文献7

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

基于注意力胶囊网络的家庭活动识别被引量：7