基于宽度学习方法的多模态信息融合被引量：19

Multi-modal information fusion based on broad learning method

下载PDF

导出

摘要多模态机器学习通过有效学习各个模态的丰富特征来解决不同模态数据的融合问题。考虑到模态间的差异性,基于宽度学习方法提出了一个能够学习和融合两种模态特征的框架,首先利用宽度学习方法分别提取不同模态的抽象特征,然后将高维特征表示在同一个特征空间进行相关性学习,并通过非线性融合得到最后的特征表达,输入分类器进行目标识别。相关实验建立在康奈尔大学抓取数据集和华盛顿大学RGB-D数据集上,实验结果验证了相比于传统的融合方法,所提出的方法具有更好的稳定性和快速性。 Multi-modal machine learning solves the fusion problem that arises in data with different modalites by effectively learning their rich characteristics.Considering the differences between various modalities,we propose a framework that can learn and fuse two kinds of modal characteristics based on the broad learning method.This method first extracts different abstract characteristics,then represents the high-dimension features in the same space to determine their correlation.We obtain a final representation of these characteristics by nonlinear fusion and inputs these characteristics into a classifier for target recognition.Relevant experiments are conducted on the Cornell Grasping Dataset and the Washington RGB-D Object Dataset,and our experimental results confirm that,compared with traditional fusion methods,the proposed algorithm has greater stability and rapidity.

作者贾晨刘华平续欣莹孙富春 JIA Chen;LIU Huaping;XU Xinying;SUN Fuchun(College of Electrical and Power Engineering,Taiyuan University of Technology,Taiyuan 030600,China;Department of Computer Science and Technology,Tsinghua University,Beijing 100084,China;State Key Laboratory of Intelligent Technology and Systems,Tsinghua University,Beijing 100084,China)

机构地区太原理工大学电气与动力工程学院清华大学计算机科学与技术系清华大学智能技术与系统国家重点实验室

出处《智能系统学报》 CSCD 北大核心 2019年第1期150-157,共8页 CAAI Transactions on Intelligent Systems

基金国家自然科学基金项目(61673238) 国家高技术研究发展计划课题(2015AA042306) 山西省回国留学人员科研资助项目(2015-045 2016-044)

关键词宽度学习方法多模态融合相关性分析特征提取非线性变换目标识别神经网络 RGB-D图像分类 broad learning method multi-modal fusion correlation analysis feature extraction nonlinear transformation object recognition neural networks RGB-D images classification

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1雷俊,王立辉,何芸倩,张智.适用于机器人视觉的图像分割方法[J].系统工程与电子技术,2017,39(7):1653-1659. 被引量：10
2毛玉仁,郭松,郑阳明,林华.基于似物性判别的视觉目标检测方法[J].传感器与微系统,2017,36(11):147-150. 被引量：4
3齐静,徐坤,丁希仑.机器人视觉手势交互技术研究进展[J].机器人,2017,39(4):565-584. 被引量：28
4王成济,罗志明,钟准,李绍滋.一种多层特征融合的人脸检测方法[J].智能系统学报,2018,13(1):138-146. 被引量：8
5吴钟强,张耀文,商琳.基于语义特征的多视图情感分类方法[J].智能系统学报,2017,12(5):745-751. 被引量：4
6温有福,贾彩燕,陈智能.一种多模态融合的网络视频相关性度量方法[J].智能系统学报,2016,11(3):359-365. 被引量：6
7吴宗胜,傅卫平,韩改宁.基于深度卷积神经网络的道路场景理解[J].计算机工程与应用,2017,53(22):8-15. 被引量：11
8吴宗胜,傅卫平.移动机器人全局路径规划的模拟退火-教与学优化算法[J].机械科学与技术,2016,35(5):678-685. 被引量：8
9张文,刘勇,张超凡,张龙,夏营威.基于方向A~*算法的温室机器人实时路径规划[J].农业机械学报,2017,48(7):22-28. 被引量：29
10张文,刘勇,张超凡,张龙,夏营威.基于语义建图的室内机器人实时场景分类[J].传感器与微系统,2017,36(8):18-21. 被引量：3

二级参考文献55

1李瑞峰,贾建军.一种复杂背景下的手势提取方法[J].华中科技大学学报（自然科学版）,2008,36(S1):186-188. 被引量：6
2林开颜,吴军辉,徐立鸿.彩色图像分割方法综述[J].中国图象图形学报（A辑）,2005,10(1):1-10. 被引量：322
3朱庆保,张玉兰.基于栅格法的机器人路径规划蚁群算法[J].机器人,2005,27(2):132-136. 被引量：123
4孙波,陈卫东,席裕庚.基于粒子群优化算法的移动机器人全局路径规划[J].控制与决策,2005,20(9):1052-1055. 被引量：79
5张建英,赵志萍,刘暾.基于人工势场法的机器人路径规划[J].哈尔滨工业大学学报,2006,38(8):1306-1309. 被引量：83
6ZHU Weiyu, TOKLU C, LIOU S P. Automatic news video segmentation and categorization based on closed-captioned text[C]//Proceedings of IEEE International Conference on Multimedia and Expo. Tokyo, Japan, 2001: 829-832.
7BREZEALE D, COOK D J. Using closed captions and visu- al features to classify movies by genre [ C ]//Poster Session of the Seventh International Workshop on Multimedia Data Mining. Philadelphia, Pennsylvania, USA, 2006.
8SCHMIEDEKE S, KELM P, SIKORA T. TUB @ MediaE- val 2011 genre tagging task : prediction using bag-of-( visu- al)-words approaches [ C]//Working Notes Proceedings of the MediaEval 2011 Workshop. Pisa, Italy, 2011: 1-2.
9LAW-TO J, CHEN Li, JOLY A, et al. Video copy detec- tion : a comparative study[ C]//Proceedings of the 6th ACM International Conference on Image and Video Retrieval. New York, NY, USA, 2007: 371-375.
10WU Xiao, HAUPTMANN A G, NGO C W. Practical elimi- nation of near-duplicates from web video search [ C ]//Pro- ceedings of the 15th ACM International Conference on Mul- timedia. New York, NY, USA, 2007: 215-227.

共引文献99

1周鹏,万勇,孙伟峰,李立刚,戴永寿.高校餐厅食品加工违规行为视频分析算法与系统设计[J].食品安全质量检测学报,2018,9(23):6320-6326.
2徐红运,徐小力,左云波,吴国新.复杂背景下的风力机组叶片图像分割方法研究[J].电子测量技术,2018,41(22):60-65. 被引量：5
3王文发,许淳,尹斌斌,杜智杰.基于改进混合蛙跳算法的动态环境路径规划[J].吉林大学学报（理学版）,2016,54(4):857-861. 被引量：8
4胡雨霞,胡嘉浩.基于智能视觉导航的盲人指路设备设计[J].现代电子技术,2017,40(16):76-78. 被引量：4
5戈广双,李子龙,杨凯,马瑞鑫.基于激光扫描测距的机器人粒子滤波定位技术研究[J].传感器与微系统,2017,36(12):36-39. 被引量：3
6张连滨,葛浙东,刘传泽,曹正彬,周玉成.杆状物攀爬机器人关键技术综述[J].计算机测量与控制,2018,26(1):1-5. 被引量：8
7杨国亮,康乐乐,朱松伟,许楠.基于TLBO算法优化的球磨机FBEL控制方案研究[J].江西理工大学学报,2018,39(1):80-86. 被引量：2
8王琳,刘强.基于局部特H2征的多目标图像分割算法[J].激光与光电子学进展,2018,55(6):103-110. 被引量：17
9高净植,刘祎,张权,桂志国.改进深度残差卷积神经网络的LDCT图像估计[J].计算机工程与应用,2018,54(16):203-210. 被引量：6
10温晓红,刘华平,阎高伟,孙富春.基于超限学习机的非线性典型相关分析及应用[J].智能系统学报,2018,13(4):633-639. 被引量：2

同被引文献152

1张钹.人工智能进入后深度学习时代[J].智能科学与技术学报,2019,0(1):4-6. 被引量：42
2郑南宁.人工智能新时代[J].智能科学与技术学报,2019,0(1):1-3. 被引量：62
3卢艳军,陈雨荻,张晓东,张太宁.基于扩展Kalman滤波的姿态信息融合方法研究[J].仪器仪表学报,2020,41(9):281-288. 被引量：39
4谈咏东,王永雄,陈姝意,缪银龙.(2+1)D多时空信息融合模型及在行为识别的应用[J].信息与控制,2019,48(6):715-722. 被引量：3
5陈志军,吴超仲,吕能超,马杰.基于改进三次Hermite插值的车辆时空轨迹重构研究[J].交通信息与安全,2013,31(6):43-46. 被引量：10
6王兆礼,陈晓宏,刘德地,李晓华.基于BP神经网络的多年平均降雨量插值方法[J].中国农村水利水电,2007(1):57-61. 被引量：5
7张旭臣.分段三次Hermite插值在水文上的应用[J].南水北调与水利科技,2009,7(5):92-94. 被引量：9
8王爱平,万国伟,程志全,李思昆.支持在线学习的增量式极端随机森林分类器[J].软件学报,2011,22(9):2059-2074. 被引量：56
9郑新录,端木学光,郝志原,李征宇,韩子扬.基于web的房地产行业信息检索系统[J].硅谷,2011,4(20):174-175. 被引量：2
10杨小军,肖英杰,冯宏祥.航道关键段动态通航饱和度模型及其应用[J].上海海事大学学报,2012,33(1):37-40. 被引量：6

引证文献19

1尹忠东,涂菁菁,徐永海.基于宽度学习的风光容量配置研究[J].电测与仪表,2019,56(13):45-50. 被引量：3
2糜小夫.基于密码学的网络多模态信息动态加密系统设计[J].现代电子技术,2020,43(4):51-53. 被引量：5
3王涛,武淑红,王耀力.基于半监督宽度学习系统的气温空间插值[J].科学技术与工程,2020,20(2):630-636. 被引量：3
4周晨怡,黄靖,杨丰,刘娅琴.利用特征距离信息引导决策融合的多模态生物特征识别方法[J].科学技术与工程,2020,20(10):4036-4042. 被引量：3
5王召新,续欣莹,刘华平,孙富春.基于级联宽度学习的多模态材质识别[J].智能系统学报,2020,15(4):787-794. 被引量：4
6原旭,韩雪姣,陈志奎,钟芳明,赵亮.多模态特征融合的裁判文书推荐方法[J].微电子学与计算机,2020,37(12):42-47. 被引量：4
7苏家懿,崔博文.基于PCA-BLS的逆变器故障诊断[J].集美大学学报（自然科学版）,2021,26(2):168-173. 被引量：1
8冯瑞芳,易晓园.城市园林景观设计过程模块化信息融合模型[J].计算机仿真,2021,38(5):163-167. 被引量：2
9熊亿民.多模态神经网络的网络舆情大数据特征识别[J].信息技术,2021,45(6):114-119. 被引量：1
10任长娥,袁超,孙彦丽,刘竹琳,陈俊龙.宽度学习系统研究进展[J].计算机应用研究,2021,38(8):2258-2267. 被引量：13

二级引证文献50

1周楠,徐潇源,严正,陆建宇,李亚平.基于宽度学习系统的光伏发电功率超短期预测[J].电力系统自动化,2021,45(1):55-64. 被引量：33
2周勇,刘俊杰,刘刚,张建平,付俊.从运维角度探讨网络加密设备部署方式[J].信息技术与信息化,2021(4):177-180. 被引量：1
3任长娥,袁超,孙彦丽,刘竹琳,陈俊龙.宽度学习系统研究进展[J].计算机应用研究,2021,38(8):2258-2267. 被引量：13
4刘政,陈晨,张赛.基于ATML的舰艇装备多状态测试系统设计[J].计算机测量与控制,2021,29(10):139-143. 被引量：1
5李小敏,陈英.基于分数层融合的多生物特征融合识别[J].长江信息通信,2021,34(10):7-11. 被引量：1
6王世辉,祝永新,汪辉,郑小盈.融合运动轨迹特征的多模态群体行为识别方法[J].微电子学与计算机,2021,38(11):7-13. 被引量：2
7韩飞,张葛祥.基于超混沌系统的网络用户隐私信息加密仿真[J].计算机仿真,2021,38(12):295-298. 被引量：7
8王萌铎,续欣莹,阎高伟,史丽娟,郭磊.基于AdaBoost集成加权宽度学习系统的不平衡数据分类[J].计算机工程,2022,48(4):99-105. 被引量：7
9袁单飞,陈慈发,董方敏.基于多尺度分割的图像识别残差网络研究[J].计算机工程,2022,48(5):258-262. 被引量：5
10郭宏宇,霍志红,许昌,吾买尔·吐尔逊,周华建,程志明.风电机组故障的宽度学习诊断模型[J].可再生能源,2022,40(5):634-638. 被引量：4

1周永丽.“人工智能”时代高职财务会计与管理会计课程融合探讨[J].课程教育研究,2018(46):223-224. 被引量：1
2季孟雪,张海,杨絮.教育数据挖掘与学习分析未来发展趋势[J].中国信息技术教育,2019(2):103-105.
3阿里巴巴发布AliOS2.0系统[J].智能制造,2018,0(9):8-8.
4张卫东,路皓翔,甘博瑞,杨辉华.基于栈式自编码融合极限学习机的药品鉴别[J].计算机工程与设计,2019,40(2):545-549. 被引量：3
5金磊.高动态环境下载波频率的精确估计算法[J].航天控制,2018,36(6):47-52. 被引量：3
6徐正梅,王慧玲,韦良芬.基于多模态信息融合的图像显著性检测算法研究[J].韶关学院学报,2018,39(12):13-17. 被引量：2
7赵勇飞,王宇,周义凯,袁燕.基于DBN的多模态音乐情感分类研究[J].信息技术,2019,43(2):102-106. 被引量：10
8李忻,汪旭,孟庆妍,朱昆.屑止康胶囊质量控制方法研究[J].特产研究,2019,41(1):65-67.
9阮一峰.穷忙的人生[J].法制博览（名家讲坛、经典杂文）,2019,0(2):40-41.
10王若瑜.基于Resnet-50的智能驾驶红绿灯分类研究[J].电子测试,2019,30(3):143-145. 被引量：5

智能系统学报

2019年第1期

浏览历史

内容加载中请稍等...

基于宽度学习方法的多模态信息融合被引量：19

参考文献10

二级参考文献55

共引文献99

同被引文献152

引证文献19

二级引证文献50

相关作者

相关机构

相关主题

浏览历史

基于宽度学习方法的多模态信息融合 被引量：19

参考文献10

二级参考文献55

共引文献99

同被引文献152

引证文献19

二级引证文献50

相关作者

相关机构

相关主题

浏览历史

基于宽度学习方法的多模态信息融合被引量：19