一种层次级联融合的视频目标分割方法

A Video Object Segmentation Method Based on Layer Cascade and Fusion

下载PDF

导出

摘要文章主要研究半监督视频目标分割任务,输入一个完整视频及首帧的像素级标注(掩膜),使用端到端的深度神经网络模型来预测后续帧的掩膜。该模型使用残差卷积网络进行深度特征提取,通过层次级联模块实现各层次不同分辨率特征的交互融合,以此捕捉不同尺寸的目标,并通过尺度融合模块处理视频帧的细节和语义信息,生成像素级分类标注。在主流视频数据集上的实验结果表明,该模型具有优秀的预测分割能力和令人满意的运行速度,其各项测试指标均达到该领域的先进水平。 This paper mainly studies the task of semi-supervised video object segmentation,which takes a complete video and the pixel-level annotation(mask)of the first frame as input,and then an end-to-end deep neural network model will predict the mask of following frames.The model uses residual convolution network for deep feature extraction and in order to capture targets of different sizes,the layer cascade module is designed for features interaction and fusion of different resolutions at each layer,and the scale fusion module processes the details and semantic information of video frames and generate the pixel-level classification label.Experimental results on mainstream video datasets show that the model has excellent segmentation capabilities and satisfactory computing rate,and its various test indicators have reached the advanced level in this field.

作者李家盛 LI Jia-sheng(Department of Computer Science and Technology,Hangzhou Dianzi University,Hangzhou 310018,China)

机构地区杭州电子科技大学计算机学院

出处《电脑与信息技术》 2022年第1期21-23,27,共4页 Computer and Information Technology

关键词视频处理视频目标分割神经网络 video processing video object segmentation neural network

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1781

二级参考文献8

1余凯,贾磊,陈雨强,徐伟.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804. 被引量：614
2刘建伟,刘媛,罗雄麟.玻尔兹曼机研究进展[J].计算机研究与发展,2014,51(1):1-16. 被引量：71
3金林鹏,董军.面向临床心电图分析的深层学习算法[J].中国科学：信息科学,2015,45(3):398-416. 被引量：37
4Yi ZHENG,QiLIU,Enhong CHEN,Yong GE,J. Leon ZHAO.Exploiting multi-channels deep convolutional neural networks for multivariate time series classification[J].Frontiers of Computer Science,2016,10(1):96-112. 被引量：22
5高君宇,杨小汕,张天柱,徐常胜.基于深度学习的鲁棒性视觉跟踪方法[J].计算机学报,2016,39(7):1419-1434. 被引量：30
6李红,刘芳,杨淑媛,张凯.基于深度支撑值学习网络的遥感图像融合[J].计算机学报,2016,39(8):1583-1596. 被引量：40
7常亮,邓小明,周明全,武仲科,袁野,杨硕,王宏安.图像理解中的卷积神经网络[J].自动化学报,2016,42(9):1300-1312. 被引量：428
8周飞燕,金林鹏,董军.基于集成学习的室性早博识别方法[J].电子学报,2017,45(2):501-507. 被引量：8

共引文献1780

1陆文超,崔海朋.一种基于融合自编码与神经网络的协同过滤算法[J].中国水运（下半月）,2022,22(3):18-20.
2杜佳峰,王景松,杨宝军,薛勇新,郑春华.基于卷积神经网络的船舶水尺字符识别方法研究[J].中国水运（下半月）,2020(3):1-3. 被引量：1
3陆天和,刘莉,贺云涛,杨盾.多无人机航迹规划算法及关键技术[J].战术导弹技术,2020(1):85-90. 被引量：7
4林桢哲,王桂棠,陈建强,符秦沈.基于残差网络深度学习的肺部CT图像结节良恶性分类模型[J].仪器仪表学报,2020,41(3):248-256. 被引量：22
5陈仁祥,张勇,杨黎霞,陈才,徐向阳.基于整周期数据和卷积神经网络的谐波减速器健康状态评估[J].仪器仪表学报,2020,41(2):245-252. 被引量：20
6鲍光海,林善银,徐林森.基于改进型卷积网络的汽车高度调节器缺陷检测方法[J].仪器仪表学报,2020,41(2):157-165. 被引量：13
7谭宇辰,蔡晶晶,倪辰.基于深度学习的Web攻击检测技术研究[J].信息网络安全,2020(S02):122-126.
8任杰,李钢,赵燕姣,姚琼辛,田培辰.基于改进Faster RCNN的城市道路货车检测[J].计算机系统应用,2022,31(12):316-321. 被引量：3
9胡伟,文武,魏敏.改进U-Net的高分辨率遥感图像轻量化分割[J].计算机系统应用,2022,31(12):135-146. 被引量：2
10孙守强,李青青,肖舒玥,曾子明.基于情景感知的叙事型壁画场景式移动视觉搜索模型研究[J].数据分析与知识发现,2024,8(8):52-62.

1陈哲轩,黄汉山,陈筠婷.基于生态优先的微观尺度国土空间双评价体系探索——以中国—马来西亚钦州产业园为例[J].广西城镇建设,2021(12):28-32. 被引量：3
2芮佳明.因材施教分层教学——新课标下高中数学分层教学研究[J].数学学习与研究,2021(33):83-85. 被引量：3
3周琳.基于小班幼儿年龄特点的区域活动材料投放[J].当代家庭教育,2021(28):57-58.
4赵桂杰.中学数学“分层教学分类指导”教学实验探索[J].今天,2021(10):137-137.
5金娟.初中音乐课堂教学中应用节奏训练的研究[J].今天,2021(9):325-325.
6江永红,黎进东.互联网对家庭贫困的影响效应分析[J].安徽农业大学学报（社会科学版）,2021,30(6):8-15. 被引量：1
7李全辉,刘丹.基于随机森林的故意杀人案件犯罪侧写研究[J].法制与经济,2021(6):6-10. 被引量：1
8马志民,崔萍,白伟娜.成人Epstein-Barr病毒感染患者的EB病毒相关抗体、DNA及淋巴细胞亚群变化分析[J].医药前沿,2021,11(36):8-10.

电脑与信息技术

2022年第1期

浏览历史

内容加载中请稍等...

一种层次级联融合的视频目标分割方法

参考文献1

二级参考文献8

共引文献1780

相关作者

相关机构

相关主题

浏览历史