融合检测与跟踪的半自动视频目标标注被引量：1

Semi-automatic Video Target Annotation by Combining Detection and Tracking

下载PDF

导出

摘要针对视频图像连续帧间的目标具有冗余性,采用手动标注方式耗时耗力的问题,提出一种融合检测和跟踪算法的视频目标半自动标注框架。利用手动标注的样本离线训练改进YOLOv3模型,并将该检测模型作为在线标注的检测器。在线标注时在初始帧手动确定目标位置和标签,在后续帧根据检测框与跟踪框的IOU(Intersection-Over-Union)值自动确定目标的位置,并利用跟踪器的响应输出判断目标消失,从而自动停止当前目标标注。采用一种基于目标显著性的关键帧提取算法选择关键帧。采用自建舰船目标数据集进行了改进YOLOv3检测性能对比实验,并采用舰船视频序列验证了提出的视频目标半自动标注方法的有效性。实验结果表明,该方法可以显著提高标注效率,能够快速生成标注数据,适用于海上舰船等场景的视频目标标注任务。 Aiming at the problem that the target between consecutive frames is redundant in the video and manual annotation is time-consuming and laborious, a semi-automatic video target annotation framework by combining detection and tracking is proposed. First, manually annotated samples are used to train the improved YOLOv3 detection model offline and the detection model is used as an online annotation detector. Then during online annotation, the target position and label are determined manually in the first frame, target position is determined automatically according to the IOU(IntersectionOver-Union)of the detection box and the tracking box in the subsequent frame, and the response of the tracker is used to judge the target disappearance so that the current target annotation is stopped automatically. Finally, a key frame extraction algorithm based on the target saliency is used to select the key frames. The performance comparison experiment of the improved YOLOv3 is carried out by using the self-built ship target data set, and the effectiveness of the semi-automatic video target annotation method is verified by using a ship video sequence. Experimental results show that this method can improve the annotation efficiency and generate annotated data quickly, and it is suitable for video target annotation tasks in scenes such as sea-surface ships video.

作者陈庆林谷雨宋忠浩聂圣东 CHEN Qinglin;GU Yu;SONG Zhonghao;NIE Shengdong(College of Automation,Hangzhou Dianzi University,Hangzhou 310018,China)

机构地区杭州电子科技大学自动化学院

出处《计算机工程与应用》 CSCD 北大核心 2021年第14期223-230,共8页 Computer Engineering and Applications

基金国家自然科学基金面上项目(61771177)。

关键词视频图像目标标注目标检测目标跟踪关键帧提取 video image target annotation target detection target tracking key frames extraction

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1郭乔进,丁轶,李宁.基于关键词的图像标注综述[J].计算机工程与应用,2011,47(30):155-158. 被引量：5
2袁明新,张丽民,朱友帅,姜烽,申燚.基于深度学习方法的海上舰船目标检测[J].舰船科学技术,2019,41(1):111-115. 被引量：18
3于洋,李世杰,陈亮,刘韵婷.基于改进YOLO v2的船舶目标检测方法[J].计算机科学,2019,46(8):332-336. 被引量：27
4王炳德,杨柳涛.基于YOLOv3的船舶目标检测算法[J].中国航海,2020,43(1):67-72. 被引量：11
5郭乔进,周鹏飞,胡杰,梁中岩.基于目标跟踪的半自动图像标注样本生成方法[J].信息化研究,2015,41(5):23-27. 被引量：2
6蓝章礼,帅丹,李益才.基于相关系数的道路监控视频关键帧提取算法[J].重庆交通大学学报（自然科学版）,2016,35(1):129-133. 被引量：6
7刘华咏,郝会芬,李涛.基于视频聚类的关键帧提取算法[J].物联网技术,2014,4(8):59-61. 被引量：8
8仲梦洁,张艳彬.基于视觉显著性车辆监控视频关键帧提取方法[J].计算机技术与发展,2019,29(6):164-169. 被引量：7
9刘俊,姜涛,徐小康,田胜,李亚辉.基于轻量化深度网络的舰船目标识别技术研究[J].无线电工程,2019,49(12):1025-1030. 被引量：6

二级参考文献79

1方勇,戚飞虎.一种新的视频镜头边界检测及关键帧提取方法[J].华南理工大学学报（自然科学版）,2004,32(z1):18-23. 被引量：12
2王方石,须德,吴伟鑫.基于自适应阈值的自动提取关键帧的聚类算法[J].计算机研究与发展,2005,42(10):1752-1757. 被引量：32
3印勇,蒋海娜.优化初始聚类中心的关键帧提取[J].计算机工程与应用,2007,43(21):165-167. 被引量：6
4Makadia A, Pavlovic V, Kttmar S.A New Baseline for Image Annotation[C]//Proceedings of European Conference on Com- puter Vision, 2008,5304 .. 316-329.
5Boll S.Share It,reveal It,reuse It,and push multimedia into a new decade[J].IEEE Multimedia,2007,14(4) : 14-19.
6Tsai C,Hung C.Automatically annotating images with keywords: a review of image annotation systems[J].Recent Patents on Com- puter Science, 2008,1 ( 1 ) : 55-68.
7Hanbury A.A survey of methods for image annotation[J].Joumal of Visual Languages and Computing,2008,19(5):617-627.
8Hare J, Lewis P, Enser P, et al.Mind the gap: another look at the problem of the semantic gap in image retrieval[C]//Proeeedings of SPIE,2006,6073:75-86.
9Russell B C, Torralba A, Murphy K P, et al.Labelme: a database and web-based tool for image annotation[J].International Journal of Computer Vision, 2008,77:157-173.
10yon Ahn L, Dabbish L.Labeling images with a computer game[C]// Proceedings of the SIGCHI Conference on Human factors in Com- puting Systems, 2004: 319-326.

共引文献81

1桂力,徐顺,王华东,许宁,梁晓冬.基于视频监控的船舶跟踪与自动统计方法研究[J].中国水运（下半月）,2023(2):18-21.
2岳希,梁云浩,何磊.基于改进YOLO算法的船舰目标检测DT-YOLO方法研究[J].成都信息工程大学学报,2022,37(5):533-537.
3刘书先,张凯,张晓杰,王明辉,杨益.航空保障多目标应用深度学习混合平台[J].船舶工程,2021,43(S02):141-145.
4顾利红,朱品业.薄层扫描法测定穿心莲中穿心莲内酯、脱水穿心莲内酯的含量[J].中草药,2000,31(4):260-262. 被引量：29
5司若妍,张明.基于K-means聚类算法的视频关键帧提取的研究[J].现代计算机（中旬刊）,2016(7):59-63. 被引量：7
6曹洁,罗菊香,李晓旭.改进Corr-LDA的图像标注概率主题模型[J].小型微型计算机系统,2017,38(3):615-619. 被引量：4
7张惠玲,杨林玉,敖谷昌.信号交叉口延误参数获取综述[J].重庆交通大学学报（自然科学版）,2017,36(3):90-97. 被引量：9
8张莉.基于相机监控网络的车辆目标提取[J].信息技术,2018,42(5):99-105.
9仲梦洁,张艳彬.基于视觉显著性车辆监控视频关键帧提取方法[J].计算机技术与发展,2019,29(6):164-169. 被引量：7
10朱婷婷.基于深度学习的单步目标检测器特征增强算法[J].数字技术与应用,2019,37(6):132-132. 被引量：2

同被引文献14

1丁恩杰,刘忠育,刘亚峰,郁万里.基于多维度和多模态信息的视频描述方法[J].通信学报,2020,41(2):36-43. 被引量：8
2张航,卢小平,张晓强,路泽忠.面向矿山监管的无人机视频关键帧影像动态提取方法[J].遥感信息,2020,35(1):112-116. 被引量：11
3刘仁峰,黄诗瑶,聂勇鹏,徐胜勇.油菜角果数量及关键表型参数的自动化检测方法研究[J].中国油料作物学报,2020,42(1):71-77. 被引量：5
4贺凤,张洪博,杜吉祥,汪冠鸿.长短时记忆网络的自由体操视频自动描述方法[J].华侨大学学报（自然科学版）,2020,41(6):808-815. 被引量：2
5田颖,桂彦,熊达铭.动态外观模型和高阶能量的双边视频目标分割方法[J].计算机科学与探索,2020,14(12):2108-2121. 被引量：4
6王俊玲,卢新明.基于语义相关的视频关键帧提取算法[J].计算机工程与应用,2021,57(4):192-198. 被引量：5
7杨春雨,袁晓光.煤矿井下巷道变形巡检视频异常检测方法[J].工矿自动化,2021,47(2):13-17. 被引量：11
8叶海峰,赵玉琛.视觉位置识别中代表地点的标识牌算法[J].小型微型计算机系统,2021,42(4):823-828. 被引量：1
9陈贵强,何军,罗顺茺.基于改进CycleGAN的视频监控人脸超分辨率恢复算法[J].计算机应用研究,2021,38(10):3172-3176. 被引量：10
10李梦静,吉根林,赵斌.基于步行周期聚类的视频行人重识别关键帧提取算法[J].南京航空航天大学学报,2021,53(5):780-788. 被引量：6

引证文献1

1杨盼盼,马凌飞,平阳,索雅丽.移动AR+VR支持下跨媒体视频关键帧还原仿真[J].微型电脑应用,2024,40(3):32-36.

1支卫建.基于人脸识别和改进K-means的视频检索方法[J].电子元器件与信息技术,2021,5(3):124-125.
2韩宇,李君,谢义,何青尔.华能沁北电厂二期精处理再生程序异常分析及处理[J].河南电力,2019,47(S02):96-98.
3陈玮光,胡晓静,郑鑫,马兆兴,陈昊.基于改进遗传算法的变电站巡检机器人行驶轨迹优化[J].广东电力,2021,34(6):48-54. 被引量：13
4季成蹊.浅谈QR Code二维码在食品生产日期标注上的应用[J].食品工业,2021,42(5):307-311. 被引量：1
5陈张雷,李崇辉,郑勇,陈冰,何东汉.鱼眼星图中的水天线自动提取算法[J].测绘科学技术学报,2021,38(3):221-227. 被引量：1

计算机工程与应用

2021年第14期

浏览历史

内容加载中请稍等...

融合检测与跟踪的半自动视频目标标注被引量：1

参考文献9

二级参考文献79

共引文献81

同被引文献14

引证文献1

相关作者

相关机构

相关主题

浏览历史

融合检测与跟踪的半自动视频目标标注 被引量：1

参考文献9

二级参考文献79

共引文献81

同被引文献14

引证文献1

相关作者

相关机构

相关主题

浏览历史

融合检测与跟踪的半自动视频目标标注被引量：1