音视频数据半自动化标注方法被引量：3

Semi-automatic Labeling Method for Audio and Video Data

下载PDF

导出

摘要当前主流的基于人工标注方法的样本数据集构建方法耗时耗力,无法构建大规模标准数据集。针对提高数据集的标注效率并依靠深度学习模型的准确性,构建了一种半自动标注数据的方法。通过人工标注少量数据来训练算法模型,利用新构建的模型对大型数据集进行检测识别,选取置信度不高的部分,经过人工审查后加入训练集,经过不断地循环迭代,逐步形成大规模标准数据集。实验结果表明,课题设计的半自动化标注方法能大幅缩短人工标注的时间,并且每次迭代循环都能不同程度的提高算法模型检测识别的准确率。 The current mainstream method of constructing sample data set based on manual annotation methods is time-consuming and labor-intensive,and it has no way to construct large-scale standard data set.Aiming at improving the labeling efficiency of data sets and relying on the accuracy of deep learning models,a semi-automatic data labeling method is constructed.The method is to train the model by manually labeling a small number of data,use the newly constructed model to detect and recognize large data set,select the parts with low confidence,and join the training set after manual review,and gradually form a large-scale standard data set after continuous loop iterations.The experimental results show that the semi-automatic labeling method designed by the subject can greatly shorten the time of manual labeling,and each iteration cycle can improve the accuracy of algorithm model detection and recognition to varying degrees.

作者白雪冰韩志峰蒋龙泉黄云刚冯瑞 BAI Xuebing;HAN Zhifeng;JIANG Longquan;HUANG Yungang;FENG Rui(Academy for Engineering&Technology,Fudan University,Shanghai 200243,China;Software School,Fudan University,Shanghai 200243,China;School of Computer Science School,Fudan University,Shanghai 200243,China;Shanghai Haichao Institute For New Technologies,Shanghai 200070,China)

机构地区复旦大学工程与应用技术研究院复旦大学软件学院复旦大学计算机科学技术学院上海海潮新技术研究所

出处《微型电脑应用》 2021年第8期9-13,17,共6页 Microcomputer Applications

基金上海市科委一次性项目(202068400859-80001) 重大项目(AWS15J005) 上海市科委项目(20511101502) 上海市科委项目(20DZ1100205)。

关键词半自动标注标准数据集深度学习音视频 semi-automatic standard data set deep learning audio and video data

分类号 TP181 [自动化与计算机技术—控制理论与控制工程] TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1吕博.一种机器学习数据集半自动标注方法研究[J].信息通信技术与政策,2019(7):44-50. 被引量：6
2殷帅,胡越黎,刘思齐,燕明.基于YOLO网络的数据采集与标注[J].仪表技术,2018(12):22-25. 被引量：9

二级参考文献5

1李建中,张冬冬.滑动窗口规模的动态调整算法[J].软件学报,2004,15(12):1800-1814. 被引量：22
2于娟,刘强.主题网络爬虫研究综述[J].计算机工程与科学,2015,37(2):231-237. 被引量：103
3李旭冬,叶茂,李涛.基于卷积神经网络的目标检测研究综述[J].计算机应用研究,2017,34(10):2881-2886. 被引量：149
4高宗,李少波,陈济楠,李政杰.基于YOLO网络的行人检测方法[J].计算机工程,2018,44(5):215-219. 被引量：81
5王功鹏,段萌,牛常勇.基于卷积神经网络的随机梯度下降算法[J].计算机工程与设计,2018,39(2):441-445. 被引量：73

共引文献13

1周斌,苏鹏,高鹏.基于改进YOLOv3算法的挖掘机检测方法[J].数字制造科学,2022(2):141-145. 被引量：2
2孙晓璇,张磊,李健.目标检测数据集半自动生成技术研究[J].计算机系统应用,2019,28(10):8-14. 被引量：3
3谢秀齐,李业健,陈亦翔,张钠棣.360度全景车载智能避障系统的研究[J].现代制造技术与装备,2019,0(11):71-72.
4潘峰,吕博.基于人工智能的同步测试巡检技术研究[J].信息通信技术与政策,2020(9):55-62. 被引量：2
5闫建伟,赵源,张乐伟,张富贵.基于残差网络的自然环境中刺梨果实的识别[J].中国农机化学报,2020,41(10):191-196. 被引量：10
6罗宇哲,万艳,谢秀齐,何晓昀.深度学习算法在缺陷自动检测中的应用[J].今日自动化,2020(6):70-72.
7张喆,罗才喜.虚拟仿真技术在高校管网管理中的应用探讨[J].软件,2021,42(4):78-80.
8宫衍圣,蔡科平,王志强,李鑫鑫,靖稳峰.基于机器学习的文本半自动类别标注方法[J].工程数学学报,2021,38(6):751-762. 被引量：2
9梁雪枫,安婧,金娜,焦永卓,邓琳,张晓曙,唐宇.甘肃省2019-2020年出生儿童预防接种行为评分卡模型构建[J].中国疫苗和免疫,2022,28(4):465-469. 被引量：3
10焦正,张强,韩清华,李明远.类比算法的提出以及在人工智能发展中的应用研究[J].电子元器件与信息技术,2022,6(7):93-96.

同被引文献24

1蔡莉,王淑婷,刘俊晖,朱扬勇.数据标注研究综述[J].软件学报,2020,31(2):302-320. 被引量：60
2谭灼伟,高瑞鑫.“云大物移智+智能变电站”的建设思路及体系[J].企业管理,2020(S02):338-339. 被引量：1
3陈娟,徐清超.数字化变电站设计体会及经验[J].广西电力,2010,33(3):65-67. 被引量：2
4苑玮琦,薛丹.基于机器视觉的隧道衬砌裂缝检测算法综述[J].仪器仪表学报,2017,38(12):3100-3111. 被引量：52
5艾飞,茅俊,丁敬,黄继荣,张新来,徐通,胡冬良.智能变电站顺控技术工程实践[J].四川电力技术,2018,41(2):82-85. 被引量：7
6刘兴勇,傅振宇,吕昕昕,卢卓群,薛超.基于PCS9700监控系统的智能变电站顺序控制研究[J].东北电力技术,2018,39(8):44-47. 被引量：2
7周新启,郑莎,潘兰兰,朱长东.变电站顺序控制方案探讨[J].山东工业技术,2017(17):172-172. 被引量：1
8吕博.一种机器学习数据集半自动标注方法研究[J].信息通信技术与政策,2019(7):44-50. 被引量：6
9李良福,马卫飞,李丽,陆铖.基于深度学习的桥梁裂缝检测算法研究[J].自动化学报,2019,45(9):1727-1742. 被引量：109
10陈哲,黄巍,陈昭.基于Web应用的医学图像半自动标注系统[J].计算机应用与软件,2019,36(10):1-5. 被引量：8

引证文献3

1王海林,冯瑞,张晓波.融合深度主动学习的医学图像半自动标注系统[J].计算机系统应用,2023,32(2):75-82. 被引量：2
2肖成健.变电站智能操作关键技术研究与应用[J].云南电力技术,2023,51(1):78-83. 被引量：7
3刘超,许木南,曹思娴,牛圣尧,朱安琪.裂缝检测模型数据集的低监督快速标注算法[J].同济大学学报（自然科学版）,2023,51(11):1692-1700.

二级引证文献9

1郝烨,王浩,李佳戈.行业标准《人工智能医疗器械质量要求和评价第3部分:数据标注通用要求》解析[J].协和医学杂志,2023,14(6):1185-1188.
2仇昊.变电站中的智能操作关键技术分析[J].集成电路应用,2023,40(10):212-213. 被引量：1
3张子诺,曾翌晖,谢枭楠.基于边缘计算算法的区域电网智能操作管理系统设计[J].中国新技术新产品,2024(3):24-27. 被引量：1
4舒宁,汤清华,赵必美.基于改进YOLOv5和DBSCAN聚类的变电站压板识别方法[J].电力大数据,2023,26(12):19-27.
5尹兰.智能变电站运维管理关键技术[J].通信电源技术,2024,41(2):215-217.
6刘庆.发电厂变压器与智能配电网协同运行的关键技术研究与应用[J].通信电源技术,2024,41(3):25-27.
7王雅琦.人工智能在变电运行操作自动化中的应用[J].通信电源技术,2024,41(3):52-54.
8谭双平,李俊,张晓娟,严馨月,张彤,吴下里,刘自强,李莉莉,冯娟,韩海斌,唐国英,韩俊洲,邓友锋.基于主动学习的肺结节计算机辅助诊断交互审查技术[J].生物医学工程学杂志,2024,41(3):503-510.
9张珏,庄志翔,简思亮,王曦悦,郭俊韬,王彦.变电站智能运维业务设计与应用[J].南方能源建设,2024,11(S01):74-79.

1潘晶晶.广播电视监测系统的设计与实现[J].电子世界,2021(12):51-52. 被引量：4
2李冬妮,张海燕,温昱晖.人工智能数据集标准化与共享机制的探索[J].金融电子化,2021(7):75-77.
3韩志峰,白雪冰,蒋龙泉,黄云刚,冯瑞.音视频大数据样本库入库规范[J].微型电脑应用,2021,37(7):27-30. 被引量：1
4郭毅博,孟文化,范一鸣,侯立硕,袁玥,薛均晓,徐明亮.基于可穿戴传感器数据的人体行为识别数据特征提取方法[J].计算机辅助设计与图形学学报,2021,33(8):1246-1253. 被引量：15
5邹开达.图卷积网络在特殊人群异常行为检测中的研究与应用[J].消费电子,2021(7):34-35.
6刘旺,安红艳,胡浩,谢杰,盛顺,苗秋生,张京开,张迪婧,宋爱敏,李雪婷.日光温室冬季新型增温技术在叶菜生产中应用对比研究[J].农业工程技术,2021,41(13):64-67. 被引量：3
7周围,朱勇,杜玉晗,谢俊好.Gamma分布在海面目标检测中的应用[J].雷达科学与技术,2021,19(3):310-321. 被引量：1
8陈元文.基于优先保持策略遗传算法的三维装箱问题[J].包装工程,2021,42(15):211-218. 被引量：7
9白辰光,刘晓红,郑建明.可视化生信教学在“肿瘤信号转导”教学中的应用初探[J].教育教学论坛,2021(28):140-143.
10雷金火,陈江.大学数字创业教育的课程与教学设计:基于设计思维视角[J].教育发展研究,2021,41(11):32-38. 被引量：11

微型电脑应用

2021年第8期

浏览历史

内容加载中请稍等...

音视频数据半自动化标注方法被引量：3

参考文献2

二级参考文献5

共引文献13

同被引文献24

引证文献3

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

音视频数据半自动化标注方法 被引量：3

参考文献2

二级参考文献5

共引文献13

同被引文献24

引证文献3

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

音视频数据半自动化标注方法被引量：3