基于CLIP模型的军事领域图片资源多模态搜索工具研究被引量：1

Research on multimodal search tool for domain image resources based on CLIP

下载PDF

导出

摘要深入调研梳理了OpenAI CLIP多模态模型和相关应用研究。借助CLIP模型,通过大规模军事相关图片数据集开展实验,设计开发了具有以文搜图和以图搜图功能的多模态搜索工具,且在实际测试中表现良好,可以为后续围绕军事相关图片的事件分类、目标检测、任务轨迹跟踪等方面的分析研究奠定基础。 The Open AI′ multimodal model Contrastive Language-image Pre-training(CLIP) and relevant application research were thoroughly analyzed and sorted out. With the help of CLIP, a multimodal search tool with the functions of text search and image search was designed and developed through experiments with military-related image datasets on a large scale. The tool performed well in practical tests, which can lay a foundation for further analyses and research on event classification, target detection, task trajectory tracking of military-related images.

作者赵晋巍刘晓鹏罗威程瑾毛彬宋宇 ZHAO Jin-wei;LIU Xiao-peng;LUO Wei;CHENG Jin;MAO Bin;SONG Yu(Information Research Center of Military Sciences,Academy of Military Sciences,Beijing 100142,China)

机构地区军事科学院军事科学信息研究中心

出处《中华医学图书情报杂志》 CAS 2022年第8期14-20,共7页 Chinese Journal of Medical Library and Information Science

关键词 CLIP模型多模态图文检索以图搜图 CLIP model Multimodal Image-text retrieval Reverse image search

分类号 G254.37 [文化科学—图书馆学] G254.92 [文化科学—图书馆学]

引文网络
相关文献

参考文献2

1余辉,梁镇涛,鄢宇晨.多来源多模态数据融合与集成研究进展[J].情报理论与实践,2020,43(11):169-178. 被引量：41
2任泽裕,王振超,柯尊旺,李哲,吾守尔·斯拉木.多模态数据融合综述[J].计算机工程与应用,2021,57(18):49-64. 被引量：48

二级参考文献13

1黄春林,李新.陆面数据同化系统的研究综述[J].遥感技术与应用,2004,19(5):424-430. 被引量：45
2徐晓滨,陈丽,文成林.一种基于多源异类信息统一表示的多传感器数据融合算法[J].河南大学学报（自然科学版）,2005,35(3):67-71. 被引量：5
3祁友杰,王琦.多源数据融合算法综述[J].航天电子对抗,2017,33(6):37-41. 被引量：46
4巴志超,李纲,安璐,毛进.国家安全大数据综合信息集成:应用架构与实现路径[J].中国软科学,2018(7):9-20. 被引量：34
5刘卓锟,刘华平,黄文美,王博文,孙富春.视听觉跨模态表面材质检索[J].智能系统学报,2019,14(3):423-429. 被引量：5
6田鸽,韩磊,赵永华.多源数据融合的实景三维建模在土地整治中的应用[J].生态学杂志,2019,38(7):2236-2242. 被引量：28
7张素智,陈小妮,李鹏辉,杨芮,蔡强.食品安全大数据的融合及分类技术综述[J].计算机技术与发展,2020,30(2):159-165. 被引量：12
8何俊,张彩庆,李小珍,张德海.面向深度学习的多模态融合技术研究综述[J].计算机工程,2020,46(5):1-11. 被引量：61
9陈鹏,李擎,张德政,杨宇航,蔡铮,陆子怡.多模态学习方法综述[J].工程科学学报,2020,42(5):557-569. 被引量：28
10林敏鸿,蒙祖强.基于注意力神经网络的多模态情感分析[J].计算机科学,2020,47(S02):508-514. 被引量：17

共引文献82

1李紫琳,张媛,武睿婕,张同超,陈佳齐,王泽,吕明.数据融合技术及其在疾病“防诊治康”领域中的应用[J].中国公共卫生,2024,40(1):91-97.
2张才俊,江帆,张波.基于改进型B+树的电力多模态数据索引系统研究[J].系统仿真技术,2023,19(4):302-307.
3董洪飞,刘俊,安然.航空语义知识库构建方法研究[J].航空标准化与质量,2020(5):52-56. 被引量：1
4汤宇磊,吴杨杨,蒋兴征,冯亮,高阳.面向自然资源信息提取的多源异构数据融合技术--以汉江流域NDVI数据为例[J].中国地质调查,2021,8(2):74-82. 被引量：9
5巴志超,刘学太,马亚雪,李纲.国家安全大数据综合信息集成的战略思考与路径选择[J].情报学报,2021,40(11):1139-1149. 被引量：15
6董洪飞,安然,贺薇,刘俊.航空领域知识智能加工与服务方法研究[J].航空标准化与质量,2021(5):32-38. 被引量：2
7吴开达,吕令聪,王振东,史益军.CIM平台的多源数据处理研究分析[J].电子技术与软件工程,2021(23):134-135. 被引量：3
8李纲,余辉,毛进.基于多层语义相似的技术供需文本匹配模型研究[J].数据分析与知识发现,2021,5(12):25-36. 被引量：10
9郑勤华,陈丽,郭利明,王怀波,柴唤友.理论与技术双向驱动的学生综合素养评价新范式[J].中国电化教育,2022(4):56-63. 被引量：17
10罗思言,王心舟,饶向荣.人工智能在中医诊断中的应用进展[J].中国医学物理学杂志,2022,39(5):647-654. 被引量：11

同被引文献4

1谭康霞,平鹏,秦文虎.基于YOLO模型的红外图像行人检测方法[J].激光与红外,2018,48(11):1436-1442. 被引量：15
2李景文,韦晶闪,姜建武,陆妍玲,刘垒,唐一飞,李旭.多视角监控视频中动态目标的时空信息提取方法[J].测绘学报,2022,51(3):388-400. 被引量：9
3龚声蓉,曹李军,刘纯平,李永刚,晋兆龙,沈伟平.面向智能监控的视频行为分析关键技术与应用[J].中国科技成果,2022,23(12):12-13. 被引量：1
4肖进胜,申梦瑶,江明俊,雷俊峰,包振宇.融合包注意力机制的监控视频异常行为检测[J].自动化学报,2022,48(12):2951-2959. 被引量：9

引证文献1

1王齐,曾卓夫,黄小明,费雨欣,陈逸洋,廖家俊.监控场景下基于CLIP的细粒度目标检测方法[J].计算机科学与应用,2023,13(12):2222-2229.

1闫龙川,袁孝宇,朱京,马丽,陈智雨.基于深度学习的电网图片智能管理系统设计与实现[J].电力信息与通信技术,2021,19(10):65-71. 被引量：4
2连光富.基于LIRE图像检索在焊接工艺规程编制应用中的研究与实现[J].科技视界,2021(17):123-126.
3熊立波.基于深度学习模型的以图搜图技术在新华社供稿服务中的创新应用[J].中国传媒科技,2022(10):139-141.
4金峰.ChatGPT火爆“出圈” 为AI发展添薪助力[J].通信世界,2023(3):5-5. 被引量：8
5快步追赶“科技即未来”热潮[J].可持续发展经济导刊,2023(1):22-22.
6周圳.起底百度AI作画,天宫盛宴刷屏视频背后的未来变革[J].大数据时代,2023(2):54-59. 被引量：2
7陈佳靖.AI创作潮[J].商业周刊（中文版）,2023(1):66-72.
8巴里·艾肯格林.ChatGPT的影响不容小靓[J].财新周刊,2023(4):36-36.
9姜奇平.ChatGPT大火下的冷思考[J].互联网周刊,2023(4):6-6. 被引量：5
10颜嘉麒,王敏红,朱庆华.人工智能驱动下信息管理研究前沿论坛纪要[J].图书情报知识,2022,39(6):17-19.

中华医学图书情报杂志

2022年第8期

浏览历史

内容加载中请稍等...

基于CLIP模型的军事领域图片资源多模态搜索工具研究被引量：1

参考文献2

二级参考文献13

共引文献82

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于CLIP模型的军事领域图片资源多模态搜索工具研究 被引量：1

参考文献2

二级参考文献13

共引文献82

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于CLIP模型的军事领域图片资源多模态搜索工具研究被引量：1