多模态大语言模型对开源声像信息研究的影响

The impact of multi-modal large language models on open-source audio-visual information research

下载PDF

导出

摘要开源声像信息研究作为国防科技信息研究的组成部分,在自媒体与短视频爆发的现阶段重要性愈发凸显。大模型浪潮爆发后,深入探析多模态大语言模型对开源声像信息研究工作的影响具有重要意义。通过研究梳理多种多模态大语言模型技术特点和应用场景特点,提出在开源声像信息研究中的潜在应用方向,为开源声像信息研究工作提供参考。现阶段多模态大语言模型距离直接落地应用还有差距,但其将是重塑重构声像信息研究工作的重要推手,其生成特性也为开源声像信息研究带来极大挑战,开源声像信息研究进入转型升维的战略机遇期。 Open-source audio-visual information research,as a component of defense technology information research,has become increasingly significant in the current era of social media and short video explosions.Following the surge of large model technology,it is of great significance to deeply analyze the impact of multimodal large language models on open-source audio-visual information research work.By studying and organizing the technical characteristics and application scenarios of various multimodal large language models,potential application directions in open-source audio-visual information research are proposed,providing a reference for the research work in this field.At present,there is still a gap for multimodal large models to be directly applied,but multimodal large language models will be an important driver in reshaping and reconstructing the work of audio-visual information research.Their generative characteristics also pose significant challenges to open-source audio-visual information research.Open-source audio-visual information research has entered a strategic period of transformation and upgrading.

作者吴叔義郭秀峰侯丽 WU Shuyi;GUO Xiufeng;HOU Li(Military Science Information Research Center,Academy of Military Science,Beijing 100142,China)

机构地区军事科学院军事科学信息研究中心

出处《国防科技》 2024年第3期73-80,92,共9页 National Defense Technology

关键词多模态大语言模型开源声像信息人工智能 multi-modal large language model open-source audio-visual information artificial intelligence

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1刘峰.声像情报发展历史研究[J].情报杂志,2020,39(12):57-61. 被引量：2
2马建伟.立足现代传媒环境,对话声像信息资源[J].文化产业,2023(18):148-150. 被引量：1
3吴建平.科技声像情报的形态及发展趋势[J].四川冶金,2012,34(1):72-75. 被引量：6
4吴叔義,郭秀峰,侯丽.研讨场景视频的图像情报挖掘[J].国防科技,2022,43(4):131-136. 被引量：2
5高自友,郭雷,刘中民,王红卫,盛昭瀚,曾大军,刘作仪,霍红,李大庆,彭一杰,郑晓龙.大数据与人工智能时代下复杂系统管理研究的若干关键科学问题[J].中国科学基金,2023,37(3):429-438. 被引量：2

二级参考文献31

1周仁和.科技声像慨论[M].北京:国防工业出版社,2009.
2罗文森.浅谈高校图书馆的现代声像服务[J].科技情报开发与经济,2007,17(10):8-9. 被引量：2
3卫路兵.浅谈科技声像资料的数字化管理[J].甘肃科技,2010,26(5):110-111. 被引量：6
4成思危.复杂科学与管理[J].中国科学院院刊,1999,14(3):175-183. 被引量：89
5韩旭.浅析传统声像情报向当代声像情报的转变[J].中国科技信息,2010(17):143-144. 被引量：2
6成思危.复杂科学与系统工程[J].管理科学学报,1999,2(2):1-7. 被引量：200
7钱学森,于景元,戴汝为.一个科学新领域——开放的复杂巨系统及其方法论[J].自然杂志,1990,13(1):3-10. 被引量：1306
8吴建平.科技声像情报的形态及发展趋势[J].四川冶金,2012,34(1):72-75. 被引量：6
9李静海,胡英,袁权.探索介尺度科学:从新角度审视老问题[J].中国科学：化学,2014,44(3):277-281. 被引量：36
10于景元.钱学森系统科学思想和系统科学体系[J].科学决策,2014(12):1-22. 被引量：48

共引文献8

1张文斌.一起有机热载体锅炉爆管事故的原因分析[J].中国锅炉压力容器安全,2000,16(2):40-41. 被引量：2
2蒋陈光,丁洪玲.新媒体时代声像情报发展思路[J].情报理论与实践,2016,39(6):61-63. 被引量：4
3刘峰.声像情报发展历史研究[J].情报杂志,2020,39(12):57-61. 被引量：2
4刘峰.联合作战视阈下的声像情报概念研究[J].情报理论与实践,2021,44(3):101-108. 被引量：2
5刘峰.对声像情报现实发展需求和未来转型升级的新思考[J].情报杂志,2021,40(6):89-94. 被引量：2
6滕锡超,叶熠彬,刘学聪.多模态多视角景象匹配及精确制导应用[J].国防科技,2023,44(5):26-34.
7孙文臣.基于复杂系统管理理念的S20北翟路改建方案研究[J].建筑施工,2024,46(10):1721-1723.
8黄莉,张静.实施创新驱动战略提升我国科技声像服务实效研究[J].中国经贸导刊,2016(9Z):57-59. 被引量：2

1罗芳.谋“新”重“质”奋力以科技创新塑造高质量发展新优势[J].今日科技,2024(6):12-13.
2数智决策大脑·大数据战略重点实验室课题组.向低空要生产力向天空要GDP[J].领导决策信息,2024(20):28-31.
3杨文举,邵垒,曾宪君,周宝成,贺佳伟,杨家豪.巡航高度对飞机燃油箱水污染物生成特性的影响[J].航空动力学报,2024,39(7):189-195.
4李香璇,崔卫,马挺,吕琳,王秋旺.多孔通道内CO_(2)水合物生成特性实验研究[J].工程热物理学报,2024,45(6):1773-1779.
5邹莹.人工智能应用于银行理财客户服务场景的设想[J].中国银行业,2024(5):52-54.
6杨凤娟(综述),蒋献(审校).雌激素与皮肤健康:生理作用、衰老影响及治疗进展[J].中国美容医学,2024,33(7):181-184.
7李俊,敖琳瑛,邓冰,屈广林,余廷芳.核准制下超超临界火电机组NO_(x)排放特性的数值模拟[J].南昌大学学报（工科版）,2024,46(2):233-238.
8张自印,庄乐泉,曹波波,罗泽利,敬加强,孙杰,陈星宇.含蜡油气水合物生成特性及其浆液黏度影响因素[J].中国海上油气,2024,36(3):221-229.
9汪菲,林圣岚,朱晓之,张心悦,林涛.以管壁生物膜为前体物的DBPs生成特性和毒性评估[J].中国给水排水,2024,40(11):31-40.

国防科技

2024年第3期

浏览历史

内容加载中请稍等...

多模态大语言模型对开源声像信息研究的影响

参考文献5

二级参考文献31

共引文献8

相关作者

相关机构

相关主题

浏览历史