开源多模态大语言模型初探

下载PDF

导出

摘要【目的】本文旨在总结开源多模态大语言模型(Multimodal Large Language Model,MLLM)的最新进展,探索其在新闻领域的落地实践。【方法】首先,笔者介绍了MLLM的研究背景,对典型的开源和闭源模型在不同测试基准上的表现进行了对比,然后解析了模型架构,包括其组成部分和工作原理,接着探讨了训练策略以及所需要的数据,最后展望了应用场景和研究方向。【结果/结论】通过本文的分析,可以了解到开源MLLM在赶超闭源商业模型上的潜力和发展方向,以及在新闻领域广阔的应用前景,同时为采编业务全流程提供强大的语言理解和生成能力,未来可以结合实际场景开展相关技术的落地实践。

作者刘一闻李彤王宇琦李泽魁郜婕

机构地区新华通讯社

出处《中国传媒科技》 2024年第8期82-85,共4页 Media Science and Technology of China

关键词多模态大语言模型预训练视觉语言模型大语言模型

分类号 G202 [文化科学—传播学]

引文网络
相关文献

1关于人工智能时代的“杀手级”应用,他们说[J].徽商,2024(7):26-26.
2叶华,林莉,卢欣辰,董诗焘,陈飞.基于深度强化学习的电网异常告警决策[J].电力设备管理,2024(18):38-40.
3文洪武.开创西部大开发贵州金融新局面[J].中国金融,2024(19):91-93.
4李超.信息可视化在新闻领域的应用研究与优化策略[J].传播与版权,2024(20):1-4.
5何鹏.计算机视觉技术在自动化中的应用[J].计算机产品与流通,2024(8):122-124.
6韩笑,钟盈炯,吕微,王琪.浅谈采编平台如何赋能新疆及中亚地区的采编业务[J].中国传媒科技,2024(9):129-132.
7郑佳,陈万春,于琦.导弹通用模型架构数字配装及参数灵敏度分析[J].飞行力学,2024,42(5):83-88.
8梁婧.数字时代的税收治理[J].纳税,2024(22):13-15.
9沈民民,杨晓东.连接结构界面摩擦力学建模研究进展[J].力学进展,2024,54(3):477-521.
10阮佳妮.社交化媒体环境下短视频新闻传播路径探析[J].中国传媒科技,2024(8):46-48.

中国传媒科技

2024年第8期

浏览历史

内容加载中请稍等...

开源多模态大语言模型初探

相关作者

相关机构

相关主题

浏览历史