-
题名数据稀缺性与大模型数据价值的非对称性
被引量:4
- 1
-
-
作者
王翔
周辉
李志鹏
邢云
-
机构
全国海关信息中心
海关国际贸易信息标准化应用创新实验室
中国社会科学院法学研究所
北京中海通科技有限公司
中国电子口岸数据中心
-
出处
《信息安全研究》
CSCD
2023年第7期637-642,共6页
-
基金
海关总署科研项目(2019HK018,2020HK281,2020HK300,2022HK053)。
-
文摘
随着大模型产业的快速发展,出于市场竞争的需要,模型规模快速膨胀,但同时可用于训练的数据供给相对不足、未来日趋稀缺,特别是高质量数据无法满足大模型计算规模指数级增长需求.在数据制度性约束日趋严密的今天,大模型的运行机理呈现自然垄断特征,而主要经济体之间数据治理思路的差异、国际段技术条件的差异以及算法歧视等因素都在持续加大供需双方的价值非对称性,影响大模型的数据价值分配,进而强化大模型所有者的数据垄断.我国发展大模型产业尽管面临国际段一系列技术条件限制,但是拥有数据禀赋优势,无论数量还是质量均具有很大潜力.为了更好积累数据价值收益,未来需要在自主平台、评估指标、国际规则等方面加强建设,并注重对大模型产业的政策引导.
-
关键词
数据稀缺性
数据价值非对称性
数据垄断
智能生成(AIGC)
大模型(llm)
跨境数据链
-
Keywords
data scarcity
data value asymmetry
data monopoly
artificial intelligence generated content(AIGC)
large language model(llm)
cross-border data chain
-
分类号
TP182
[自动化与计算机技术—控制理论与控制工程]
-
-
题名类ChatGPT大模型发展、应用和前景
被引量:22
- 2
-
-
作者
严昊
刘禹良
金连文
白翔
-
机构
华中科技大学人工智能与自动化学院
华南理工大学电子与信息学院
-
出处
《中国图象图形学报》
CSCD
北大核心
2023年第9期2749-2762,共14页
-
基金
国家自然科学基金项目(62206104,62225603)。
-
文摘
生成式人工智能技术自ChatGPT发布以来,不断突破瓶颈,吸引了资本规模投入、多领域革命和政府重点关注。本文首先分析了大模型的发展动态、应用现状和前景,然后从以下3个方面对大模型相关技术进行了简要介绍:1)概述了大模型相关构造技术,包括构造流程、研究现状和优化技术;2)总结了3类当前主流图像—文本的大模型多模态技术;3)介绍了根据评估方式不同而划分的3类大模型评估基准。参数优化与数据集构建是大模型产品普及与技术迭代的核心问题;多模态能力是大模型重要发展方向之一;设立评估基准是比较与约束大模型的关键方法。此外,本文还讨论了现有相关技术面临的挑战与未来可能的发展方向。现阶段的大模型产品已有强大的理解能力和创造能力,在教育、医疗和金融等领域已展现出广阔的应用前景。但同时,它们也存在训练部署困难、专业知识不足和安全隐患等问题。因此,完善参数优化、优质数据集构建、多模态等技术,并建立统一、全面、便捷的评估基准,将成为大模型突破现有局限的关键。
-
关键词
人工智能(AI)
ChatGPT
多模态技术
自然语言处理
大模型(llm)
-
Keywords
artificial intelligence(AI)
ChatGPT
multi-modality
natural language processing
large language model(llm)
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-