社会大数据跨尺度系统学习理论与方法

Cross-scale systematic learning for social big data:theory and methods

导出

摘要以GPT-4为代表的AI大模型时代正加速而至,深刻改变着社会生活的方方面面.大模型巨参数深度学习是破解复杂大数据智能学习瓶颈的一种有效途径.大模型在展现出强大学习能力的同时也面临着高能耗、大算力挑战.研究表明,平均一个AI大模型训练产生的能耗约等于五辆汽车一生排放的碳总量,驱动AI大模型所需算力每3.5个月翻一番.作为一种有益的补充,内嵌规律的跨尺度系统学习是破解复杂大数据智能学习瓶颈的另一种有效途径.跨尺度系统学习已经在某些专业领域展现出了巨大的成功,如2021年诺贝尔物理学奖授予复杂物理系统跨尺度建模及其在全球气候变暖中的应用.事实上,我国科学家甚至更早开拓了复杂系统跨尺度学习研究,如北京航空航天大学暗物质大数据分析团队利用跨尺度系统学习方法实现了在PB级数据中实时学习KB级关键数据,精度达到万分之一.本文从微观尺度、介观尺度和宏观尺度上分析了跨尺度系统学习的基本原理,构建了内嵌规律跨尺度系统学习的普适方法,并以社会大数据为例开展了典型应用示范.社会大数据跨尺度系统学习应用于疫情防控、舆情分析等领域,并取得显著成效,为我国社会治理数字化、网络化、智能化发展提供了新的成功样本. The era of AI large models,represented by GPT-4,is accelerating,and profoundly transforming various aspects of societal life.Large models with massive parameters in deep learning offer an effective approach to unraveling the bottleneck of complex big data intelligent learning.While these large models showcase powerful learning capabilities,they also face challenges of high energy consumption and computational power requirements.Research indicates that the average energy consumption produced during the training of one AI large model is roughly equivalent to the total carbon emissions from five cars throughout their lifetimes,and the computational power needed to drive AI large models doubles every 3.5 months.As a beneficial complement,law-embedded cross-scale systematic learning presents another effective approach to address the challenges of complex big data intelligent learning.Cross-scale systematic learning has demonstrated significant success in some professional domains,such as the 2021 Nobel Prize in Physics awarded for cross-scale modeling of complex physical systems and its applications in global climate change.In fact,Chinese scientists have pioneered research in cross-scale learning of complex systems,with the team analyzing dark matter big data at Beihang University utilizing cross-scale systematic learning methods to achieve real-time learning of critical data in petabyte-scale datasets,achieving precision at the level of one in ten thousand.This paper analyzes the fundamental principles of crossscale systematic learning at micro,meso,and macro scales,establishes a universal method for law-embedded cross-scale systematic learning,and conducts typical application with demonstrations using social big data.The applications of cross-scale systematic learning in areas such as epidemic prevention and control,and public opinion analysis have achieved remarkable results,providing new successful examples for the digitization,networking,and intelligence development of China’s social governance.

作者郑志明吕金虎王亮鲁仁全崔鹏王鑫韦卫 Zhiming ZHENG;Jinhu LU;Liang WANG;Renquan LU;Peng CUI;Xin WANG;Wei WEI(Institute of Artificial Intelligence,Beihang University,Beijing 100191,China;State Key Laboratory of Complex&Critical Software Environment,Beijing 100191,China;Key Laboratory of Mathematics,Informatics Behavioral Semantics,Ministry of Education,Beijing 100191,China;Beijing Advanced Innovation Center for Future Blockchain and Privacy Computing,Beijing 100191,China;School of Automation Science and Electrical Engineering,Beihang University,Beijing 100191,China;School of Mathematical Sciences,Beihang University,Beijing 100191,China;Zhongguancun Laboratory,Beijing 100191,China;Institute of Automation,Chinese Academy of Sciences,Beijing 100190,China;State Key Laboratory of Multimodal Artificial Intelligence Systems,Beijing 100190,China;School of Automation,Guangdong University of Technology,Guangzhou 510006,China;Department of Computer Science,Tsinghua University,Beijing 100083,China)

机构地区北京航空航天大学人工智能研究院复杂关键软件环境全国重点实验室数学、信息与行为教育部重点实验室未来区块链与隐私计算北京市高精尖创新中心北京航空航天大学自动化科学与电气工程学院北京航空航天大学数学科学学院中关村实验室中国科学院自动化研究所多模态人工智能系统全国重点实验室广东工业大学自动化学院清华大学计算机系

出处《中国科学：信息科学》 CSCD 北大核心 2024年第9期2083-2097,共15页 Scientia Sinica(Informationis)

基金国家自然科学基金(批准号:62141605,62141604,62141608,62141606,62141607)资助项目。

关键词人工智能大模型跨尺度系统学习社会大数据可解释性 artificial intelligence large models cross-scale systematic learning social big data interpretability

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1郑志明,吕金虎,韦卫,唐绍婷.精准智能理论:面向复杂动态对象的人工智能[J].中国科学：信息科学,2021,51(4):678-690. 被引量：21
2高毅勤.复杂化学体系的分子模拟研究——2013年诺贝尔化学奖浅析[J].大学化学,2014,29(2):1-5. 被引量：3
3周天军,张文霞,陈德亮,张学斌,李超,左萌,陈晓龙.2021年诺贝尔物理学奖解读:从温室效应到地球系统科学[J].中国科学：地球科学,2022,52(4):579-594. 被引量：24

二级参考文献31

1杨修群,朱益民,谢倩,任雪娟,徐桂玉.太平洋年代际振荡的研究进展[J].大气科学,2004,28(6):979-992. 被引量：142
2Westheimer F H, Mayer J E. J Chem Phys , 1946,14:733.
3Alder B J,Wainwright T E. J Chem Phys,1959 ,31:459.
4Field M J,Bash P A,Karplus M. J Comput Chem,1990,11:700.
5Gao J. J Am Chem Soc, 1994,116 : 1563.
6Nelder J A,Mead R. Computer J,1965,7:308.
7Fletcher R, Reeves C M. Computer J, 1964,7 : 149.
8Berendsen H J C,Postma J P M,van Gunsteren W F,et al. J Chem Phys,1984,81:3684.
9Noso S. J Chem Phys,1984,81:511.
10Feng K. J Comp Math, 1986,4:279.

共引文献45

1袁天凤,刘燕,赵菊,付洪利,李壮,周丽.高师“中国地理”三维七模块课程思政目标体系构建[J].昭通学院学报,2024,46(3):112-120.
2王巍,吴志刚,孟凡琛,徐小明,邬树楠.多源自主导航系统可信性研究[J].导航与控制,2023,22(1):1-9. 被引量：2
3车子涵,陈克龙,杜岩功,杨紫唯,王霞.冻融凹陷对瓦颜山河源湿地土壤微生物群落结构的影响[J].基因组学与应用生物学,2023,42(2):204-216. 被引量：1
4韩杰.诺贝尔化学奖与生物专业有机化学教材内容相关性分析[J].大学化学,2016,31(5):36-43. 被引量：3
5张恒,刘刚,马莹,宋其圣,印志磊,苑世领.拔尖计划特色课分子模拟实验中的思政案例设计[J].大学化学,2019,34(11):82-87. 被引量：6
6朱建军,宋迎春,胡俊,邹滨,吴立新.测绘大数据时代数据处理理论面临的挑战与发展[J].武汉大学学报（信息科学版）,2021,46(7):1025-1031. 被引量：20
7刘三女牙,孙建文.人工智能时代的课堂创变:解构与重构[J].国家教育行政学院学报,2021(9):16-22. 被引量：23
8孙建文,刘盛英杰,刘三女牙,张慧芳,李卿.基于多阶拟合机制的深度认知追踪方法[J].现代教育技术,2021,31(10):103-109.
9张红春.政府绩效生成的复杂性与绩效评估因应[J].求实,2021(6):25-40. 被引量：21
10孙建文,周建鹏,刘三女牙,何绯娟,唐云.基于多层注意力网络的可解释认知追踪方法[J].计算机研究与发展,2021,58(12):2630-2644. 被引量：2

1人物简介[J].时代英语（高二版）,2024(5):1-1.
2何飞龙,李甜甜.离散偶极玻色爱因斯坦凝聚系统的行波解[J].湘潭大学学报（自然科学版）,2024,46(3):74-81.
3郑敖天.李政道:笔尖下的科学革命,心中的祖国情怀[J].西部教育研究（陕西）,2024(10):60-62.
4邓武丹,李庆奎.基于强化学习的两时间尺度系统最优跟踪控制[J].仪表技术与传感器,2024(9):92-98.
5许炳超,吴秀文,谭兴毅,姚华鑫.密立根的物理学贡献及教育启示[J].物理通报,2024(10):157-159.

中国科学：信息科学

2024年第9期

浏览历史

内容加载中请稍等...

社会大数据跨尺度系统学习理论与方法

参考文献3

二级参考文献31

共引文献45

相关作者

相关机构

相关主题

浏览历史