混合曲率空间中的几何自适应元学习方法

Geometry-Adaptive Meta-Learning in Mixed-Curvature Spaces

下载PDF

导出

摘要元学习通过学习先验知识,能帮助模型快速适应新任务.在适应新任务的过程中,空间几何结构与数据几何结构的匹配程度对模型泛化起着重要作用.现实世界数据具有多样的非欧几何结构,例如自然语言具有非欧层级结构,人脸图像具有非欧环状结构等.已有研究表明,真实数据的非欧结构同黎曼流形的几何结构相匹配,从理论上提供了利用黎曼流形来建模数据的可行性.本文提出了混合曲率空间(mixed-curvature space)中的几何自适应元学习方法,利用多个混合曲率空间来表示数据,并生成与数据非欧结构相匹配的黎曼几何.本文构建了多混合曲率神经网络,将混合曲率空间的几何结构表示为曲率空间的曲率、数量和维度,由此通过梯度下降过程实现对数据非欧结构的几何自适应.本文进一步引入几何初始化生成策略和几何更新策略,通过少数几步迭代,空间几何结构即可快速匹配数据非欧结构,加速了梯度下降过程.本文在小样本分类和小样本回归等任务上进行了实验验证.与欧氏空间的元学习方法相比,本文方法在小样本分类任务上取得了约3%的准确率提升,在小样本回归任务上将均方误差减少了一半,验证了本文方法的有效性. Meta-learning has shown effectiveness in helping learning models quickly adapt to new tasks by learning prior knowledge.In the process of adaptation to new tasks,the matching degree between the geometric structure of space and the geometric structure of data plays an important role in the generalization ability of the model.In many practical applications,data has diverse non-Euclidean structures.For example,natural language has non-Euclidean hierarchical structures,and face images have non-Euclidean cyclical structures.Existing research has shown that the geometric structure of Riemannian manifolds matches the non-Euclidean structures of real-world data,providing theoretical feasibility for modeling data using Riemannian manifolds.In this paper,we propose a geometry-adaptive meta-learning method in mixed-curvature spaces,which uses multiple mixed-curvature spaces to model data and produces matching Riemannian geometry for non-Euclidean structures.We build a multi-mixed-curvature neural network that represents the geometry of mixed-curvature space as curvature,number,and dimensionality of the curvature spaces,through which the geometry adaptation to non-Euclidean structures is achieved via a gradient descent process.We further introduce a geometry initialization generation scheme and geometry updating scheme.Through only a few optimization steps,the geometric structure of the underlying space can quickly match non-Euclidean structures of data,accelerating the gradient descent process.We conduct experiments on few-shot classification,few-shot regression,and image completion to evaluate the effectiveness of our method.Compared with meta-learning methods in Euclidean space,our method improves the accuracy by 3% in few-shot classification tasks,and reduces mean square error by half in few-shot regression tasks,showing the effectiveness of our method.

作者高志武玉伟贾云得 GAO Zhi;WU Yu-Wei;JIA Yun-De(Beijing Key Laboratory of Intelligent Information Technology,School of Computer Science&Technology,Beijing Institute of Technology,Beijing 100081;Guangdong Laboratory of Machine Perception and Inteligent Computing,Shenzhen MSU-BIT University,Shenzhen,Guangdong 518172)

机构地区北京理工大学计算机学院智能信息技术北京市重点实验室深圳北理莫斯科大学广东省智能感知与计算重点实验室

出处《计算机学报》 EI CAS CSCD 北大核心 2024年第10期2289-2306,共18页 Chinese Journal of Computers

基金国家自然科学基金(62172041,62176021) 深圳市自然科学基金面上项目(JCYJ20230807142703006) 广东省教育厅普通高校重点科研平台和项目(2023ZDZX1034)资助。

关键词元学习几何自适应混合曲率空间黎曼流形 smeta-learning geometry adaptation mixed-curvature space Riemannian manifold

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1李鹏芳,刘芳,李玲玲,刘旭,冯志玺,焦李成,熊怡梦.嵌入标签语义的元特征再学习和重加权小样本目标检测[J].计算机学报,2022,45(12):2561-2575. 被引量：6
2李凡长,刘洋,吴鹏翔,董方,蔡奇,王哲.元学习研究综述[J].计算机学报,2021,44(2):422-446. 被引量：68

二级参考文献4

1张庆林,王永明.元学习能力及其培养[J].中国教育学刊,1996(3):34-37. 被引量：47
2李凡长,刘洋,吴鹏翔,董方,蔡奇,王哲.元学习研究综述[J].计算机学报,2021,44(2):422-446. 被引量：68
3赵凯琳,靳小龙,王元卓.小样本学习研究综述[J].软件学报,2021,32(2):349-369. 被引量：143
4刘颖,雷研博,范九伦,王富平,公衍超,田奇.基于小样本学习的图像分类技术综述[J].自动化学报,2021,47(2):297-315. 被引量：89

共引文献72

1刘畅,阿布都克力木·阿布力孜,姚登峰,哈里旦木·阿布都克里木.维吾尔语形态分析研究综述[J].计算机工程与应用,2021,57(15):42-61. 被引量：3
2熊金波,毕仁万,田有亮,刘西蒙,马建峰.移动群智感知安全与隐私:模型、进展与趋势[J].计算机学报,2021,44(9):1949-1966. 被引量：23
3熊伟,宫禹.基于元学习的不平衡少样本情况下的文本分类研究[J].中文信息学报,2022,36(1):104-116. 被引量：5
4许仁杰,刘宝弟,张凯,刘伟锋.基于贝叶斯权函数的模型无关元学习算法[J].计算机应用,2022,42(3):708-712. 被引量：1
5李维刚,甘平,谢璐,李松涛.基于样本对元学习的小样本图像分类方法[J].电子学报,2022,50(2):295-304. 被引量：11
6汪航,田晟兆,唐青,陈端兵.基于多尺度标签传播的小样本图像分类[J].计算机研究与发展,2022,59(7):1486-1495. 被引量：5
7钱心筠,王友仁,赵亚磊.基于孪生网络的行星齿轮箱故障诊断方法[J].机械制造与自动化,2022,51(4):116-119. 被引量：1
8李从改,刘锋,徐涴砯,姜胜明.智能水下应急通信一体化探讨[J].数字海洋与水下攻防,2022,5(4):285-292. 被引量：2
9傅世元,高欣,张浩,刘蒙,李军良,徐建航.基于元学习动态选择集成的电力调度数据异常检测方法[J].电网技术,2022,46(8):3248-3256. 被引量：23
10马明刚,潘月梁,彭泽豹,王龙宝.融合注意力的自适应元学习岩性分类研究[J].水力发电,2022,48(11):50-54.

1陈永,张娇娇,张薇.区域感知校准的自适应人群计数与定位方法[J].铁道学报,2024,46(8):78-88.
2凌鹏,郑勋臣,陈鹏,魏莹莹.基于直观几何变换的交互式点云配准[J].中国测试,2023,49(S01):1-5.
3苏易礌,李卫军,刘雪洋,丁建平,刘世侠,李浩南,李贯峰.基于图神经网络的文本分类方法研究综述[J].计算机工程与应用,2024,60(19):1-17.
4冯莉.JBLD均值的影响函数及鲁棒性分析[J].应用数学进展,2024,13(8):3694-3701.
5蔡梦凡,李春和.与欧氏空间共形的背景空间中的Minkowski问题[J].数学年刊（A辑）,2024,45(2):141-154.
6吴昊,张延年,柴永生.一种基于IRS和UAV辅助通信系统分析[J].实验室研究与探索,2024,43(9):72-77.
7吴国雄.面向国家战略需求解决核心数学微分几何基础问题--北京师范大学数学科学学院葛建全教授[J].科技成果管理与研究,2024(8):5-7.
8Yi Zhang,Shuangjian Guo.Matching Rota-Baxter Systems and Gröbner-Shirshov Bases[J].Algebra Colloquium,2024,31(3):389-406.
9买买提艾力·喀迪尔.P-adic空间上测度的Hausdorff维数和局部维数[J].安徽大学学报（自然科学版）,2024,48(5):8-11.
10郑洁.以“导数的概念”为例,将思政元素融入微积分教学[J].创新教育研究,2024,12(9):430-436.

计算机学报

2024年第10期

浏览历史

内容加载中请稍等...

混合曲率空间中的几何自适应元学习方法

参考文献2

二级参考文献4

共引文献72

相关作者

相关机构

相关主题

浏览历史