基于模型分解的小样本学习被引量：1

Few-shot learning via model composition

导出

摘要机器学习依赖大量样本的统计信息进行模型的训练,从而能对未知样本进行精准的预测.搜集样本及标记需要耗费大量的资源,因而如何基于少量样本(few-shot learning)进行模型的训练至关重要.有效的模型先验(prior)能够降低模型训练对样本的需求.本文基于元学习(meta learning)框架,从相关的、类别不同的数据中学习模型先验,并将这种先验应用于新类别的少样本任务.与此同时,本文提出"模型组合先验"(MCP,model composition prior)方法,通过目标函数的最优条件对模型结构进行分解,并分别估计模型的各个组成部分,得到有效的分类器.这种分解方式具有较高的可解释性,能够指导在不同小样本任务中"共享"与"独立"的成分,从而指导元学习的具体实现.在人造数据中,本文方法能够恢复出小样本任务之间的关联性;在图像数据上,MCP方法能取得比当前主流方法更优异的效果. Although achieve inspiring performance in many real-world applications,machine learning methods require a huge amount of training examples to obtain an effective model.Considering the effort collecting labeled training data,the few-shot learning,i.e.,learning with budgeted training set,is necessary and useful.Model prior,e.g.,the feature embedding,initialization,and configuration,is the key to the few-shot learning.This study metalearns such prior from seen classes and apply the learned prior over few-shot task on unseen classes.Meanwhile,based on the first order optimal condition of the objective,the model composition prior(MCP)is stressed to decompose the model prior and estimate each component.The composition strategy improves the explainability,while guiding the shared and specific parts among those few-shot tasks.We verify the ability of our approach to recover task relationship over the synthetic dataset,and our MCP method achieves better results on two benchmark datasets(MiniImageNet and CUB).

作者叶翰嘉詹德川 Han-Jia YE;De-Chuan ZHAN(National Key Laboratory for Novel Software Technology,Nanjing University,Nanjing 210023,China)

机构地区计算机软件新技术国家重点实验室(南京大学)

出处《中国科学：信息科学》 CSCD 北大核心 2020年第5期662-674,共13页 Scientia Sinica(Informationis)

基金国家重点研发计划“大数据分析的基础理论和技术方法”(批准号:2018YFB1004300) 国家自然科学基金(批准号:61773198,61632004) 计算机软件新技术协同创新中心,南京大学优秀博士研究生创新能力提升计划项目资助。

关键词小样本学习元学习模型先验模型分解 few-shot learning meta-learning model prior model composition

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献1

1Zhi-Hua ZHOU.Learnware： on the future of machine learning[J].Frontiers of Computer Science,2016,10(4):589-590. 被引量：20

二级参考文献10

1Li N, Tsang I W, Zhou Z H. Efficient optimization of performance mea- sures by classifier adaptation. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013, 35(6): 1370-1382.
2Pan S J, Yang Q. A survey of transfer learning. IEEE Transactions on Knowledge and Data Engineering, 2010, 22(10): 1345-1359.
3Sugiyama M, Kawanabe M. Machine Learning in Non-Stationary En- vironments: Introduction to Covariate Shift Adaptation. Cambridge, MA: MIT Press, 2012.
4Da Q, Yu Y, Zhou Z H. Learning with augmented class by exploiting unlabeled data. In: Proceedings of the 28th AAAI Conference on Arti- ficial Intelligence. 2014, 1760-1766.
5Mu X, Ting K M, Zhou Z H. Classification under streaming emerg- ing new classes: a solution using completely random trees. CORR abs/1605.09131, 2016.
6Hou C, Zhou Z H. One-pass learning with incremental and decremental features. CORR abs/1605.09082, 2016.
7Dietterich T G. Towards robust artificial intelligence. AAAI Presiden- tial Address at the 30th AAAI Conference on Artificial Intelligence. 2016.
8Zhou Z H, Jiang Y, Chen S F. Extracting symbolic rules from trained neural network ensembles. AI Communications, 2003, 16(1): 3-15.
9Zhou Z H, Jiang Y. NeC4.5: Neural ensemble based C4.5. IEEE Trans- actions on Knowledge and Data Engineering, 2004, 16(6): 770-773.
10Zhou Z H. Ensemble Methods: Foundations and Algorithms. Boca Ra- ton, FL: CRC Press, 2012.

共引文献19

1吴西竹,周志华.领域知识指导的模型重用[J].中国科学：信息科学,2017,47(11):1483-1492. 被引量：5
2戴望州,周志华.归纳逻辑程序设计综述[J].计算机研究与发展,2019,56(1):138-154. 被引量：3
3刘晓玲,刘柏嵩,王洋洋,唐浩.基于深度学习的多标签生成研究进展[J].计算机科学,2020,47(3):192-199. 被引量：7
4李新春,詹德川.一种保持语义关系的词向量复用方法[J].中国科学：信息科学,2020,50(6):813-823. 被引量：4
5Yanbin WANG,Zhuhong YOU,Liping LI,Zhanheng CHEN.A survey of current trends in computational predictions of protein-protein interactions[J].Frontiers of Computer Science,2020,14(4):1-12. 被引量：1
6赵鹏,周志华.基于决策树模型重用的分布变化流数据学习[J].中国科学：信息科学,2021,51(1):1-12. 被引量：16
7冯霁,蔡其志,姜远.联邦学习下对抗训练样本表示的研究[J].中国科学：信息科学,2021,51(6):900-911. 被引量：7
8Qiuye Sun,Lingxiao Yang.From Independence to Interconnection--A Review of AI Technology Applied in Energy Systems[J].CSEE Journal of Power and Energy Systems,2019,5(1):21-34. 被引量：8
9Yan Zhou,Lili Pan,Rongyu Chen,Weizhi Shao.A Novel Image Retrieval Method with Improved DCNN and Hash[J].Journal of Information Hiding and Privacy Protection,2020,2(2):77-86.
10夏旭.基于机器学习的多灾种灾害链预警模型重用框架设计[J].现代信息科技,2022,6(9):173-176. 被引量：2

同被引文献21

1宋闯,赵佳佳,王康,梁欣凯.面向智能感知的小样本学习研究综述[J].航空学报,2020(S01):15-28. 被引量：16
2翟晓燕,张新政.有向网络中具有一个枢纽点的最小支撑树的计算方法[J].系统科学与数学,2005,25(6):649-657. 被引量：2
3尹志武,黄上腾.一种自适应局部概念漂移的数据流分类算法[J].计算机科学,2008,35(2):138-139. 被引量：8
4文益民,强保华,范志刚.概念漂移数据流分类研究综述[J].智能系统学报,2013,8(2):95-104. 被引量：25
5何超,张玉峰.融合领域本体的中文文本语义特征提取算法研究[J].情报理论与实践,2013,36(9):96-99. 被引量：6
6葛伟,朱金福,吴薇薇,吴小欢.基于无容量限制的p-枢纽中位问题的随机优化[J].系统工程理论与实践,2013,33(10):2674-2678. 被引量：11
7马保雷,宋颖慧,刘亚维.基于概念漂移检测的自适应流量识别的研究[J].智能计算机与应用,2013,3(6):50-53. 被引量：1
8林武旭,成科扬,张建明.基于属性学习的图像分类研究[J].计算机科学,2014,41(5):288-291. 被引量：5
9巩萍,程玉虎,王雪松.基于属性关系图正则化特征选择的零样本分类[J].中国矿业大学学报,2015,44(6):1097-1104. 被引量：7
10魏晓聪,林鸿飞.面向迁移学习的文本特征对齐算法[J].计算机工程,2017,34(2):215-219. 被引量：7

引证文献1

1贾霄,郭顺心,赵红.基于图像属性的零样本分类方法综述[J].南京大学学报（自然科学版）,2021,57(4):531-543. 被引量：2

二级引证文献2

1申海锋,石颉,李莎莎,柴梓嘉.特征属性描述下设备的新故障零样本识别[J].微电子学与计算机,2023,40(6):77-84.
2张方泽,龚循强,周秀芳,刘卓涛.基于自训练卷积神经网络的遥感场景图像异常探测方法[J].时空信息学报,2023,30(4):482-490.

1张建国.VUCA时代下大学生元学习能力的培养[J].课程教育研究,2019,0(50):2-2. 被引量：1
2高小方,贾丽娜.一种半监督多流形识别算法[J].山西大学学报（自然科学版）,2019,42(4):824-832. 被引量：1
3廖春晓,高文静,孙孪孪,高莹,曹卫华,吕筠,余灿清,王胜锋,逄增昌,丛黎明,董忠,吴凡,汪华,吴先萍,江国虹,王晓节,王滨有,李立明.出生体重与成年期体格指标的双生子研究[J].中华流行病学杂志,2020,41(3):310-314. 被引量：3
4郭宋静,吴文福.一种面向建筑物提取的极化雷达影像分解方法[J].遥感信息,2020,35(2):70-75. 被引量：5
5王春晓,严超,张耀,别朝红,谢海鹏.考虑条件风险价值的电-气综合能源系统风险厌恶机组组合研究[J].西安交通大学学报,2020,54(6):17-27. 被引量：6
6李贤阳,邱桂华,阳建中,李长彬.基于LDA主题模型的短文体自媒体结构化分类方法研究[J].荆楚理工学院学报,2019,34(6):5-8. 被引量：1
7张凌寒.商业自动化决策算法解释权的功能定位与实现路径[J].苏州大学学报（哲学社会科学版）,2020,41(2):51-60. 被引量：52
8程艳霜,曹亚栋,贾洋.碱活化法对风化煤腐植酸的影响及最优条件[J].乡村科技,2020(11):71-73. 被引量：1
9伍思雨,冯骥.基于去参数聚类方法的P2P网贷平台分析[J].现代信息科技,2020,4(5):32-34. 被引量：1
10黄彦璐,罗俊平,田兵,姜臻,丘晓茵.基于大数据驱动的电压暂降损失评估方法研究[J].电工技术,2020,0(9):137-139. 被引量：1

中国科学：信息科学

2020年第5期

浏览历史

内容加载中请稍等...

基于模型分解的小样本学习被引量：1

参考文献1

二级参考文献10

共引文献19

同被引文献21

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于模型分解的小样本学习 被引量：1

参考文献1

二级参考文献10

共引文献19

同被引文献21

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于模型分解的小样本学习被引量：1