基于分解策略的多目标演化子集选择算法被引量：3

Decomposition-based Pareto optimization for subset selection

导出

摘要在许多现实的机器学习任务中,经常遇到从一组变量中挑选一个子集的问题,即子集选择问题.对于这类问题的求解是NP难的.最近,一种基于多目标演化算法的子集选择算法POSS被提出;无论是在理论上还是在实验上,POSS方法均获得了目前的最佳性能.然而,当问题规模很大的时候,POSS方法的运行时间变得难以令人满意,这阻碍了其在大规模实际问题中的应用.提出了一种基于分解策略的多目标演化子集选择算法DPOSS.DPOSS方法将整个子集空间分解成多个子空间,并依次调用POSS方法来求解.在理论上,DPOSS方法在获得和POSS方法相同近似性能下界的同时,运行时间随着分解个数的增加超线性下降.实验结果验证了这一理论,并显示出,DPOSS方法的实际性能随着分解个数的增加略有下降,但依然优于以往的贪婪算法. In many machine-learning tasks, subset selection, which selects a few variables from a large set, is a fundamental problem; it is, however, NP-hard. The recently emerged Pareto Optimization for Subset Selection（POSS） method is a powerful approximation solver for this problem. However, the POSS running time can be unsatisfactory when the problem size is large, restricting its large-scale applications. In this paper, we propose the DPOSS method, which uses a decomposition strategy. DPOSS decomposes the entire subset space into several subspaces, and then sequentially applies the POSS method. Our theoretical analysis shows that DPOSS can achieve the same approximation guarantee as POSS, while superlinearly reducing its running time with respect to the number of decompositions. Empirical studies show that DPOSS＇s actual running time decreases superlinearly,and the quality of the produced solution has a little loss. However, it is still better than the greedy algorithm,the previous algorithm with the best known theoretical guarantee.

作者钱超周志华

机构地区南京大学计算机软件新技术国家重点实验室软件新技术与产业化协同创新中心中国科学技术大学计算机科学与技术学院

出处《中国科学：信息科学》 CSCD 北大核心 2016年第9期1276-1287,共12页 Scientia Sinica(Informationis)

基金国家自然科学基金(批准号:61333014 61321491)资助项目

关键词机器学习子集选择多目标优化多目标演化算法分解策略 machine learning subset selection multi-objective optimization multi-objective evolutionary algorithm decomposition

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1Bojun XIE,Yi LIU,HuiZHANG,Jian YU.Efficient image representation for object recognition via pivots selection[J].Frontiers of Computer Science,2015,9(3):383-391. 被引量：3
2ZHANG YongQin,XIAO JinSheng,LI ShuHong,SHI CaiYun,XIE GuoXi.Learning block-structured incoherent dictionaries for sparse representation[J].Science China(Information Sciences),2015,58(10):74-88. 被引量：6

二级参考文献41

1Bo L F, Ren X F, Fox D. Kernel descriptor for visual recognition. In: Proceedings of the Annual Conference on Neural Information Process- ing Systems. 2010, 244-252.
2Bosch A, Mun6z X, Marti R. Which is the best way to organize/classify images by content? Image and Vision Computing, 2007, 25(6): 778- 791.
3Lowe D G. Distinctive image features from scale-invariant keypoints. International Journal of Computer Vision, 2004, 60(2): 91-110.
4Dalal N, Triggs B. Histograms of oriented gradients for human detec- tion. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2005, 886-893.
5Vogel J, Schiele B. Semantic modeling of natural scenes for content- based image retrieval. International Journal of Computer Vision, 2007, 72(2): 133-157.
6Li F E Perona E A bayesian hierarchical model for learning natural scene categories. In: Proceedings of the IEEE Conference on Com- puter Vision and Pattern Recognition. 2005, 524-531.
7Lazebnik S, Schmid C, Ponce J. Beyond bags of features: spatial pyra- mid matching for recognizing natural scene categories. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2006, 2169-2178.
8Bo L F, Sminchisescu C. Efficient match kernel between sets of fea- tures for visual recognition. In: Proceedings of the Annual Conference on Neural Information Processing Systems. 2009, 135-143.
9SchSlkopf B, Smola A, Mtiller K. Nonlinear component analysis as a kernel eigenvalue problem. Neurocomputing, 1998, 10(5): 1299-1319.
10Xie B J, Liu Y, Zhang H, Yu J. Efficient kernel descriptor for image categorization via pivots selection. In: Proceedings of the IEEE Inter- national Conference on Image Processing. 2013, 3479-3483.

共引文献7

1谢博鋆,朱杰,于剑.基于Pivots选择的有效图像块描述子[J].软件学报,2015,26(11):2930-2938. 被引量：3
2肖进胜,高威,彭红,唐路敏,易本顺.基于局部自相似性和奇异值分解的超采样图像细节增强[J].计算机学报,2016,39(7):1393-1406. 被引量：12
3吴雄洲,李跃华.基于相异性阈值的改进自适应稀疏表示去噪算法[J].红外与毫米波学报,2016,35(5):634-640.
4刘哲,韩九强,黄世奇.基于多引导滤波器的单幅图像超分辨率技术[J].红外技术,2017,39(10):920-927. 被引量：1
5Le DONG,Wenpu DONG,Ning FENG,Mengdie MAO,Long CHEN,Gaipeng KONG.Color space quantization-based clustering for image retrieval[J].Frontiers of Computer Science,2017,11(6):1023-1035.
6姜杰,刘哲,吕林涛.局部线性嵌入的快速单幅图像超分辨率技术[J].红外技术,2018,40(1):39-46. 被引量：9
7刘哲,黄世奇,姜杰.基于引导滤波和多尺度局部自相似单幅红外图像超分辨率方法[J].计算机应用研究,2018,35(4):1236-1240. 被引量：1

同被引文献31

1吴昊,倪志伟,王会颖.基于MapReduce的蚁群算法[J].计算机集成制造系统,2012,18(7):1503-1509. 被引量：22
2王洁,戴清灏,曾宇,杨东日.云制造环境下并行频繁模式增长算法优化[J].计算机集成制造系统,2012,18(9):2124-2129. 被引量：5
3郝晓飞,谭跃生,王静宇.Hadoop平台上Apriori算法并行化研究与实现[J].计算机与现代化,2013(3):1-4. 被引量：26
4窦蒙,闻立杰,王建民,闫志强.基于MapReduce的海量事件日志并行转化算法[J].计算机集成制造系统,2013,19(8):1784-1793. 被引量：11
5徐宗本,张维,刘雷,郭崇慧,于剑,池明旻,朱扬勇.“数据科学与大数据的科学原理及发展前景”——香山科学会议第462次学术讨论会专家发言摘登香山科学会议第次学术讨论会专家发言摘登[J].科技促进发展,2014,10(1):66-75. 被引量：38
6杨毅,雷霞,叶涛,李挺,徐贵阳.考虑安全性与可靠性的微电网电能优化调度[J].中国电机工程学报,2014,34(19):3080-3088. 被引量：50
7吴雄,王秀丽,刘世民,祝振鹏,刘春阳,段杰,侯菲.微电网能量管理系统研究综述[J].电力自动化设备,2014,34(10):7-14. 被引量：103
8米允龙,姜麟,米春桥.MapReduce环境下的否定粗糙关联规则算法[J].计算机集成制造系统,2014,20(11):2893-2903. 被引量：7
9王德文,孙志伟.电力用户侧大数据分析与并行负荷预测[J].中国电机工程学报,2015,35(3):527-537. 被引量：269
10李学龙,龚海刚.大数据系统综述[J].中国科学：信息科学,2015,45(1):1-44. 被引量：456

引证文献3

1薛阳,李蕊,张宁,王琳.差分进化鸟群算法的微电网多目标优化运行[J].电工电气,2020(8):1-6. 被引量：2
2黄启萌,吴苗苗,李云.对抗逃避攻击的过滤式对抗特征选择研究[J].电信科学,2023,39(7):46-58.
3王万良,张兆娟,高楠,赵燕伟.基于人工智能技术的大数据分析方法研究进展[J].计算机集成制造系统,2019,25(3):529-547. 被引量：131

二级引证文献133

1周坤,李小松.人工智能与计算智能在物联网方面的应用探索[J].计算机产品与流通,2020,9(11):152-152. 被引量：5
2邱莉萍,鞠海军,龚晓敏,邓拓,刘林玉.分布式计算框架的大数据机器学习探析[J].计算机产品与流通,2020(10):179-179.
3郭恒川.人工智能中的机器学习技术应用[J].电子技术（上海）,2021,50(10):294-296. 被引量：2
4胡常礼,邵剑飞.基于分布式计算框架的机器学习系统分析[J].电视技术,2021,45(11):115-118. 被引量：1
5魏巍巍.空间数据挖掘的方法进展及其问题探究[J].产业与科技论坛,2020(8):35-36.
6杨德建.大数据分析中的计算智能研究现状与展望[J].新一代信息技术,2022,5(7):120-122.
7商挺.浅谈基于云计算的大数据挖掘及解决方案[J].中国新通信,2018,20(23):68-68. 被引量：4
8王一鹤,杨飞,王卷乐,刘丽峰,马娅.农业大数据研究与应用进展[J].中国农业信息,2018,30(4):48-56. 被引量：10
9田波.工业大数据体系结构设计与分析[J].物联网技术,2019,9(4):75-77. 被引量：2
10刘艳亭,李健,郭敬鹏.智慧医院规划建设与应用研究进展[J].中国医学装备,2019,16(6):177-181. 被引量：19

1李志杰.演化计算在多目标优化问题中的应用[J].科技创业月刊,2011,24(16):136-137.
2周莹,刘云霞.一种求解多目标无约束0-1二次规划问题的文化基因算法[J].深圳信息职业技术学院学报,2014,12(3):1-7.
3文瑛,廖伟志.非支配解集的质量评价方法[J].广西师范学院学报（自然科学版）,2006,23(2):36-41. 被引量：1
4陈彬,洪家荣,王亚东.最优特征子集选择问题[J].计算机学报,1997,20(2):133-138. 被引量：96
5王佳,曹加恒,黄敏.一种新的关系数据库水印方法[J].计算机工程与应用,2005,41(33):162-165. 被引量：2
6黄席樾,刘菡萏,石为人.基于遗传算法的 RBF 神经网络设计[J].重庆大学学报（自然科学版）,1998,21(2):62-67. 被引量：14
7武志峰.一种基于差异演化的特征子集选择算法[J].信息技术,2007,31(4):1-3.
8曾青松.基于群正则化相似性度量的人脸识别方法[J].现代计算机（中旬刊）,2016(7):54-58.
9赵学民,李玲玲.一种关系数据库的多媒体多重水印[J].微电子学与计算机,2013,30(9):122-125. 被引量：1
10艾浩军,龚素文,袁远明.基于多目标演化算法的云计算虚拟机分配策略研究[J].计算机科学,2014,41(6):48-53. 被引量：11

中国科学：信息科学

2016年第9期

浏览历史

内容加载中请稍等...

基于分解策略的多目标演化子集选择算法被引量：3

参考文献2

二级参考文献41

共引文献7

同被引文献31

引证文献3

二级引证文献133

相关作者

相关机构

相关主题

浏览历史

基于分解策略的多目标演化子集选择算法 被引量：3

参考文献2

二级参考文献41

共引文献7

同被引文献31

引证文献3

二级引证文献133

相关作者

相关机构

相关主题

浏览历史

基于分解策略的多目标演化子集选择算法被引量：3