一种结合类别权重及多示例的多标记学习改进算法被引量：6

Improved Algorithm for Multi-label Learning Based on Class Weights and Multi-instance

下载PDF

导出

摘要多标记学习主要用于解决单个样本同时属于多个类别的问题.传统的多标记算法在输入空间仅用单一示例表示多义性对象,过度简化了对象的复杂内涵,导致在表示阶段丢失重要信息.针对这一问题,提出一种结合类别权重及多示例的多标记学习改进算法CWMI-INSDIF.算法采用MIML(Multi-Instance Multi-Label learning)框架,在表示阶段,将学习样本分化为多示例包形式,在生成示例包过程中定义一组描述数据重要度的权重函数,并加入自适应惩罚策略,最终确定了学习样本中各部分信息的权重大小,从而在输入空间更好的描述了样本歧义性.算法给出了在公开数据集的实验结果.通过仿真分析,验证了本文提出的算法在学习性能和分类效果方面的提高. Multi-label learning deals with the problem where each example is represented by a single instance while associated with multiple class labels. Previous multi-label algorithm indicate that inherent ambiguity of each instance is only expressed as a single in- stance in input space which oversimplified the complex connotation of instance and thus difficult to learn. In this paper, an improved algorithm for multi-label learning based on class weights and multi-instance is proposed. Our approach transforms a single instance into a bag of instances in input space using MIML framework. In this process, we introduce a set of weight function representing the impor- tance of data which adjusted by defining an adaptive penalty strategy, the weight function can determine the weight of each part of the instance and thus make the ambiguity of each instance better to be expressed. Experiments are conducted on the open data set regarding yeast gene function analysis. Experimental results show that CWMI-INSDIF is superior to other multi-label learning algorithms on learning performance and classification results.

作者杨小健王杉杉李荣雨

机构地区南京工业大学计算机科学与技术学院

出处《小型微型计算机系统》 CSCD 北大核心 2017年第4期857-862,共6页 Journal of Chinese Computer Systems

基金江苏省高校自然科学基金项目(12KJB510007)资助

关键词多标记学习 MIML 类别权重自适应惩罚策略 multi-label learning MIML class weights adaptive penalty strategy

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1詹德川,周志华.基于流形学习的多示例回归算法[J].计算机学报,2006,29(11):1948-1955. 被引量：16
2甘睿,印鉴.通过挖掘示例中的概念来解决多示例学习问题[J].计算机研究与发展,2011,48(S3):73-78. 被引量：3

二级参考文献29

1Dietterich T.G.,Lathrop R.H.,Lozano-Pérez T..Solving the multiple instance problem with axis-parallel rectangles.Artificial Intelligence,1997,89(1/2):31～71
2Maron O..Learning from ambiguity[Ph.D.dissertation].Department of Electrical Engineering and Computer Science,MIT,1998
3Ray S.,Page D..Multiple instance regression.In:Brodley C.E.,Danyluk A.P.eds.Proceedings of the 18th International Conference on Machine Learning.San Francisco:Morgan Kaufmann,2001,425～432
4Amar R.A.,Dooly D.R.,Goldman S.A.,Zhang Q..Multiple-Instance learning of real-valued data.In:Brodley C.E.,Danyluk A.P.eds.Proceedings of the 18th International Conference on Machine Learning.San Francisco:Morgan Kaufmann,2001,3～10
5Roweis S.T.,Lawrance K.S..Nonlinear dimensionality reduction by locally linear embedding.Science,2000,290(5500):2323～2326
6Wang J.,Zucker J.-D..Solving the multiple-instance problem:A lazy learning approach.In:Langley P.ed.Proceedings of the 17th International Conference on Machine Learning,San Francisco,MK,1998,341～349
7Zhou Z.-H.,Zhang M.-L..Neural networks for multi-instance learning.AI Lab,Computer Science &Technology Department,Nanjing University,Nanjing,China:Technical Report,2002
8Maron O.,Lozano-Pérez T..A framework for multiple-instance learning.In:Jordan M.I.,Kearns M.J.,Solla S.A.eds.Advances in Neural Information Processing Systems 10.Cambridge:MIT Press,1998,570～576
9Ruffo G..Learning single and multiple instance decision trees for computer security applications[Ph.D.dissertation].Torino:Department of Computer Science,University of Turin,2000
10Chevaleyre Y.,Zucker J.-D..Solving multiple-instance and multiple-part learning problems with decision trees and decision rules.Application to the mutagenesis problem.In:Stroulia E.,Matwin S.eds.Proceedings of the 14th Biennial Conference of the Canadian Society for Computational Studies of Intelligence.Berlin:Springer-Verlag,2001,204～214

共引文献17

1王刚,周激流,何坤.基于AdaBoost和LLE的视频人脸特征提取研究[J].四川大学学报（自然科学版）,2008,45(3):512-516. 被引量：4
2梁霖,徐光华,栗茂林,张熠卓,梁小影.冲击故障特征提取的非线性流形学习方法[J].西安交通大学学报,2009,43(11):95-99. 被引量：10
3谢红薇,李晓亮.基于多示例的K-means聚类学习算法[J].计算机工程,2009,35(22):179-181. 被引量：6
4孟德宇,徐晨,徐宗本.基于Isomap的流形结构重建方法[J].计算机学报,2010,33(3):545-555. 被引量：20
5胡利斌.基于流形的概念空间形式化研究[J].电脑知识与技术,2010,6(4):2520-2523.
6郑忠龙,畅雪萍,杨杰.等同邻域投影[J].计算机研究与发展,2010,47(7):1286-1293.
7钟明,薛惠锋,吕振中.一种基于Fisher准则的有监督表情识别算法[J].计算机应用研究,2010,27(10):3979-3981.
8钟明,薛惠锋,梅觅.基于局部线性嵌入的最大散度矩阵算法[J].计算机工程,2011,37(12):176-178. 被引量：1
9温超,耿国华,李展.构建新包空间的多示例学习方法[J].西安交通大学学报,2011,45(8):62-66. 被引量：1
10栗茂林,梁霖,王孙安,庄健.基于连续小波系数非线性流形学习的冲击特征提取方法[J].振动与冲击,2012,31(1):106-111. 被引量：13

同被引文献42

1牛承珍.关于入侵检测技术及其应用的研究[J].软件导刊,2010,9(1):137-139. 被引量：11
2胡清华,于达仁,谢宗霞.基于邻域粒化和粗糙逼近的数值属性约简[J].软件学报,2008,19(3):640-649. 被引量：289
3卫生部印发《电子病历基本规范(试行)》[J].中国病案,2010,11(3):64-64. 被引量：9
4钱宇华,梁吉业,王锋.面向非完备决策表的正向近似特征选择加速算法[J].计算机学报,2011,34(3):435-442. 被引量：26
5万建武,杨明,吉根林,陈银娟.一种面向人脸识别的加权代价敏感局部保持投影[J].软件学报,2013,24(5):1155-1164. 被引量：9
6SHAO Huan,LI GuoZheng,LIU GuoPing,WANG YiQin.Symptom selection for multi-label data of inquiry diagnosis in traditional Chinese medicine[J].Science China(Information Sciences),2013,56(5):233-245. 被引量：8
7李哲,王志海,何颖婧,付彬.一种启发式多标记分类器选择与排序策略[J].中文信息学报,2013,27(4):119-126. 被引量：2
8郑四渭,方芳.虚拟集群式旅游供应链模型构建研究[J].旅游学刊,2014,29(2):46-54. 被引量：32
9杨锦锋,于秋滨,关毅,蒋志鹏.电子病历命名实体识别和实体关系抽取研究综述[J].自动化学报,2014,40(8):1537-1562. 被引量：124
10高嘉伟,梁吉业,刘杨磊,李茹.一种基于Tri-training的半监督多标记学习文档分类算法[J].中文信息学报,2015,29(1):104-110. 被引量：8

引证文献6

1陶雯,王杉杉,李荣雨.基于多标记学习改进算法的入侵检测系统研究[J].自动化仪表,2017,38(9):57-60. 被引量：1
2马鸿超,张坤丽,赵悦淑,昝红英,庄雷.基于特征融合的产科多标记辅助诊断研究[J].中文信息学报,2018,32(5):128-136. 被引量：3
3黄琴,钱文彬,王映龙,吴兵龙.面向代价敏感的多标记不完备数据特征选择算法[J].小型微型计算机系统,2018,39(12):2617-2624. 被引量：5
4黄江东,邢进生.基于HHUI的旅游产品套餐模式挖掘[J].现代电子技术,2020,43(15):119-122.
5孙静,孙静宇,李璨,魏东.融合用户兴趣表征与注意力机制的推荐算法[J].计算机工程与设计,2021,42(3):814-821. 被引量：3
6庞渊源,田然,朱晓鸿,王鑫,陈鑫.基于动态路由胶囊架构的电网客服优化设计[J].电子设计工程,2021,29(7):152-156.

二级引证文献11

1冯伟.水利信息安全态势感知系统探讨[J].安徽水利水电职业技术学院学报,2019,19(3):28-31.
2金程笑,潘乔,张敬谊,俞春儒.一种基于树搜索的层次多标签乳腺疾病分类诊断方法[J].智能计算机与应用,2020,10(2):34-39. 被引量：1
3王一宾,吴陈,程玉胜,江健生.边缘标记弱化的多标记特征选择算法[J].数据采集与处理,2020,35(3):420-430. 被引量：1
4童瀛,周宇,姚焕章,梁剑,薛虎.深度神经网络的网络高敏感信息预警算法[J].西安工程大学学报,2021,35(1):69-74. 被引量：5
5朱方娥,郭建方,曹丽娜.基于分类规则挖掘的数据多标记特征分层识别[J].计算机仿真,2021,38(4):310-314. 被引量：3
6严远亭,戴涛,张以文,赵姝,张燕平.邻域感知的不平衡数据集过采样方法[J].小型微型计算机系统,2021,42(7):1360-1370. 被引量：4
7严华瑾,高峰.山西省国民体质监测数据平台的实现[J].体育科技文献通报,2021,29(9):59-61.
8邱劲.加速多标签特征提取的内核依赖最大化[J].苏州科技大学学报（工程技术版）,2021,34(4):71-80.
9单文琦,王波,黄青松,刘利军,黄冕.基于加权层级注意力机制的疾病预测模型[J].中文信息学报,2023,37(1):97-103. 被引量：2
10冯兴杰,张贺.结合用户长短期偏好的对话推荐方法[J].计算机工程与设计,2023,44(10):3160-3169.

1杨永.关于微粒群求解约束最优化罚函数的参数估计和统计分析[J].计算机工程与科学,2009,31(5):81-83. 被引量：1
2马炫,刘庆.多组播路由问题的粒子群优化算法[J].计算机研究与发展,2013,50(2):260-268. 被引量：5
3王春莲,马景奕.网格环境下基于惩罚策略的任务调度模型及动态算法[J].微电子学与计算机,2009,26(10):154-157. 被引量：2
4李艳玲,戴冠中,覃森.快速的文本倾向性分类方法(英文)[J].电子科技大学学报,2007,36(6):1232-1236. 被引量：2
5李卫平,杨杰,王钢.比例逆权重kNN算法及其流处理应用[J].计算机工程与设计,2015,36(12):3355-3358. 被引量：5
6WANG Wei,ZHOU ZhiHua.Learnability of multi-instance multi-label learning[J].Chinese Science Bulletin,2012,57(19):2488-2491. 被引量：2
7夏冰.基于MIDF(t)的短文本特征权重计算方法研究[J].黑龙江科学,2016,7(16):28-29. 被引量：1
8陈定三,杨慧中.一种基于改进加权粗糙集的多模型软测量建模方法[J].化工自动化及仪表,2010,37(1):11-15. 被引量：2
9万军洲,杨波,张明武,殷建军.一种基于惩罚区分度的P2P系统信任模型[J].计算机工程与应用,2007,43(20):124-127. 被引量：2
10陈小锋,史忠科.自适应惩罚策略及其在交通信号优化中的应用[J].计算机工程与应用,2008,44(26):5-7. 被引量：4

小型微型计算机系统

2017年第4期

浏览历史

内容加载中请稍等...

一种结合类别权重及多示例的多标记学习改进算法被引量：6

参考文献2

二级参考文献29

共引文献17

同被引文献42

引证文献6

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

一种结合类别权重及多示例的多标记学习改进算法 被引量：6

参考文献2

二级参考文献29

共引文献17

同被引文献42

引证文献6

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

一种结合类别权重及多示例的多标记学习改进算法被引量：6