-
题名融合标记独有属性特征的k近邻多标记分类新算法
被引量:8
- 1
-
-
作者
蒋芸
肖潇
侯金泉
陈莉
-
机构
西北师范大学计算机科学与工程学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2019年第3期513-519,共7页
-
基金
国家自然科学基金(61163036)
甘肃省科技计划资助自然科学基金(1606RJZA047)
+2 种基金
2012年度甘肃省高校基本科研业务费专项资金
甘肃省高校研究生导师项目(1201-16)
西北师范大学第三期知识与创新工程科研骨干项目(nwnu-kjcxgc-03-67)
-
文摘
在多标记学习系统中,每个样本同时与多个类别标记相关,却均由一个属性特征向量描述。大部分已有的多标记分类算法采用的共同策略是使用相同的属性特征集合预测所有的类别标记,但它并非最佳选择,原因在于每个标记可能与其自身独有的属性特征相关性最大。针对这一问题,提出了融合标记独有属性特征的k近邻多标记分类算法—IML-kNN。首先对多标记数据的特征向量进行预处理,分别为每类标记构造对该类标记最具有判别能力的属性特征;然后基于得到的属性特征使用改进后的ML-kNN算法进行分类。实验结果表明,IML-kNN算法在yeast和image数据集上的性能明显优于ML-kNN算法以及其他3种常用的多标记分类算法。
-
关键词
多标记学习
多标记k近邻
标记独有特征
标记相关性
-
Keywords
multi-label learning
ML-kNN
label specific feature
label correlation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于局部正、负标记相关性的k近邻多标记分类新算法
被引量:3
- 2
-
-
作者
蒋芸
肖潇
侯金泉
陈莉
-
机构
西北师范大学计算机科学与工程学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2019年第10期1854-1860,共7页
-
基金
国家自然科学基金(61163036)
甘肃省科技计划资助自然科学基金(1606RJZA047)
+2 种基金
2012年度甘肃省高校基本科研业务费专项资金
甘肃省高校研究生导师项目(1201-16)
西北师范大学第三期知识与创新工程科研骨干项目(nwnu-kjcxgc-03-67)
-
文摘
在多标记学习中,每个样本都由一个实例表示,并与多个类标记相关联。现有的多标记学习算法大多是在全局利用标记相关性,即假设所有的样本共享不同类别标记之间的正相关性。然而,在实际应用中,不同的样本共享不同的标记相关性,标记间不仅存在正相关性,而且存在相互排斥的现象,即负相关性。针对这一问题,提出了基于局部正、负成对标记相关性的k近邻多标记分类算法PNLC。首先,对多标记数据的特征向量进行预处理,分别为每类标记构造对该类标记最具有判别能力的属性特征;然后,在训练阶段,PNLC算法通过所有训练样本中各样本的每个k近邻的真实标记构建标记之间的正、负局部成对相关性矩阵;最后,在测试阶段,首先得到每个测试样例的k近邻及其对应的正、负成对标记关系,利用该标记关系计算最大后验概率对测试样例进行预测。实验结果表明,PNLC算法在yeast和image数据集上的分类准确率明显优于其他常用的多标记分类算法。
-
关键词
多标记学习
正、负相关性
标记独有特征
K近邻
-
Keywords
multi-label learning
positive and negative correlation
label specific feature
KNN
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-