-
题名基于标记因果顺序挖掘的多标记分类方法
被引量:2
- 1
-
-
作者
陈加略
姜远
-
机构
南京大学计算机科学与技术系
-
出处
《软件学报》
EI
CSCD
北大核心
2022年第4期1267-1273,共7页
-
基金
国家自然科学基金(61673201,61921006)。
-
文摘
在多标记学习(MLL)问题中,每个示例都与一组标记相关联.为了实现对未见示例的高效预测,挖掘和利用标记之间的关系是至关重要的.大多数已有的研究都将关系简化为标记之间的相关性,而相关性又通常基于标记的共现性.揭示了因果关系对于描述一个标记在学习过程中如何帮助另一个标记更为重要.基于这一观察,提出了两种策略来从标记因果有向无环图(DAG)中生成标记的因果顺序,同时使得生成的因果顺序都遵循因标记应该在果标记之前的准则.第1种策略的主要思想是对随机顺序进行排序,使其满足DAG中的因果关系.而第2种策略的主要思想是根据DAG的结构,将标记放入许多不相交的拓扑层次中,再通过它们的拓扑结构进行排序.进一步,通过将因果顺序纳入到分类器链(CC)模型中,提出了一种有效的MLL方法,从而从更加本质的角度来利用标记关系.在多个数据集上的实验结果验证了该方法确实能够挖掘出有效的标记因果顺序,并帮助提升学习性能.
-
关键词
多标记学习
因果
标记顺序
有向无环图
分类器链
-
Keywords
multi-label learning
causality
label-order
directed acyclic graph
classifier chain
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名最优间隔分布脊回归
被引量:1
- 2
-
-
作者
陈加略
姜远
-
机构
计算机软件新技术国家重点实验室(南京大学)
软件新技术与产业化协同创新中心
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2017年第8期1744-1750,共7页
-
基金
国家自然科学基金项目(61673201)~~
-
文摘
脊回归(ridge regression,RR)是经典的机器学习算法之一,广泛应用于人脸识别、基因工程等诸多领域.其具有优化目标凸、存在闭合解、可解释性强以及易于核化等优点,但是脊回归的优化目标并没有考虑样本之间的结构关系.监督流形正则化学习是最具代表性的、最成功的脊回归正则化方法之一,其通过最小化每类类内方差来考虑样本之间的类内结构关系,可是单纯地只考虑类内结构仍然不够全面.以一种全新的视角重新审视最近提出的"最优间隔分布学习"原理,发现了最优间隔分布的目标可以同时优化类内间隔方差和类间间隔方差,从而同时优化了局部的类内结构和全局的类间结构.基于此提出了一种充分考虑数据结构化特征的脊回归算法——最优间隔分布脊回归(optimal margin distributionmachine ridge regression,ODMRR)算法,该算法具有RR以及MRRR(manifold regularization ridge regression)的各种优势.最后通过实验验证了该方法具有优越的性能.
-
关键词
脊回归
流形正则化
最优间隔分布
间隔方差
全局结构
-
Keywords
ridge regression(RR)
manifold regularization
optimal margin distribution machine(ODM)
margin variance
global structure
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-