-
题名基于标签相关性的类属属性多标签分类算法
被引量:12
- 1
-
-
作者
牟甲鹏
蔡剑
余孟池
徐建
-
机构
南京理工大学计算机科学与工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2020年第9期2656-2658,2673,共4页
-
基金
国家自然科学基金资助项目(61872186,61802205,91846104)。
-
文摘
多标签学习中一个样本可同时属于多个类别标签,每个标签都可能拥有反映该标签特定特点的特征,即类属属性,目前已经出现了基于类属属性的多标签分类算法LIFT。针对LIFT算法中未考虑标签之间相互关系的问题,提出一种基于标签相关性的类属属性多标签分类算法CLLIFT。该算法使用标签距离度量标签之间的相关性,通过在类属属性空间附加相关标签的方式完成标签相关性的引入,以达到提升分类性能的目的。在四个多标签数据集上的实验结果表明,所提算法与LIFT算法相比在多个多标签评价指标上平均提升21.1%。
-
关键词
标签相关性
类属属性
多标签学习
-
Keywords
label correlation
label-specific features
multi-label learning
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名噪声标签重标注方法
被引量:5
- 2
-
-
作者
余孟池
牟甲鹏
蔡剑
徐建
-
机构
南京理工大学计算机科学与工程学院
-
出处
《计算机科学》
CSCD
北大核心
2020年第6期79-84,共6页
-
基金
国家自然科学基金项目(61872186,61802205,91846104)。
-
文摘
样本标签的完整性对于有监督学习问题的分类精度有着显著影响,然而在现实数据中,由于标注过程的随机性和标注人员的不专业性等因素,数据标签不可避免地会受到噪声污染,即样本的观测标签不同于真实标签。为降低噪声标签对分类器分类精度的负面影响,文中提出一种噪声标签纠正方法,该方法利用基分类器对观测样本进行分类并估计噪声率,以识别噪声标签数据,再利用基分类器的分类结果对噪声标签样本进行重新标注,得到噪声标签样本被修正后的样本数据集。在合成数据集与真实数据集上的实验结果表明,该重标注算法在不同基分类器和不同噪声率干扰下对分类结果都有一定的提升作用,在合成数据集上对比无降噪声算法,其正确率提升5%左右,而在CIFAR和MNIST数据集上的高噪声率环境下,该重标注算法的F 1值比Elk08和Nat13平均高7%以上,比无噪声算法高53%。
-
关键词
噪声标签学习
重标注标签
逻辑回归
朴素贝叶斯
-
Keywords
Noisy label learning
Relabeling label
Logistic Regression
Naive Bayes
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名基于特征选择和标签相关性的多标签分类算法
被引量:4
- 3
-
-
作者
蔡剑
牟甲鹏
余孟池
徐建
-
机构
南京理工大学计算机科学与工程学院
-
出处
《计算机与数字工程》
2021年第10期1967-1972,1997,共7页
-
文摘
多标签分类在现实世界中有着广泛的应用,是当今机器学习领域的热点问题之一。多标签分类的代表性算法BR(Binary Relevance)虽有较多的改进工作,但大都仅针对标签相关性或特征选择中某一个方面进行改进,因此现有改进算法的性能仍存在提升空间。针对上述现状,论文提出一种基于特征选择和标签相关性的多标签分类算法,该算法先使用信息增益为每个标签选择与其相关的特征属性,而后采用新的控制结构的方式考虑标签相关性,最后使用新的特征集合为每个标签训练二分类器。在6个基准数据集上的实验结果表明,该算法在5种不同评价指标下的表现优于其它典型的BR改进算法。
-
关键词
分类
多标签学习
特征选择
标签相关性
-
Keywords
classification
multi-label learning
feature selection
label correlation
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-