基于标签相关性的K近邻多标签学习被引量：3

K-Nearest Neighbor Multi-Label Learning Based on Label Correlation

下载PDF

导出

摘要多标签学习是机器学习领域的一个研究热点,其能够有效解决真实世界中的多语义问题。在多标签学习任务中,样本的多个标签之间存在一定的关联关系,忽略标签间的相关性会导致模型的泛化性能降低。提出一种基于标签间相关性的多标签学习K近邻算法。充分挖掘样本多标签间的相关性,通过Fp_growth算法得到标签的频繁项集。针对频繁项和标签分别构建评分模型和阈值模型,评分模型用于衡量样本与频繁项或标签之间的关联程度,阈值模型用于求解频繁项或标签对应的判别阈值,结合评分模型和阈值模型对样本所属频繁项进行预测,进而确定样本标签集。在经典数据集Emotions和Scene上的实验结果表明,该算法的F1-Measure指标分别达到66.6%和73.3%,相比CC、LP、RAKEL、MLDF等基准方法,其F1-Measure分别平均提高3.8和2.1个百分点,该算法通过合理利用标签间的相关性使得分类性能得到有效提升。 Multi-label learning is a popular research topic in the field of machine learning.It can effectively solve multilingualism in the real world.In multi-label learning,a certain correlation exists between multiple labels of the sample.Ignoring the correlation between labels reduces the generalization performance of the model.Concerning multi-label learning,a multilabel learning,K-nearest neighbor algorithm based on the correlation between labels is proposed to fully excavate the correlation between multiple labels of samples,using the Fp_growth algorithm to obtain the frequent item-sets of tags.For frequent items and labels,the scoring and threshold models are constructed.The scoring model measures the correlation between the sample and frequent items or labels.The threshold model solves the discrimination threshold corresponding to frequent items or labels.Combining these models,the frequent items of the sample are predicted,and the sample label set is then determined.The results on the classical Emotions and Scene datasets show that the F1-Measure index of the algorithm achieved 66.6% and 73.3%,respectively.Compared with benchmark methods,such as CC,LP,RAKE,and MLDF,the F1-Measure of the algorithm improved by an average of 3.8 and 2.1 percentage points.The algorithm effectively improves the classification performance by rationally using the correlation between labels.

作者钱龙赵静韩京宇毛毅 QIAN Long;ZHAO Jing;HAN Jingyu;MAO Yi(School of Computer Science,Nanjing University of Posts and Telecommunications,Nanjing 210023,China)

机构地区南京邮电大学计算机学院

出处《计算机工程》 CAS CSCD 北大核心 2022年第6期73-78,88,共7页 Computer Engineering

基金国家自然科学基金(62002174)。

关键词机器学习多标签学习标签相关性 K近邻频繁项集 machine learning multi-label learning label correlation K-nearest neighbor frequent item-sets

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1王进,徐巍,丁一,孙开伟,王利蕾.基于图嵌入和区域注意力的多标签文本分类[J].江苏大学学报（自然科学版）,2022,43(3):310-318. 被引量：15

二级参考文献5

1赵容梅,熊熙,琚生根,李中志,谢川.基于混合神经网络的中文隐式情感分析[J].四川大学学报（自然科学版）,2020,57(2):264-270. 被引量：20
2汪嘉伟,杨煦晨,琚生根,袁宵,谢正文.基于卷积神经网络和自注意力机制的文本分类模型[J].四川大学学报（自然科学版）,2020,57(3):469-475. 被引量：25
3刘纵横,汪海涛,姜瑛,陈星.基于混合神经网络的序列推荐算法[J].重庆邮电大学学报（自然科学版）,2021,33(3):466-474. 被引量：11
4刘利军,王州,余臻.一种改进的深度确定性策略梯度网络交通信号控制系统[J].四川大学学报（自然科学版）,2021,58(4):87-93. 被引量：8
5王进,孙万彤.基于相关性分析的多标签特征选择方法[J].重庆邮电大学学报（自然科学版）,2021,33(6):1024-1037. 被引量：3

共引文献14

1孙凯,刘宣彤,张莉,刘华虓,王禹,郜山权.基于词向量的npm包推荐标签方法[J].吉林大学学报（理学版）,2022,60(5):1097-1102.
2耿莉,王长鹏.基于多样性的一致谱嵌入学习[J].吉林大学学报（理学版）,2022,60(5):1133-1142. 被引量：1
3刘博,蒲亦非.基于BERT的长文本分类方法[J].四川大学学报（自然科学版）,2023,60(2):75-82. 被引量：7
4张思阳,魏苏波,孙争艳,张顺香,朱广丽,吴厚月.基于多标签Seq2Seq模型的情绪-原因对提取模型[J].数据分析与知识发现,2023,7(2):86-96.
5李肃义,张欣雨,杨强,张熠,刁庶.一种MCSEM数据噪声压制方法[J].吉林大学学报（理学版）,2023,61(4):929-936.
6芮正玉,方晨,丁頠洋,曹劲然,苏雪阳,刘建飞.基于时序集成图谱和图嵌入的突发事件预警方法[J].指挥信息系统与技术,2023,14(4):38-44.
7蔡梓豪,姜屹,张来平,邓小刚.基于卷积注意力网络的网格质量评价方法[J].四川大学学报（自然科学版）,2023,60(5):133-142. 被引量：1
8利铭,卓志权,张军徽.基于应变场的卷积神经网络岩石裂缝识别方法[J].煤炭科技,2023,44(5):17-23.
9刘勇,杜建强,罗计根,李清,于梦波,郑奇民.基于语义筛选的ALBERT-TextCNN中医文本多标签分类研究[J].现代信息科技,2023,7(19):123-128. 被引量：2
10马月坤,郝益锋.考虑特征稀疏特性的短文本命名实体快速识别方法[J].吉林大学学报（工学版）,2023,53(12):3529-3535.

同被引文献4

1王晶晶,杨有龙.针对弱标记数据的多标签分类算法[J].计算机工程与应用,2020,56(5):65-73. 被引量：8
2罗森林,王海州,潘丽敏,孙晓光.融合样本相似性的弱监督多标签分类[J].北京理工大学学报,2021,41(7):745-751. 被引量：2
3刘依璐,曹付元.含缺失标签的大规模多标签分类算法[J].计算机工程与应用,2022,58(17):148-157. 被引量：2
4欧阳宵,陶红,范瑞东,矫媛媛,侯臣平.利用标签相关性先验的弱监督多标签学习方法[J].软件学报,2023,34(4):1732-1748. 被引量：5

引证文献3

1田小瑜,秦永彬,黄瑞章,陈艳平.基于相关性约束矩阵分解的多标签分类方法[J].南京大学学报（自然科学版）,2023,59(1):76-84.
2刘夫享,钟连鑫,李敬,王硕,陈春梅.基于柔性神经树的多标签学习方法[J].电脑编程技巧与维护,2024(4):41-43.
3王甜甜,张曦林,薛闯,卫国,谢小良.同时诊断多种精神障碍:基于标签相关性的K近邻多标签学习[J].系统科学与数学,2024,44(9):2564-2576.

1池鸿源,蔡汝健.基于5G技术的智慧乡村综合信息管理系统设计[J].长江信息通信,2022,35(3):179-181.
2谢京华.一种基于运动目标的关联规则分析新方法及其在目标识别中的应用[J].电子世界,2021(9):99-101. 被引量：1
3廖健熙,吕勇,王振宇,赵凯.基于随机森林算法的脑电情绪识别研究[J].电脑与信息技术,2022,30(3):1-4. 被引量：3
4黄晶,彭扬,黄烨,彭晓燕.考虑噪声标签影响的驾驶员精神负荷状态评价[J].汽车工程,2022,44(5):771-777. 被引量：1
5宋相兵,季玉龙,俎文强,何扬,杨红雨.基于触觉传感器和强化学习内在奖励的机械臂抓取方法[J].四川大学学报（自然科学版）,2022,59(3):53-62. 被引量：2
6杨波,李远彪.数据科学与大数据技术课程体系的复杂网络分析[J].计算机科学,2022,49(S01):680-685. 被引量：10
7熊中敏,舒贵文,郭怀宇.融合用户偏好的图神经网络推荐模型[J].计算机科学,2022,49(6):165-171. 被引量：2
8左佳倩,王煜凯,王红球,耿琳.基于卷积神经网络特征提取的拉曼光谱分类研究[J].光散射学报,2022,34(1):1-5. 被引量：5
9张晋,唐进,尹建芹.面向人体动作预测的对称残差网络[J].机器人,2022,44(3):291-298.
10郭瑞.性行为有三种形式[J].养生保健指南,2022(5):78-78.

计算机工程

2022年第6期

浏览历史

内容加载中请稍等...

基于标签相关性的K近邻多标签学习被引量：3

参考文献1

二级参考文献5

共引文献14

同被引文献4

引证文献3

相关作者

相关机构

相关主题

浏览历史

基于标签相关性的K近邻多标签学习 被引量：3

参考文献1

二级参考文献5

共引文献14

同被引文献4

引证文献3

相关作者

相关机构

相关主题

浏览历史

基于标签相关性的K近邻多标签学习被引量：3