基于划分子集主题模型的多标签极限分类被引量：1

Multi-label extreme classification based on subset topic model

下载PDF

导出

摘要在多标签分类任务中随着标签数量的增多,传统的基于隐含狄利克雷分布模型的方法往往会遇到可扩展性问题。为解决这一问题,提出一种基于划分子集的带标签隐含狄利克雷模型。通过对数据划分子集降低算法的时间复杂度,在标签规模达到成百上千时灵活扩展模型,提高传统带标签狄利克雷模型的预测准确率。该方法被部署于大规模实验数据集上,与多个经典方法进行比对,实验结果表明,该方法具有良好的准确率和效率,是解决多标签学习问题的有效工具。 In multi-label classification task,the traditional latent Dirichlet allocation based model often face scalability problems when the number of labels increases.A subset labeled latent Dirichlet allocation model was proposed.By dividing the data into subsets,the time complexity of the algorithm was reduced.Moreover,it adaptively scaled up when labels were tens of thousands.The proposed method was implemented in a huge dataset.Experimental result shows that,compared with several classic models,the proposed method has good accuracy and efficiency.It is a useful tool in multi-label learning tasks.

作者杨菊英刘燚罗佳 YANG Ju-ying;LIU Yi;LUO Jia(Department of Computer Science,Chengdu College of University of Electronic Science and Technology of China,Chengdu 611731,China;School of Computer Science,China West Normal University,Nanchong 637009,China)

机构地区电子科技大学成都学院计算机系西华师范大学计算机学院

出处《计算机工程与设计》北大核心 2020年第12期3432-3437,共6页 Computer Engineering and Design

基金四川省科技厅基金项目(172102210594)。

关键词带标签隐含狄利克雷模型多标签学习极限分类划分子集时间复杂度 labeled latent Dirichlet allocation multi-label learning extreme classification subsetting time complexity

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1蒋权,郑山红,刘凯,李万龙.DOLDA模型设计与主题演化分析[J].计算机工程与设计,2018,39(2):446-451. 被引量：3
2姜思羽,钟晓玲,邱少健,宋恒杰.结合标签相关性和不均衡性的多标签学习模型[J].哈尔滨工业大学学报,2019,51(1):142-149. 被引量：5
3沈思,吴玺煜.基于多标签分类的学术文献潜在时间意图识别研究[J].湖南大学学报（自然科学版）,2017,44(10):158-164. 被引量：2
4李杰龙,肖燕珊,郝志峰,阮奕邦,张丽阳.基于SVM的多示例多标签主动学习[J].计算机工程与设计,2016,37(1):254-258. 被引量：4
5宋攀,景丽萍.基于神经网络探究标签依赖关系的多标签分类[J].计算机研究与发展,2018,55(8):1751-1759. 被引量：16

二级参考文献16

1Zhou Zhihua,Zhang Minling,Huang Shengjun.Multi-instance multi-label learning[J].Artificial Intelligence,2012,176(1):2291-2230.
2Huang Shengjun,Jin Rong,Zhou Zhihua.Active learning by querying information and representative examples[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2014,36(10):1936-1949.
3Liu Dong,Hua Xiansheng,Yang Linjun.Multiple-instance active learning for image categorization[C]//15th International Multimedia Modeling Conference on Advances in Multimedia Modeling,2009:239-249.
4Singh M,Curran E,Cunningham P.Active learning for multilabel image annotation[C]//19th Irish Conference on Artificial Intelligence and Cognitive Science,2008:173-182.
5Lin Xin,Guo Yuhong.Active learning with multi-label SVM classification[C]//Proceedings of the Twenty-Third International Joint Conference on Artificial Intelligence,2013:1479-1485.
6Mathias M Adankon,Mohamed Cheriet.Support vector machine[M]//Encyclopedia of Biometrics.New York:Springer,2014:1-9.
7Shen Zhongjie,Chen Xuefeng,Zhang Xiaoli,et al.A novel intelligent gear fault diagnosis model based on EMD and multiclass TSVM[J].Measurement:Journal of the International Measurement Confederation,2012,45(1):30-40.
8Yang Xi,Liu Jianyi,Ma Ya,et al.Facial age estimation from web photos using multiple-instance learning[C]//IEEE International Conference on Multimedia and Expo,2014:1-6.
9Zhou Zhihua,Sun Yuyin,Li Yufeng,et al.Multi-instance learning by treating instances as non-i.i.d.samples[C]//26th International Conference on Machine Learning.New York:ACM,2009:249-1256.
10Schapire RE,Singer Y.BoosTexter:A boosting-based system for text categorization[J].Machine Learning,2009,39(2):135-168.

共引文献25

1刘娜,毛晓菊,吴敏.集群分类映射的文本多标签模糊关联降维聚类[J].计算机工程与设计,2017,38(6):1657-1663. 被引量：4
2邓曦辉,赵丽.树形层次结构的非平衡SVM分类方法[J].计算机工程与设计,2017,38(8):2269-2275. 被引量：2
3张扬武,李国和,王立梅.基于关键词加权的法律文本主题模型研究[J].计算机与数字工程,2019,47(5):1170-1174.
4朱江,王婷婷.基于BN-DBN的网络安全态势要素获取机制[J].计算机应用,2019,39(A01):100-104. 被引量：3
5康世泽,吉立新,刘树新,丁悦航.一种基于实体描述和知识向量相似度的跨语言实体对齐模型[J].电子学报,2019,47(9):1841-1847. 被引量：2
6刘晓玲,刘柏嵩,王洋洋,唐浩.基于深度学习的多标签生成研究进展[J].计算机科学,2020,47(3):192-199. 被引量：7
7赵海英,周伟,侯小刚,齐光磊.多标签分类的传统民族服饰纹样图像语义理解[J].光学精密工程,2020,28(3):695-703. 被引量：7
8刘国玉,王东颖,候桂军.基于改进VGGNet-16网络新生儿胆红素水平测量方法[J].计算机测量与控制,2020,28(7):55-58. 被引量：2
9王敏蕊,高曙,袁自勇,袁蕾.基于动态路由序列生成模型的多标签文本分类方法[J].计算机应用,2020,40(7):1884-1890. 被引量：7
10李阿勇,税雪,宋志伟.数据标签研究与应用[J].电力大数据,2020,23(6):69-74. 被引量：5

同被引文献4

1檀何凤,刘政怡.基于标签相关性的K近邻多标签分类方法[J].计算机应用,2015,35(10):2761-2765. 被引量：10
2肖琳,陈博理,黄鑫,刘华锋,景丽萍,于剑.基于标签语义注意力的多标签文本分类[J].软件学报,2020,31(4):1079-1089. 被引量：50
3王敏蕊,高曙,袁自勇,袁蕾.基于动态路由序列生成模型的多标签文本分类方法[J].计算机应用,2020,40(7):1884-1890. 被引量：7
4姚佳奇,徐正国,燕继坤,熊钢,李智翔.基于标签语义相似的动态多标签文本分类算法[J].计算机工程与应用,2020,56(19):94-98. 被引量：10

引证文献1

1吕学强,彭郴,张乐,董志安,游新冬.融合BERT与标签语义注意力的文本多标签分类方法[J].计算机应用,2022,42(1):57-63. 被引量：11

二级引证文献11

1姜鹏.基于BERT的《中图法》文本分类系统及其影响因素分析[J].图书馆研究与工作,2022(5):43-48. 被引量：2
2于敬,石京京,刘文海.基于文本语义匹配的物品相关推荐算法[J].电子技术与软件工程,2022(7):206-211. 被引量：1
3彭玉芳,石进,徐浩,杨海平.基于BERT和分面分类的多标签的南海证据性数据分类研究[J].图书馆杂志,2022,41(5):102-108. 被引量：3
4赵金榜,秦绍伟,武浩.聚类感知的文本多标签分类模型[J].云南大学学报（自然科学版）,2022,44(5):902-911. 被引量：1
5田雨薇,张智.基于标签推理和注意力融合的多标签文本分类方法[J].计算机应用研究,2022,39(11):3315-3319. 被引量：1
6马雨萌,黄金霞,王昉,芮啸.融合BERT与多尺度CNN的科技政策内容多标签分类研究[J].情报杂志,2022,41(11):157-163. 被引量：4
7张猛.基于医疗BERT的电子病历命名实体识别[J].信息技术与信息化,2023(2):122-125.
8张思阳,魏苏波,孙争艳,张顺香,朱广丽,吴厚月.基于多标签Seq2Seq模型的情绪-原因对提取模型[J].数据分析与知识发现,2023,7(2):86-96.
9张全,赵郭燚,苏媛,朱元极,任海洋.基于改进Bert-AutoML的电力文本语义识别算法[J].电子设计工程,2024,32(4):43-46.
10徐江玲,陈兴荣.基于层级图标签表示网络的多标签文本分类[J].计算机应用研究,2024,41(2):388-392.

1余安祺,李略.基于深度神经网络主题模型的城市功能区分类方法设计[J].区域治理,2020(17):0195-0195.
2罗琪.以深度学习方法为载体的医学影像实时变化检测算法分析[J].粘接,2020,44(12):132-135. 被引量：3
3周晓清,叶安胜,张志强.加权互斥最大集合覆盖问题的精确算法[J].计算机工程与设计,2020,41(12):3412-3418. 被引量：1
4谢乐,衡熙丹,刘洋,蒋启龙,刘东.基于线性判别分析和分步机器学习的变压器故障诊断[J].浙江大学学报（工学版）,2020,54(11):2266-2272. 被引量：23
5吕鹏飞,闫云聚,荔越.基于马氏距离的改进核Fisher化工故障诊断研究[J].自动化学报,2020,46(11):2379-2391. 被引量：6
6周凯,任怡,汪哲,管剑波,张芳,赵言亢.基于主题模型的Ubuntu操作系统缺陷报告的分类及分析[J].计算机科学,2020,47(12):35-41. 被引量：2
7杨秋明.长江下游地区50-80天降水低频分量次季节预测模型实验数据集[J].全球变化数据学报（中英文）,2018(2):168-172.
8王江涛,周梦园,陈东,蔡丽娟.非正交多址认知无线电网络功率分配算法[J].重庆邮电大学学报（自然科学版）,2020,32(6):945-953. 被引量：7
9李钢,王聿达,崔蓉.KiC:一种结合“结构洞”约束值与K壳分解的社交网络关键节点识别算法[J].现代情报,2020,40(12):27-35. 被引量：2
10林方丽,王光杰,杨晓勇.皖南乌溪多金属矿区综合电磁法数据集[J].全球变化数据学报（中英文）,2018(2):184-189.

计算机工程与设计

2020年第12期

浏览历史

内容加载中请稍等...

基于划分子集主题模型的多标签极限分类被引量：1

参考文献5

二级参考文献16

共引文献25

同被引文献4

引证文献1

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于划分子集主题模型的多标签极限分类 被引量：1

参考文献5

二级参考文献16

共引文献25

同被引文献4

引证文献1

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于划分子集主题模型的多标签极限分类被引量：1