期刊文献+
共找到28篇文章
< 1 2 >
每页显示 20 50 100
结合双流形映射的不完备多标签学习
1
作者 许智磊 黄睿 《计算机工程》 CAS CSCD 北大核心 2024年第4期104-112,共9页
在多标签学习中,有效利用标签相关性可以提高分类性能。然而,由于人工标注标签的主观性和实际应用中标签语义的相似性,通常只能观察到不完备的标签空间,导致标签相关性的估计不准确,使得算法性能下降。针对该问题,提出一种结合双流形映... 在多标签学习中,有效利用标签相关性可以提高分类性能。然而,由于人工标注标签的主观性和实际应用中标签语义的相似性,通常只能观察到不完备的标签空间,导致标签相关性的估计不准确,使得算法性能下降。针对该问题,提出一种结合双流形映射的不完备多标签学习(ML-DMM)算法。构造两种流形映射,一种是保留实例数据空间局部结构信息的特征流形映射,另一种是基于迭代学习得到的标签相关性的标签流形映射。首先通过拉普拉斯映射构造数据的低维流形,然后通过回归系数矩阵和标签相关性矩阵将初始特征空间和初始标签空间分别映射到该低维流形上,形成一种双流形映射结构来提升算法性能,最后利用迭代学习得到的回归系数矩阵进行多标签分类。在8个多标签数据集及3种标签缺失率情况下的对比实验结果表明,ML-DMM算法性能优于其他针对缺失标签的多标签分类算法。 展开更多
关键词 多标签学习 缺失标签 标签相关性 低维流形 双流形映射
下载PDF
The multilabel fault diagnosis model of bearing based on integrated convolutional neural network and gated recurrent unit
2
作者 Shanling Han Shoudong Zhang +1 位作者 Yong Li Long Chen 《International Journal of Intelligent Computing and Cybernetics》 EI 2022年第3期401-413,共13页
Purpose-Intelligent diagnosis of equipment faults can effectively avoid the shutdown caused by equipment faults and improve the safety of the equipment.At present,the diagnosis of various kinds of bearing fault inform... Purpose-Intelligent diagnosis of equipment faults can effectively avoid the shutdown caused by equipment faults and improve the safety of the equipment.At present,the diagnosis of various kinds of bearing fault information,such as the occurrence,location and degree of fault,can be carried out by machine learning and deep learning and realized through the multiclassification method.However,the multiclassification method is not perfect in distinguishing similar fault categories and visual representation of fault information.To improve the above shortcomings,an end-to-end fault multilabel classification model is proposed for bearing fault diagnosis.Design/methodology/approach-In this model,the labels of each bearing are binarized by using the binary relevance method.Then,the integrated convolutional neural network and gated recurrent unit(CNN-GRU)is employed to classify faults.Different from the general CNN networks,the CNN-GRU network adds multiple GRU layers after the convolutional layers and the pool layers.Findings-The Paderborn University bearing dataset is utilized to demonstrate the practicability of the model.The experimental results show that the average accuracy in test set is 99.7%,and the proposed network is better than multilayer perceptron and CNN in fault diagnosis of bearing,and the multilabel classification method is superior to the multiclassification method.Consequently,the model can intuitively classify faults with higher accuracy.Originality/value-The fault labels of each bearing are labeled according to the failure or not,the fault location,the damage mode and the damage degree,and then the binary value is obtained.The multilabel problem is transformed into a binary classification problem of each fault label by the binary relevance method,and the predicted probability value of each fault label is directly output in the output layer,which visually distinguishes different fault conditions. 展开更多
关键词 Intelligent fault diagnosis Bearing fault multilabel classification CNN-GRU Binary relevance method
原文传递
基于ReliefF和最大相关最小冗余的多标记特征选择 被引量:4
3
作者 孙林 徐枫 +1 位作者 李硕 王振 《河南师范大学学报(自然科学版)》 CAS 北大核心 2023年第6期21-29,F0002,共10页
针对现有的特征选择模型未涉及特征和标记集之间的相关度,造成分类精度偏低等情况,提出了基于ReliefF和最大相关最小冗余(maximum Relevance and Minimum Redundancy,mRMR)的多标记特征选择.首先,运用互信息计算每个标记和标记集之间的... 针对现有的特征选择模型未涉及特征和标记集之间的相关度,造成分类精度偏低等情况,提出了基于ReliefF和最大相关最小冗余(maximum Relevance and Minimum Redundancy,mRMR)的多标记特征选择.首先,运用互信息计算每个标记和标记集之间的相关度,使用每项相关度占其相关度之和的比例设计了标记权重,由此构建了特征和标记集间的相关度,初选与标记集相关度高的特征;其次,计算对象在特征上的距离,构建了新的特征权值更新公式,基于标记权重改进多标记ReliefF模型.然后,基于互信息和标记权重构建了最大相关性,设计了最小冗余性及其新的最大相关最小冗余评价准则,并将其应用于多标记特征选择,进一步剔除冗余特征;最后,设计了一种基于ReliefF和最大相关最小冗余的多标记特征选择算法,有效提高了多标记分类性能.在8个多标记数据集上测试所提算法的平均分类精度、覆盖率、汉明损失、1错误率和排序损失,实验结果证明了该算法的有效性. 展开更多
关键词 多标记学习 特征选择 标记权重 RELIEFF 最大相关最小冗余
下载PDF
基于互信息的Fisher Score多标记特征选择 被引量:2
4
作者 孙林 张起峰 徐久成 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第1期55-66,共12页
目前,Fisher Score模型在处理多标记数据时没有考虑样本和整个特征空间之间以及特征和标记之间的关系.提出一种基于互信息的Fisher Score多标记特征选择方法.首先,在多标记决策系统中考虑整个样本空间对特征选择的影响,根据异类样本与... 目前,Fisher Score模型在处理多标记数据时没有考虑样本和整个特征空间之间以及特征和标记之间的关系.提出一种基于互信息的Fisher Score多标记特征选择方法.首先,在多标记决策系统中考虑整个样本空间对特征选择的影响,根据异类样本与同类样本之间的欧式距离定义权重公式,并在特征空间下对标记赋予权重衡量标记的重要程度.然后,基于互信息理论定义特征与每个标记之间的互信息来计算每个特征和每个标记之间的相关度,将特征与标记之间的相关度与该标记所占的权重相结合来定义特征和标记集之间的总相关度.将Fisher得分与总相关度结合,定义每个特征的新的Fisher得分,进而构建多标记Fisher Score模型.最后,设计了一种基于互信息的Fisher Score多标记特征选择算法.在六个多标记数据集上的实验证明,提出的算法与其他算法相比,其四种评价指标都表现良好,分类性能出色. 展开更多
关键词 多标记学习 特征选择 互信息 Fisher Score
下载PDF
A Novel Metadata Based Multi-Label Document Classification Technique
5
作者 Naseer Ahmed Sajid Munir Ahmad +13 位作者 Atta-ur Rahman Gohar Zaman Mohammed Salih Ahmed Nehad Ibrahim Mohammed Imran BAhmed Gomathi Krishnasamy Reem Alzaher Mariam Alkharraa Dania AlKhulaifi Maryam AlQahtani Asiya A.Salam Linah Saraireh Mohammed Gollapalli Rashad Ahmed 《Computer Systems Science & Engineering》 SCIE EI 2023年第8期2195-2214,共20页
From the beginning,the process of research and its publication is an ever-growing phenomenon and with the emergence of web technologies,its growth rate is overwhelming.On a rough estimate,more than thirty thousand res... From the beginning,the process of research and its publication is an ever-growing phenomenon and with the emergence of web technologies,its growth rate is overwhelming.On a rough estimate,more than thirty thousand research journals have been issuing around four million papers annually on average.Search engines,indexing services,and digital libraries have been searching for such publications over the web.Nevertheless,getting the most relevant articles against the user requests is yet a fantasy.It is mainly because the articles are not appropriately indexed based on the hierarchies of granular subject classification.To overcome this issue,researchers are striving to investigate new techniques for the classification of the research articles especially,when the complete article text is not available(a case of nonopen access articles).The proposed study aims to investigate the multilabel classification over the available metadata in the best possible way and to assess,“to what extent metadata-based features can perform in contrast to content-based approaches.”In this regard,novel techniques for investigating multilabel classification have been proposed,developed,and evaluated on metadata such as the Title and Keywords of the articles.The proposed technique has been assessed for two diverse datasets,namely,from the Journal of universal computer science(J.UCS)and the benchmark dataset comprises of the articles published by the Association for computing machinery(ACM).The proposed technique yields encouraging results in contrast to the state-ofthe-art techniques in the literature. 展开更多
关键词 multilabel classification INDEXING METADATA content/data mining
下载PDF
基于Fisher score与模糊邻域熵的多标记特征选择算法 被引量:2
6
作者 孙林 马天娇 薛占熬 《计算机应用》 CSCD 北大核心 2023年第12期3779-3789,共11页
针对Fisher score未充分考虑特征与标记以及标记之间的相关性,以及一些邻域粗糙集模型容易忽略边界域中知识粒的不确定性,导致算法分类性能偏低等问题,提出一种基于Fisher score与模糊邻域熵的多标记特征选择算法(MLFSF)。首先,利用最... 针对Fisher score未充分考虑特征与标记以及标记之间的相关性,以及一些邻域粗糙集模型容易忽略边界域中知识粒的不确定性,导致算法分类性能偏低等问题,提出一种基于Fisher score与模糊邻域熵的多标记特征选择算法(MLFSF)。首先,利用最大信息系数(MIC)衡量特征与标记之间的关联程度,构建特征与标记关系矩阵;基于修正余弦相似度定义标记关系矩阵,分析标记之间的相关性。其次,给出一种二阶策略获得多个二阶标记关系组,以此重新划分多标记论域;通过增强标记之间的强相关性和削弱标记之间的弱相关性得到每个特征的得分,进而改进Fisher score模型,对多标记数据进行预处理。再次,引入多标记分类间隔,定义自适应邻域半径和邻域类并构造了上、下近似集;在此基础上提出了多标记粗糙隶属度函数,将多标记邻域粗糙集映射到模糊集,基于多标记模糊邻域给出了上、下近似集以及多标记模糊邻域粗糙集模型,由此定义模糊邻域熵和多标记模糊邻域熵,有效度量边界域的不确定性。最后,设计基于二阶标记相关性的多标记Fisher score特征选择算法(MFSLC),从而构建MLFSF。在多标记K近邻(MLKNN)分类器下11个多标记数据集上的实验结果表明,相较于ReliefF多标记特征选择(MFSR)等6种先进算法,MLFSF的平均分类精度(AP)的均值提高了2.47~6.66个百分点;同时,在多数数据集上,MLFSF在5个评价指标上均能取得最优值。 展开更多
关键词 多标记学习 特征选择 Fisher score 多标记模糊邻域粗糙集 模糊邻域熵
下载PDF
软多标签和深度特征融合的无监督行人重识别 被引量:6
7
作者 张宝华 朱思雨 +6 位作者 吕晓琪 谷宇 王月明 刘新 任彦 李建军 张明 《光电工程》 CAS CSCD 北大核心 2020年第12期13-22,共10页
跨摄像头场景中依赖面向标签映射关系的学习以提高识别精度,有监督行人重识别模型虽然识别精度较好,但存在可扩展问题,诸如算法识别精度严重依赖有效的监督信息,算法实时性差等;针对上述问题,提出一种基于软多标签的无监督行人重识别算... 跨摄像头场景中依赖面向标签映射关系的学习以提高识别精度,有监督行人重识别模型虽然识别精度较好,但存在可扩展问题,诸如算法识别精度严重依赖有效的监督信息,算法实时性差等;针对上述问题,提出一种基于软多标签的无监督行人重识别算法。为了提高标签匹配精度,首先利用软多标签逼近真实标签,通过计算参考数据集和参考代理在软多标签函数中的损失函数,预训练参考数据集,并构建预训练与训练结果的映射模型。再通过生成数据和真实数据分布的最小距离的期望即简化的2-Wasserstein距离计算相机视图中软多标签均值和标准差得到损失函数,解决跨视域标签一致性问题。为了提高软多标签对未标记目标数据集的有效性,计算联合嵌入损失,挖掘不同类别间的相似对,纠正跨域分布错位。针对残差网络训练时长和无监督学习精度低的问题,通过结合压缩激励网络(SENet)和多层级深度特征融合改进残差网络的结构,提高训练速度和精度。实验结果表明,该方法在标准数据集下的首位命中率和平均精度均值优于先进相关算法。 展开更多
关键词 残差网络 行人重识别 软多标签 无监督 深度特征
下载PDF
免疫分析法进展 被引量:12
8
作者 杨晓达 常文保 慈云祥 《化学进展》 SCIE CAS CSCD 1995年第2期83-97,共15页
本文首先从试剂分析的观,点对免疫分析的原理进行了论述,对抗体作为分析试剂进行了评价并且总结了标记免疫分析的三种方式和四个环节;其次,对免疫分析的现状作了综述,并评述了当代免疫分析的五个热点:基因工程抗体,生物素。亲合... 本文首先从试剂分析的观,点对免疫分析的原理进行了论述,对抗体作为分析试剂进行了评价并且总结了标记免疫分析的三种方式和四个环节;其次,对免疫分析的现状作了综述,并评述了当代免疫分析的五个热点:基因工程抗体,生物素。亲合素多重标记体系,时间分辨荧光免疫分析,多组分免疫分析和自动化免疫分析;最后,对免疫分析的发展趋势作了讨论。 展开更多
关键词 免疫分析 抗体 基因工程抗体 多重标记
下载PDF
基于农业网络信息分类的热词自动提取方法 被引量:6
9
作者 段青玲 张璐 +1 位作者 刘怡然 王沙沙 《农业机械学报》 EI CAS CSCD 北大核心 2018年第7期160-167,共8页
热词提取对于监控和分析农业舆情具有重要意义,目前已有一定研究基础,但仍存在针对性差等问题,无法满足农业领域不同产业用户群的个性化需求,为此,提出一种基于农业网络信息分类的热词自动提取方法。首先采用多标记分类算法对文本语料... 热词提取对于监控和分析农业舆情具有重要意义,目前已有一定研究基础,但仍存在针对性差等问题,无法满足农业领域不同产业用户群的个性化需求,为此,提出一种基于农业网络信息分类的热词自动提取方法。首先采用多标记分类算法对文本语料进行分类,按分类类别构建语料库,然后采用基于信息熵的方法对每个类别分别提取热词候选词,最后采用基于时间变化的方法进行候选词热度计算,根据候选词热度排序结果得到热词。本文抽取农业网站上的15 354条文本进行实验,结果表明,热词提取准确率达到0.9以上,能够较高质量地提取农业热词,为不同农业用户群体发现和分析产业热点提供帮助。 展开更多
关键词 农业网络信息 农业舆情监测 热词 多标记分类 热度计算
下载PDF
一种改进的RAKEL多标签分类算法 被引量:2
10
作者 金永贤 张微微 周恩波 《浙江师范大学学报(自然科学版)》 CAS 2016年第4期386-391,共6页
RAKEL(random k-labelsets)算法是一种集成技术,能有效解决多标签分类问题.它将原始标签集随机选用一小部分标签子集构成的数据集来训练每个分类器,但由于RAKEL算法构造标签空间的随机性,并未充分考察到样本多个标签之间的相关性,从而... RAKEL(random k-labelsets)算法是一种集成技术,能有效解决多标签分类问题.它将原始标签集随机选用一小部分标签子集构成的数据集来训练每个分类器,但由于RAKEL算法构造标签空间的随机性,并未充分考察到样本多个标签之间的相关性,从而造成分类精度不高,泛化性能受到一定影响.为此,提出了改进的LC-RAKEL算法.首先,通过标签聚类将原始标签集划分成标签簇,再从每个标签簇中各选择一个标签构成标签集,以此发现标签空间中重要且不频繁的映射关系;然后,利用出现次数较少的标签集合组成新的训练数据,训练相应的分类器.实验证明,改进的算法性能优于其他常用多标签分类算法. 展开更多
关键词 多标签分类 RAKEL 标签空间 随机 不频繁的映射
下载PDF
融合样本相似性的弱监督多标签分类 被引量:2
11
作者 罗森林 王海州 +1 位作者 潘丽敏 孙晓光 《北京理工大学学报》 EI CAS CSCD 北大核心 2021年第7期745-751,共7页
针对面向实际应用场景中数据标签易残缺导致有监督多标签分类方法可用训练数据量减少,未能利用大量标签缺失数据中蕴含的样本特征空间关联知识以最大化判别间隔,限制多标签分类效果等问题,本文提出一种融合样本相似性的弱监督多标签分... 针对面向实际应用场景中数据标签易残缺导致有监督多标签分类方法可用训练数据量减少,未能利用大量标签缺失数据中蕴含的样本特征空间关联知识以最大化判别间隔,限制多标签分类效果等问题,本文提出一种融合样本相似性的弱监督多标签分类方法.该方法利用标签相关性和样本相似性恢复标签以提高数据利用率,并将标签恢复嵌入到训练过程中以便挖掘标签相关性,通过近端加速梯度法进行参数优化,建立弱监督学习场景的多标签分类模型.在真实数据集上的实验结果表明,该方法能够利用样本相似性有效提升模型在标签残缺时的分类能力,实用价值大. 展开更多
关键词 多标签分类 标签残缺 样本相似性
下载PDF
基于标记相关性和ReliefF的多标记特征选择 被引量:5
12
作者 孙林 杜雯娟 +1 位作者 李硕 徐久成 《西北大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第5期834-846,共13页
针对现有一些特征选择算法未充分考虑特征和标记之间的相关性,造成分类精度偏低,以及ReliefF算法中样本间分类间隔较大导致分类无意义的问题,提出了一种基于标记相关性和改进ReliefF的多标记特征选择方法。首先,根据正类样本在标记集合... 针对现有一些特征选择算法未充分考虑特征和标记之间的相关性,造成分类精度偏低,以及ReliefF算法中样本间分类间隔较大导致分类无意义的问题,提出了一种基于标记相关性和改进ReliefF的多标记特征选择方法。首先,根据正类样本在标记集合中的所占比例定义标记权重,结合互信息和标记权重,构建特征与标记集合之间的相关度计算公式,有效反映特征与标记集的相关性,进而提高算法的分类精度。然后,依据ReliefF模型中的距离计算公式,分别计算样本与最近邻异类样本、最近邻同类样本的距离,提出一种新的样本分类间隔,结合标记权重与分类间隔构建新的特征权值更新公式,有效解决了传统ReliefF算法中因样本间距离过大导致异类样本和同类样本失效的问题。最后,结合标记相关性和改进的ReliefF算法,设计了一种新的多标记特征选择算法。在7个多标记数据集上选择不同评价指标,对所提多标记特征选择算法进行仿真实验与分析,实验结果表明所提算法是有效的。 展开更多
关键词 多标记学习 特征选择 标记相关性 RELIEFF
下载PDF
基于EnVision多标记读板仪的细胞内钙信号检测技术的研究 被引量:1
13
作者 杨颖 殷爱红 +2 位作者 武文琦 赵春娟 赵君朋 《山西医科大学学报》 CAS 2015年第6期553-555,共3页
目的研究使用En Vision多标记读板仪检测细胞内钙信号的可行性。方法分别用卡巴胆碱和凝血酶刺激LN229、SKN-MC细胞或者磷脂酶C抑制剂U73122预处理的LN229细胞,使用En Vision多标记读板仪检测细胞内钙信号强度的变化。结果卡巴胆碱诱导... 目的研究使用En Vision多标记读板仪检测细胞内钙信号的可行性。方法分别用卡巴胆碱和凝血酶刺激LN229、SKN-MC细胞或者磷脂酶C抑制剂U73122预处理的LN229细胞,使用En Vision多标记读板仪检测细胞内钙信号强度的变化。结果卡巴胆碱诱导的LN229细胞内钙信号变化呈现浓度依赖性;卡巴胆碱和凝血酶诱导的细胞内钙信号变化趋势不同;凝血酶诱导的钙信号变化具有细胞特异性;U73122对凝血酶诱导的钙信号的抑制作用呈现剂量依赖性。结论 En Vision多标记读板仪作为细胞内钙信号检测仪器,具有快速、可重复性好和灵敏度高等优势,适用于钙信号相关的研究和小分子抑制剂的筛选等领域的工作。 展开更多
关键词 细胞内钙信号 Envision多标记读板仪 磷脂酶C-β G蛋白偶联受体
下载PDF
面向不均衡医学数据集的疾病预测模型研究 被引量:41
14
作者 陈旭 刘鹏鹤 +5 位作者 孙毓忠 沈曦 张磊 王晓青 孙晓平 程伟 《计算机学报》 EI CSCD 北大核心 2019年第3期596-609,共14页
基于临床表现的疾病预测模型是临床决策支持系统(Clinical Decision Support System,CDSS)的一个重要研究内容.现有临床决策支持系统往往将临床病例作为训练数据集,以临床表现的描述文字为特征,采用统计机器学习方法构建疾病预测模型.然... 基于临床表现的疾病预测模型是临床决策支持系统(Clinical Decision Support System,CDSS)的一个重要研究内容.现有临床决策支持系统往往将临床病例作为训练数据集,以临床表现的描述文字为特征,采用统计机器学习方法构建疾病预测模型.然而,在医疗领域往往存在着样本数据集不均衡的问题,导致模型的预测效果降低.欠采样技术是目前解决样本不均衡问题的常用手段.其主要采用一定的方法从多数类样本中抽取部分样本,与少数类样本组成平衡数据集后再构建模型.现有的欠采样方法往往可以显著提高模型对少数类样本的召回率,然而其通常也会造成模型准确率的降低,从而限制了预测模型的整体提升效果.为此,该文提出了一种新的基于迭代提升欠采样的集成分类方法(Under-Sampling with Iteratively Boosting,USIB),该方法迭代地从多数类样本中进行欠抽样,构建多组弱分类器,并采用加权组合方式将这些弱分类器构成一个强分类器,从而提升样本不平衡条件下单种疾病预测效果.另外,医学病例样本数据集通常是多类别、多标签的,为此,该文将多个单种疾病的预测模型进行组合构成一个多标签疾病预测模型,以满足临床意义上的多病种以及并发症的诊断.为了进一步提升多标签预测模型的效果,该文设计了一种基于标签最大互信息生成树的标签选择方法(Labels Selection method based on Maximum Mutual Information Spanning Tree,LS-MMIST),该方法根据原始数据集的分布构建标签之间的最大互信息生成树,在每一次的样本预测阶段,借助树中疾病标签之间的关系确定最终的预测标签集合.实验方面,该文首先选择三种公开的不均衡二分类数据集和我们私有的四种稀有疾病的数据集,对该文提出的迭代提升欠采样方法进行性能评估.其次,分别对比了该文提出的多标签预测模型与现有的多标签预测技术在中医和西医两种多标签数据集上的预测性能.实验结果显示,相对于目前主流的八种欠采样以及两种集成采样技术,该文提出的迭代提升欠采样方法在各个不均衡二分类数据集上的F1值平均提升22.58%;与现有的各种多标签预测技术相比,该文提出的多标签预测方法在西医和中医数据集上正确率分别提升6.30%和12.43%,召回率分别提升4.33%和5.86%,F1值分别提升5.48%和11.16%. 展开更多
关键词 疾病预测 不均衡数据集 欠采样 二分类 多标签分类
下载PDF
ENSOCOM: Ensemble of Multi-Output Neural Network’s Components for Multi-Label Classification
15
作者 Khudran M.Alzhrani 《Computers, Materials & Continua》 SCIE EI 2022年第9期5459-5479,共21页
Multitasking and multioutput neural networks models jointly learn related classification tasks from a shared structure.Hard parameters sharing is a multitasking approach that shares hidden layers between multiple task... Multitasking and multioutput neural networks models jointly learn related classification tasks from a shared structure.Hard parameters sharing is a multitasking approach that shares hidden layers between multiple taskspecific outputs.The output layers’weights are essential in transforming aggregated neurons outputs into tasks labels.This paper redirects the multioutput network research to prove that the ensemble of output layers prediction can improve network performance in classifying multi-label classification tasks.The network’s output layers initialized with different weights simulate multiple semi-independent classifiers that can make non-identical label sets predictions for the same instance.The ensemble of a multi-output neural network that learns to classify the same multi-label classification task per output layer can outperform an individual output layer neural network.We propose an ensemble strategy of output layers components in the multi-output neural network for multi-label classification(ENSOCOM).The baseline and proposed models are selected based on the size of the hidden layer and the number of output layers to evaluate the proposed method comprehensively.The ENSOCOM method improved the performance of the neural networks on five different multi-label datasets based on several evaluation metrics.The methods presented in this work can substitute the standard labels representation and predictions generation of any neural network. 展开更多
关键词 Ensemble learning multilabel classification neural networks
下载PDF
一种基于树型贝叶斯网络的集成多标记分类算法 被引量:3
16
作者 张志东 王志海 +1 位作者 刘海洋 孙艳歌 《计算机科学》 CSCD 北大核心 2018年第3期189-195,共7页
在多标记分类问题中,有效地利用标记间的依赖关系是进一步提升分类器性能的主要途径之一。基于分类器链算法,利用互信息度量理论构造分类对象的类属性之间明确的多标记关系依赖模型,并依据建立的标记依赖模型将分类器链中的线性依赖拓... 在多标记分类问题中,有效地利用标记间的依赖关系是进一步提升分类器性能的主要途径之一。基于分类器链算法,利用互信息度量理论构造分类对象的类属性之间明确的多标记关系依赖模型,并依据建立的标记依赖模型将分类器链中的线性依赖拓展成树型依赖,以适应更为复杂的标记依赖关系;同时,在此基础上利用Stacking集成学习方法建立最终训练模型,提出了一种新的针对树型依赖表示模型的Stacking算法。在多个实验数据集上的实验结果表明,与原有的Stacking集成学习相比,该算法提升了分类器的相应评价指标。 展开更多
关键词 多标记分类 标记依赖 STACKING 树型贝叶斯网络
下载PDF
一种基于成对标签的Rakel算法改进 被引量:3
17
作者 周恩波 叶荣华 +1 位作者 张微微 周子涵 《计算机与现代化》 2016年第3期16-18,23,共4页
Rakel(Random k-labelsets)算法从原始标签集中随机选择一部分标签子集,并且使用LP(Label Powerset)算法训练相应的多标签子分类器。由于随机选择标签的原因,导致LP子分类器预测性能不好。本文基于标签的共现关系选择成对标签来训练LP... Rakel(Random k-labelsets)算法从原始标签集中随机选择一部分标签子集,并且使用LP(Label Powerset)算法训练相应的多标签子分类器。由于随机选择标签的原因,导致LP子分类器预测性能不好。本文基于标签的共现关系选择成对标签来训练LP分类器,提出PwRakel(Pairwise Random k-labelsets)算法。该算法通过挖掘标签相关性扩展训练集,有效提高分类性能。实验结果表明,所提出的算法与Rakel算法以及其他算法对比,分类准确度更高。 展开更多
关键词 多标签分类 标签相关性 PwRakel
下载PDF
基于可变最小贝叶斯风险的层次多标签分类方法 被引量:2
18
作者 徐智康 李旸 李德玉 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2017年第6期1023-1032,共10页
层次多标签分类方法,依据标签之间的相关性组织成层次结构,并将这种层次结构作为一种监督信息,从而更好地解决多标签分类问题.在层次多标签分类问题中常用的方法有两种,一种可称为损失无关方法,另一种可称为损失敏感方法.对于损失敏感方... 层次多标签分类方法,依据标签之间的相关性组织成层次结构,并将这种层次结构作为一种监督信息,从而更好地解决多标签分类问题.在层次多标签分类问题中常用的方法有两种,一种可称为损失无关方法,另一种可称为损失敏感方法.对于损失敏感方法,常用的损失函数有HMC-loss,该损失函数可对假正和假负两种错误给予不同的权重,并将层次信息添加到损失函数当中.当利用HMC-loss预测时,尽管得到的损失值是理想的,但实际预测的标签数却远多于真实的标签数.另外,层次信息的引入会对标签结点的决策顺序产生不利影响.针对这些问题,首先提出改进的损失函数IMH-loss,其次使用贝叶斯决策理论,提出了一种贝叶斯风险随决策过程可变的层次多标签分类方法.在真实数据集上的实验结果表明,该方法在保证召回率的同时,提升了标签预测精度. 展开更多
关键词 层次分类 多标签分类 可变贝叶斯风险 贝叶斯决策理论
下载PDF
基于配对排序损失的文本多标签学习算法 被引量:2
19
作者 顾天飞 彭敦陆 《小型微型计算机系统》 CSCD 北大核心 2020年第10期2045-2050,共6页
文本多标签学习是一项重要的自然语言处理任务,是对信息进行有效管理的一项关键技术.该任务需同时考虑到对文本和多标签进行建模.基于此,论文首先利用预训练语言模型BERT对文本序列进行特征提取,然后采用配对排序损失作为模型训练的目... 文本多标签学习是一项重要的自然语言处理任务,是对信息进行有效管理的一项关键技术.该任务需同时考虑到对文本和多标签进行建模.基于此,论文首先利用预训练语言模型BERT对文本序列进行特征提取,然后采用配对排序损失作为模型训练的目标函数,以对多标签之间的排序关系进行建模.最后为得到更精准的预测结果,加入了辅助的标签阈值学习.考虑到基于铰链函数的排序损失存在训练困难的现象,为此论文采用了一种光滑的替代损失,并从理论上验证了其有效性.在真实文本数据集上的实验表明,本文提出的算法能提供更好的性能从多标签分类和排序两方面. 展开更多
关键词 深度学习 多标签学习 文本分类 配对排序损失
下载PDF
基于BERT模型的安全生产事故多标签文本分类 被引量:6
20
作者 吴德平 时翔 王晓东 《武汉工程大学学报》 CAS 2021年第5期586-590,共5页
结合安全生产事故案例文本特点,利用自然语言处理(NLP)技术对安全生产事故分类,基于转换器的双向编码表征(BERT)模型利用“抽取+生成”相结合的方式获得文本摘要,再通过迁移学习训练提升模型性能,并利用分组分类算法对文本的52个标签进... 结合安全生产事故案例文本特点,利用自然语言处理(NLP)技术对安全生产事故分类,基于转换器的双向编码表征(BERT)模型利用“抽取+生成”相结合的方式获得文本摘要,再通过迁移学习训练提升模型性能,并利用分组分类算法对文本的52个标签进行多标签分类,获得较好的分类效果,为安全生产监管、事故隐患的排查和分析奠定基础。 展开更多
关键词 BERT模型 抽取式摘要 生成式摘要 迁移学习 多标签文本分类
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部