期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于改进的RAKEL算法的心电图诊断分类
1
作者 赵静 韩京宇 +1 位作者 钱龙 毛毅 《计算机应用》 CSCD 北大核心 2022年第6期1892-1897,共6页
心电图(ECG)数据通常包含多种病症,而ECG诊断是一个典型的多标签分类问题。在多标签分类方法中,RAKEL算法将标签集随机分解为若干个大小为k的子集,并建立LP分类器进行训练;然而由于没有充分考虑标签间的相关性,LP分类器中容易产生一些... 心电图(ECG)数据通常包含多种病症,而ECG诊断是一个典型的多标签分类问题。在多标签分类方法中,RAKEL算法将标签集随机分解为若干个大小为k的子集,并建立LP分类器进行训练;然而由于没有充分考虑标签间的相关性,LP分类器中容易产生一些标签组合所对应样本稀少的情况,从而影响预测性能。为了充分考虑标签间的相关性,提出一种基于贝叶斯网络的RAKEL算法BN-RAKEL。首先利用贝叶斯网络找到标签间的相关性,确定候选标签子集;然后对每个标签采用基于信息增益的特征选择算法确定其最优特征空间,并针对每个候选标签子集利用最优特征空间相似性来检测其相关程度,以确定最终的具有强相关性的标签子集;最后在标签子集的最优特征空间上训练LP分类器。在实际的ECG数据集上,与多标签K近邻(ML-KNN)、RAKEL、CC和基于FP-Growth的RAKEL算法FI-RAKEL进行对比,结果显示所提算法在召回率和F-score上最少提高了3.6个百分点和2.3个百分点。实验结果表明,BN-RAKEL算法有较好的预测性能,能有效提升ECG诊断的准确性。 展开更多
关键词 心电图 多标签 标签相关性 贝叶斯网络 信息增益 特征选择 RAkEL算法
下载PDF
基于数字内容偏好的多标签分类应用
2
作者 刘斌 李笑 《计算机与现代化》 2021年第2期45-50,共6页
目前电信行业的数字内容研究主要是基于业务口径进行不同偏好的用户洞察,多以业务经验进行判断,不利于数字内容用户规模的发展扩大。为此,本文利用大流量客户的历史数据,基于多标签分类算法对数字内容偏好进行研究,得到各类别的潜在目... 目前电信行业的数字内容研究主要是基于业务口径进行不同偏好的用户洞察,多以业务经验进行判断,不利于数字内容用户规模的发展扩大。为此,本文利用大流量客户的历史数据,基于多标签分类算法对数字内容偏好进行研究,得到各类别的潜在目标客户,最终通过营销推荐客户喜好内容,提高精准营销能力。首先以M电信公司用户的基础、消费属性等脱敏数据作为数据源,并获取近3个月视频、音乐、阅读活跃用户清单,人工进行活跃维度的标注,得到初始数据集;由于正负样本不均衡,故采用多次下采样的方法随机抽样得到3份样本数据,并使用CC、ML-KNN、Rakel D等6种算法进行对比实验验证;实验结果表明:采用Rakel D及ML-KNN多标签分类算法在数字内容用户偏好洞察方面有较好的预测能力,故采用ML-KNN作为Rakel D算法的基本分类器,即Rakel D_MLKNN方法,对正负样比例不同的数据集分别进行预测,效果均优于前6种已经存在的常用多标签分类算法及传统经验选型方法。 展开更多
关键词 数字内容偏好 多标签分类 CC算法 ML-kNN算法 rakeld算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部