期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
多尺度关联规则挖掘的尺度上推算法 被引量:6
1
作者 柳萌萌 赵书良 +1 位作者 陈敏 李晓超 《计算机应用研究》 CSCD 北大核心 2015年第10期2924-2929,共6页
多尺度理论已被引入到数据挖掘领域中,但目前多尺度数据挖掘的研究并不深入,缺乏普适性理论与方法。针对上述问题,研究了普适的多尺度数据挖掘理论,提出了尺度上推关联规则挖掘算法。首先基于概念分层理论给出了数据尺度划分和数据尺度... 多尺度理论已被引入到数据挖掘领域中,但目前多尺度数据挖掘的研究并不深入,缺乏普适性理论与方法。针对上述问题,研究了普适的多尺度数据挖掘理论,提出了尺度上推关联规则挖掘算法。首先基于概念分层理论给出了数据尺度划分和数据尺度的定义;然后根据多尺度理论的研究重点阐明了多尺度数据挖掘的实质及研究核心;最后在多尺度数据理论研究的基础上提出了尺度上推关联规则挖掘算法SU-ARMA(scaling-up association rules mining algorithm)。该算法利用采样理论和Jaccard相似性系数对数据集挖掘结果中的频繁项集进行处理,实现了多尺度数据间知识的向上推导。利用人造数据集和H省全员人口真实数据集对算法进行了实验和分析,实验结果表明算法具有较高的覆盖率、精确度和较低的支持度估计误差,是可行且有效的。 展开更多
关键词 多尺度 概念分层 频繁项集 尺度上推 多尺度关联规则挖掘
下载PDF
多尺度关联规则尺度上推算法 被引量:4
2
作者 李超 赵书良 +2 位作者 赵骏鹏 高琳 池云仙 《计算机科学》 CSCD 北大核心 2017年第8期285-289,共5页
数据挖掘在多尺度研究方面取得了一些成果。然而,多尺度数据挖掘研究还不够深入和完善。目前针对空间和图像数据的研究较多,对于一般数据的多尺度数据挖掘的研究较少。随着大数据应用的不断发展,其研究显得尤为重要。针对上述问题,进行... 数据挖掘在多尺度研究方面取得了一些成果。然而,多尺度数据挖掘研究还不够深入和完善。目前针对空间和图像数据的研究较多,对于一般数据的多尺度数据挖掘的研究较少。随着大数据应用的不断发展,其研究显得尤为重要。针对上述问题,进行了普适的多尺度关联规则尺度转换方法的研究。首先,基于包含度的相似度理论提出频繁项集的处理方法;然后,以图像金字塔为理论基础,提出了多尺度关联规则尺度上推算法MSARSUA(Multi-Scale Association Rules Scaling Up Algorithm);最后,利用H省1)全员人口真实数据集、UCI公用数据集和IBM数据集对所提算法进行了实验验证与分析,结果表明MSARSUA具有较高的覆盖率、较高的F1-measure值和较低的平均支持度估计误差,在效率上比Apriori算法和FP-Growth算法有较大的提升,在性能上比SU-ARMA有更好的表现。 展开更多
关键词 多尺度 关联规则 尺度上推 多尺度关联规则挖掘
下载PDF
多尺度数据挖掘方法 被引量:28
3
作者 柳萌萌 赵书良 +3 位作者 韩玉辉 苏东海 李晓超 陈敏 《软件学报》 EI CSCD 北大核心 2016年第12期3030-3050,共21页
多尺度理论已被引入到数据挖掘领域,但人们对其研究仍不够深入和完善,缺乏普适性理论与方法.随着大数据处理应用的不断深入,其研究变得更加迫切.针对上述问题,进行了普适的多尺度数据挖掘理论和方法的研究.首先,基于概念分层理论给出了... 多尺度理论已被引入到数据挖掘领域,但人们对其研究仍不够深入和完善,缺乏普适性理论与方法.随着大数据处理应用的不断深入,其研究变得更加迫切.针对上述问题,进行了普适的多尺度数据挖掘理论和方法的研究.首先,基于概念分层理论给出了数据尺度划分和数据尺度的定义以及多尺度数据集之间的上下层尺度数据集关系;其次,阐明了多尺度数据挖掘的定义、研究实质和方法分类;最后,提出了多尺度数据挖掘算法框架,给出其理论基础,并将此框架应用于关联规则挖掘,提出了多尺度关联规则挖掘算法MSARMA(multi-scale association rules mining algorithm),实现了多尺度数据集之间知识的跨尺度推导.利用IBM T10I4D100K数据集和H省全员人口真实数据集对MSARMA算法进行了实验和分析,实验结果表明:算法具有较高的覆盖率、精确度和较低的支持度估计误差,是可行且有效的. 展开更多
关键词 多尺度 频繁项集 关联规则 尺度转换 多尺度关联规则挖掘
下载PDF
基于多尺度局部累积特征和神经网络的抗肿瘤药物反应预测
4
作者 韩睿 郭成安 《模式识别与人工智能》 EI CSCD 北大核心 2022年第4期323-332,共10页
目前已有的研究结果表明现有抗肿瘤药物的有效性高度依赖于患者的基因组学特征.如何为每位肿瘤患者量身定制最佳的治疗方案是重要又富有挑战性的前沿课题.针对该课题,文中提出抗肿瘤药物反应预测方法,运用机器学习技术,对患者肿瘤基因... 目前已有的研究结果表明现有抗肿瘤药物的有效性高度依赖于患者的基因组学特征.如何为每位肿瘤患者量身定制最佳的治疗方案是重要又富有挑战性的前沿课题.针对该课题,文中提出抗肿瘤药物反应预测方法,运用机器学习技术,对患者肿瘤基因测序数据进行处理、特征提取及建模,预测各种不同抗肿瘤药物的疗效反应.首先,提出基于多尺度关联规则的数据挖掘方法,对基因组学数据进行不同尺度的特征挑选.进而通过累积窗函数对挑选后的基因组学数据进行局部累积,进一步执行数据压缩,提取具有较强整体表达性的基因特征信息.然后,以多层全连接神经网络为模型、以提取的多尺度累积基因特征为输入样本,进行训练和建模.最后,分别采用特征融合和决策融合,实现某一肿瘤基因测序数据对于各种不同抗肿瘤药物反应结果的预测.在COSMIC、GDSC数据库上的仿真实验表明,文中方法在敏感性、特异性、准确率、特性曲线面积值等关键性能指标上均取得较优值. 展开更多
关键词 药物反应预测 神经网络 多尺度关联规则 局部累积 特征融合 决策融合
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部