期刊文献+
共找到1,292篇文章
< 1 2 65 >
每页显示 20 50 100
基于隐结构模型联合频繁项集的针灸治疗弱精子症不育患者的辨证取穴规律
1
作者 何瑞宣 孙自学 +3 位作者 华众 张芳 张迪 胡创政 《世界中医药》 CAS 北大核心 2024年第14期2185-2190,共6页
目的:探讨针灸治疗弱精子症不育患者的辨证取穴规律,为临床治疗弱精子症不育患者提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中国生物医学文献数据库(CBM)、中国学术期刊数据库(CSPD)及中文科技期刊数据库(CCD)等数据库有关针... 目的:探讨针灸治疗弱精子症不育患者的辨证取穴规律,为临床治疗弱精子症不育患者提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中国生物医学文献数据库(CBM)、中国学术期刊数据库(CSPD)及中文科技期刊数据库(CCD)等数据库有关针灸治疗弱精子症的相关文献,提取症状、取穴处方信息构建医案数据库,采用隐结构模型、频繁项集的数据挖掘方法,分析针灸治疗弱精子症的辨证取穴规律。结果:纳入文献35篇,涉及症状62种,穴位49个。高频症状包括腰酸、神疲乏力等,高频腧穴包括关元、肾俞等。对症状、腧穴、证型进行频繁项集分析,挖掘出症状-腧穴频繁项集4项,包括耳鸣+头晕+腰酸+关元+肾俞等;证型-症状频繁项集4项,包括肾精亏虚证+健忘+性欲淡漠+神疲乏力+脉细等;证型-症状-腧穴频繁项集4项,包括肾精亏虚证+性欲淡漠+神疲乏力+头发易脱+关元等。结论:针灸治疗弱精子症多以关元、肾俞、足三里为主穴。 展开更多
关键词 隐结构模型 频繁项集 弱精子症 辨证取穴规律 数据挖掘 Apriori算法 穴位 针灸
下载PDF
基于隐结构模型和频繁项集的针刺治疗慢性前列腺炎辨证取穴规律
2
作者 胡创政 孙自学 +4 位作者 张宸铭 樊立鹏 华众 付晓君 门波 《世界中医药》 CAS 北大核心 2024年第8期1182-1187,共6页
目的:探讨针刺治疗慢性前列腺炎的辨证取穴规律,为临床治疗慢性前列腺炎提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中文科技期刊数据库(CCD)等数据库中关于针刺辨证论治慢性前列腺炎的文献,构建包含症状、证型、穴位处方的慢... 目的:探讨针刺治疗慢性前列腺炎的辨证取穴规律,为临床治疗慢性前列腺炎提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中文科技期刊数据库(CCD)等数据库中关于针刺辨证论治慢性前列腺炎的文献,构建包含症状、证型、穴位处方的慢性前列腺炎病历数据库,运用隐结构模型分析、频繁项集等方法,分析针刺治疗慢性前列腺炎的辨证取穴规律。结果:共纳入文献64篇,涉及穴位91个,症状248项。高频穴位如三阴交、中极等;高频症状包括舌体瘀点瘀斑、苔黄腻、滴白、尿急等;构建隐结构模型,得出慢性前列腺炎主要证型有湿热下注、肾阳不足等;挖掘出症状-穴位频繁项集、症状-证型-穴位频繁项集各4项。症状-穴位频繁项集如“尿急+滴白+阳痿+早泄+肾俞+足三里”,症状-证型-穴位频繁项集如“尿频+尿急+苔黄腻+滴白+舌体瘀点瘀斑+湿热瘀阻+三阴交+会阴”,提示治疗时可根据相应症状判定证型及选择对应穴位。结论:针刺治疗慢性前列腺炎多以三阴交、中极、关元等为主要穴位,穴位配伍依据临床情况辨证选穴,此可为临床治疗慢性前列腺炎提供参考。 展开更多
关键词 隐结构模型 频繁项集 慢性前列腺炎 数据挖掘 辨证取穴规律 针刺 穴位 APRIORI算法
下载PDF
基于隐结构模型与频繁项集探讨特发性肺纤维化的辨证用药规律
3
作者 侯超峰 李亚兰 +2 位作者 杜一杰 陈珂 陈乾 《山东中医杂志》 2024年第2期133-138,152,共7页
目的:探讨中医治疗特发性肺纤维化(IPF)的辨证用药规律,为临床治疗IPF提供参考。方法:在中国知网、万方数据知识服务平台、PubMed、Embase等数据库中,检索建库至2021年8月8日辨证应用中药汤剂治疗IPF的相关文献,提取证型、症状及中药处... 目的:探讨中医治疗特发性肺纤维化(IPF)的辨证用药规律,为临床治疗IPF提供参考。方法:在中国知网、万方数据知识服务平台、PubMed、Embase等数据库中,检索建库至2021年8月8日辨证应用中药汤剂治疗IPF的相关文献,提取证型、症状及中药处方信息,构建IPF医案数据库,采用隐结构模型、频繁项集等数据挖掘方法分析中药汤剂内服治疗IPF的辨证用药规律。结果:共纳入文献39篇,包含病例1497例。纳入文献共包含症状163个,如咳嗽、乏力、气短等,将频次3的53个症状作为显变量构建IPF的隐结构模型,该模型提示气虚血瘀是IPF的常见证型。纳入文献包含的处方中共涉及中药163味,其中高频药物包括黄芪、甘草、丹参、当归、党参等;挖掘出“症状-中药”频繁项集5项,如“胸痛乏力+舌有瘀斑+脉沉细+丹参+桃仁+党参”;“证型-症状-中药”频繁项集4项,如“气虚血瘀+胸闷乏力+舌有瘀斑+黄芪+丹参+当归”。结论:气虚血瘀是IPF的临床常见证型,中药汤剂治疗IPF多以黄芪、甘草、丹参为主要药物,药物配伍根据临床辨证选择。 展开更多
关键词 特发性肺纤维化 数据挖掘 隐结构模型 频繁项集 辨证 用药规律 肺痿
下载PDF
图数据领域的频繁项集挖掘
4
作者 邱文韬 兰红 《计算机科学与应用》 2024年第1期158-172,共15页
本文对图数据中的频繁子图挖掘算法进行了综述。追溯了从传统非图数据频繁项集挖掘技术到图数据频繁子图挖掘的演化,详细阐述了经典算法如类Apriori方法和gSpan算法的原理与应用。也对近年来兴起的基于图表示学习的先进算法,如SPMiner、... 本文对图数据中的频繁子图挖掘算法进行了综述。追溯了从传统非图数据频繁项集挖掘技术到图数据频繁子图挖掘的演化,详细阐述了经典算法如类Apriori方法和gSpan算法的原理与应用。也对近年来兴起的基于图表示学习的先进算法,如SPMiner、NSIC、LSS和NeurSC进行了系统的介绍和比较。本文不仅回顾了算法的历史演进,还对各类算法进行了详细的分析与讨论,通过分析这些算法的性能和特点,揭示了它们的优势与局限。最后,展望了图神经网络在频繁子图挖掘领域的未来发展方向,并指出了这些技术在生物网络分析、社交网络分析等领域应用的广阔前景。 展开更多
关键词 频繁项集挖掘 图数据 频繁子图 图神经网络 机器学习
下载PDF
频繁项集挖掘研究前沿及展望
5
作者 张晴 谭旭 吕欣 《深圳信息职业技术学院学报》 2024年第1期1-14,共14页
频繁项集挖掘是数据挖掘领域的核心任务之一,其目标是发现在数据库中频繁出现的模式。这些模式对于关联规则、分类、异常检测等多个数据挖掘任务都具有重要作用。由于随着项集大小的增加,项集的组合数量呈指数级增长,导致计算复杂性急... 频繁项集挖掘是数据挖掘领域的核心任务之一,其目标是发现在数据库中频繁出现的模式。这些模式对于关联规则、分类、异常检测等多个数据挖掘任务都具有重要作用。由于随着项集大小的增加,项集的组合数量呈指数级增长,导致计算复杂性急剧上升,研究人员一直在努力开发高效的算法来解决这一问题。面向频繁项集挖掘的算法、紧凑表示和前沿应用,深入探讨不同技术的的工作原理、优势和局限性,从而对这一领域的研究现状进行全面总结。最后,进一步探讨了该领域的前沿发展趋势,指出计算效率、基于约束的频繁项集挖掘、模式的可解释性以及算法在不同领域的创新应用等未来潜在研究方向。 展开更多
关键词 频繁项集 数据挖掘 模式增长 关联规则
下载PDF
基于并行式频繁项集的党政收费平台
6
作者 郭振华 孙艳青 王中兴 《电子设计工程》 2024年第5期31-36,共6页
为提高党政收费时效性与信息化管理水平,基于并行式频繁项集挖掘算法开发高效率、智能化的党政收费管理平台。基于云计算技术构建党政收费管理平台的总体架构,提供云缴费、党建教育学习、党建宣传等信息化功能。在Spark分布式计算框架... 为提高党政收费时效性与信息化管理水平,基于并行式频繁项集挖掘算法开发高效率、智能化的党政收费管理平台。基于云计算技术构建党政收费管理平台的总体架构,提供云缴费、党建教育学习、党建宣传等信息化功能。在Spark分布式计算框架上构建Spark集群,构造党政收费频繁项集挖掘矩阵,根据矩阵行列间运算获得频繁k项集支持度,利用“主-从”节点模式实现并行式频繁项集挖掘,获得党政收费管理信息分类结果。测试结果显示,该平台各功能最大平均响应时长仅为1.51 s,挖掘党政收费信息频繁项集的时间开销短、推荐非空率高,呈现了良好的频繁项集挖掘效率与质量。该平台助力优化党政费用交纳工作模式,为党员管理的信息化、智能化提供支持。 展开更多
关键词 并行式 云计算 频繁项集 Spark平台 挖掘 党政收费
下载PDF
基于隐结构与频繁项集探讨中药治疗肺结核的辨证用药规律
7
作者 刘贵丽 孙银铎 +1 位作者 米术斌 陈光晖 《中医临床研究》 2024年第5期86-91,共6页
目的:探讨中药汤剂对肺结核的辨证用药规律,为临床治疗肺结核提供借鉴意义。方法:计算机检索中国知网、万方等数据库中建库至2022年4月中药汤剂内服辨证用药论治肺结核的临床文献,提取证型、症状及中药处方信息构建肺结核医案数据库,采... 目的:探讨中药汤剂对肺结核的辨证用药规律,为临床治疗肺结核提供借鉴意义。方法:计算机检索中国知网、万方等数据库中建库至2022年4月中药汤剂内服辨证用药论治肺结核的临床文献,提取证型、症状及中药处方信息构建肺结核医案数据库,采用隐结构模型、频繁项集等数据挖掘方法,分析中药汤剂内服治疗肺结核的辨证用药规律。结果:经筛选共计纳入文献92篇,共涉及241味中药,358项症状。高频药物包括麦冬、百部、生地黄、百合等;中药频繁项集分析得出强关联规则12条,如熟地黄-生地黄?麦冬、川贝母-山药?麦冬等;高频症状包括咳嗽、盗汗、痰中带血、咳痰等;构建隐结构模型,得出肺结核主要证候有阴虚火旺、肺阴虚证、阴阳两虚等;挖掘证型-症状-中药频繁项集5项,其中包括肺阴虚证-脉细数+咳嗽+痰中带血+盗汗-百部+川贝母+麦冬等。结论:中药汤剂治疗肺结核多以麦冬、百部、生地黄为主要药物,药物配伍依据临床情况辨证选药,此结论可为临床治疗肺结核提供参考。 展开更多
关键词 肺结核 隐结构模型 频繁项集 数据挖掘 辨证用药规律
下载PDF
基于Spark的并行频繁项集挖掘算法 被引量:2
8
作者 毛伊敏 吴斌 +1 位作者 许春冬 张茂省 《计算机集成制造系统》 EI CSCD 北大核心 2023年第4期1267-1283,共17页
针对大数据环境下基于Spark的频繁模式增长(FP-Growth)算法存在创建条件频繁模式树(FP-tree)时空效率低,节点间通信开销大,以及冗余搜索等问题,提出了基于Spark的并行频繁项集挖掘算法(PAFMFI-Spark)。首先,该算法提出非负矩阵分解策略(... 针对大数据环境下基于Spark的频繁模式增长(FP-Growth)算法存在创建条件频繁模式树(FP-tree)时空效率低,节点间通信开销大,以及冗余搜索等问题,提出了基于Spark的并行频繁项集挖掘算法(PAFMFI-Spark)。首先,该算法提出非负矩阵分解策略(SNMF),通过提供支持度计数查询和分解储存支持度计数的矩阵,解决了创建条件FP-tree的时空效率低的问题;其次,提出基于遗传算法的分组策略(GS-GA),均衡分配频繁1项集至各节点,解决了节点间的通信开销大的问题;最后,提出高效缩减树结构策略(ERTSS),缩减FP-tree树结构,解决了冗余搜索的问题。实验结果验证了PAFMFI-Spark算法的可行性以及相较于其他挖掘算法的性能优势,所提算法能有效适应各种数据的频繁项集挖掘。 展开更多
关键词 大数据 Spark框架 并行频繁项集挖掘 频繁模式增长算法 非负矩阵分解
下载PDF
一种基于Spark的频繁项集快速挖掘算法
9
作者 丁家满 李海滨 +2 位作者 邓斌 贾连印 游进国 《软件学报》 EI CSCD 北大核心 2023年第5期2446-2464,共19页
如何在海量数据集中提高频繁项集的挖掘效率是目前研究的热点.随着数据量的不断增长,使用传统算法产生频繁项集的计算代价依然很高.为此,提出一种基于Spark的频繁项集快速挖掘算法(fast mining algorithm of frequent itemset based on ... 如何在海量数据集中提高频繁项集的挖掘效率是目前研究的热点.随着数据量的不断增长,使用传统算法产生频繁项集的计算代价依然很高.为此,提出一种基于Spark的频繁项集快速挖掘算法(fast mining algorithm of frequent itemset based on spark,Fmafibs),利用位运算速度快的特点,设计了一种新颖的模式增长策略.该算法首先采用位串表达项集,利用位运算来快速生成候选项集;其次,针对超长位串计算效率低的问题,考虑将事务垂直分组处理,将同一事务不同组之间的频繁项集通过连接获得候选项集,最后进行聚合筛选得到最终频繁项集.算法在Spark环境下,以频繁项集挖掘领域基准数据集进行实验验证.实验结果表明所提方法在保证挖掘结果准确的同时,有效地提高了挖掘效率. 展开更多
关键词 频繁项集 模式增长 位串 位运算 垂直分组 SPARK
下载PDF
基于遗传算法的生物启发频繁项集挖掘策略
10
作者 赵学健 赵可 《计算机科学》 CSCD 北大核心 2023年第S02期624-631,共8页
精确频繁项集挖掘算法时间效率低下,在处理大规模数据集时力不从心。针对该问题,提出一种基于遗传算法的频繁项集挖掘策略GAA-FIM(Genetic Algorithm combining Apriori property based Frequent Itemset Mining),给出了编码操作、交叉... 精确频繁项集挖掘算法时间效率低下,在处理大规模数据集时力不从心。针对该问题,提出一种基于遗传算法的频繁项集挖掘策略GAA-FIM(Genetic Algorithm combining Apriori property based Frequent Itemset Mining),给出了编码操作、交叉操作、变异操作和选择操作的详细操作规则。该算法将遗传算法与精确频繁项集挖掘算法的向下闭包特性融合,改进了传统的有性繁殖的交叉操作方式,将具有良好遗传基因的个体优先加入到新一代候选种群中,并通过变异操作扩展新一代候选种群的规模,以提升算法的时间效率,获取更佳质量的频繁项集。基于合成数据集和真实数据集对GAA-FIM算法的性能进行了验证,实验结果表明GAA-FIM算法与GAFIM和GA-Apriori等算法相比具有更好的时间效率,频繁项集质量也得到了进一步提升。 展开更多
关键词 频繁项集 遗传算法 生物启发 向下闭包特性 数据挖掘
下载PDF
基于RS_Hash频繁项集的卫星载荷关联规则算法
11
作者 贾澎涛 温滋 《国外电子测量技术》 北大核心 2023年第2期9-15,共7页
遥测数据是反映卫星健康状态的重要依据,对遥测载荷数据进行关联性分析,在一定程度上能反映出卫星的整体运行情况的好坏。针对传统关联规则算法存在效率低下、占用内存过多的问题,提出一种基于RS_Hash频繁项集的卫星载荷关联规则算法。... 遥测数据是反映卫星健康状态的重要依据,对遥测载荷数据进行关联性分析,在一定程度上能反映出卫星的整体运行情况的好坏。针对传统关联规则算法存在效率低下、占用内存过多的问题,提出一种基于RS_Hash频繁项集的卫星载荷关联规则算法。首先对事务数据库使用动态随机抽样的方法获取样本数据,设计抽样误差和抽样停止规则来确定最优的样本容量;其次将抽取出的样本使用哈希桶来存储频繁项集,进而减少占用的内存,提高算法的运行效率;最后使用3个与载荷数据相似的公开数据集和卫星载荷数据集进行实验,结果表明,在公共数据集上取得了良好的效果,尤其是在具有大数据量级的卫星载荷数据集上效果明显,在不同事务长度和支持度的情况下,相较于Apriori、PCY、SON、FP-Growth、RCM_Apriori和Hash_Cumulate算法,RS_Hash算法在平均时间效率上分别提高了75.81%、49.10%、59.38%、50.22%、40.16%和39.22%。 展开更多
关键词 卫星载荷分析 关联规则 频繁项集 动态随机抽样算法 哈希桶
下载PDF
基于隐结构和频繁项集挖掘膝骨关节炎针刺辨证选穴规律研究 被引量:1
12
作者 王金媛 秦启宁 +2 位作者 颜文定 李欢 田天照 《中国中医药图书情报杂志》 2023年第5期55-59,共5页
目的探索针刺治疗膝骨关节炎(KOA)的辨证选穴规律。方法检索中国知识资源总库(CNKI)、中国学术期刊数据库(万方数据)、中文科技期刊数据库(重庆维普)、中国生物医学文献数据库(CBM)、PubMed、Embase、Web of Science、Cochrane Library... 目的探索针刺治疗膝骨关节炎(KOA)的辨证选穴规律。方法检索中国知识资源总库(CNKI)、中国学术期刊数据库(万方数据)、中文科技期刊数据库(重庆维普)、中国生物医学文献数据库(CBM)、PubMed、Embase、Web of Science、Cochrane Library建库至2022年11月9日针刺辨证选穴治疗KOA相关文献,提取证型、症状、选穴信息构建数据库,利用Lantern5.0及Weka3.9.6软件,采用隐结构模型、聚类分析及频繁项集对辨证选穴规律进行分析。结果纳入文献95篇,涉及患者5458例,包含症状141个,其中高频症状为活动受限、疼痛、重着等;主要证型有阳虚寒凝、风寒湿痹、肝肾亏虚、气滞血瘀证。“症状-腧穴”频繁项集5项,包括“重着+活动受限+昼轻夜重”-“阳陵泉+犊鼻”等;“证型-症状-腧穴”频繁项集4项,包括“气滞血瘀”-“刺痛+痛有定处+活动受限”-“血海+梁丘+内膝眼”等。结论肝肾亏虚及风寒湿痹是KOA的常见证型,针刺治疗KOA多以内膝眼、犊鼻、阳陵泉、梁丘、足三里为主穴,临床辨证配穴。 展开更多
关键词 隐结构模型 频繁项集 膝骨关节炎 针刺 辨证选穴规律
下载PDF
基于改进大数据频繁项集挖掘算法的中深层地热能供热潜力评估方法 被引量:1
13
作者 李嵘 郑庆红 王晓瑜 《微型电脑应用》 2023年第10期23-26,共4页
为了提高中深层地热能供热潜力评估性能,提出了一种基于改进大数据频繁项集挖掘算法的中深层地热能供热潜力评估方法。利用普通类间距离和准则、加权类间距离和准则,挖掘出用于供暖潜能评估的频繁项集条件模式基,将条件FG-tree视为一种... 为了提高中深层地热能供热潜力评估性能,提出了一种基于改进大数据频繁项集挖掘算法的中深层地热能供热潜力评估方法。利用普通类间距离和准则、加权类间距离和准则,挖掘出用于供暖潜能评估的频繁项集条件模式基,将条件FG-tree视为一种递推处理过程,挖掘中深层地热能供热潜力数据的频繁项集。利用单位供热量能量消耗指标和能量效率指标,分析了地热能供热的能量,通过[火用]效率指标和能级平衡系数指标,实现中深层地热能供热潜力评估。实验结果表明,所提出的方法能够评估中深层地热能供热潜力,并具有更高的评估效率。 展开更多
关键词 大数据频繁项集 类间距离 供热潜力 [火用]效率 地热能
下载PDF
关联规则挖掘中闭频繁项集的理解与探索
14
作者 万鑫 张慧娜 +1 位作者 李裕梅 王鑫 《应用数学进展》 2023年第11期4898-4905,共8页
关联规则挖掘,通过数据挖掘事务之间的关联关系,被广泛应用到各个领域,主要是通过频繁项集产生关联规则,而频繁项集的挖掘又归结到闭频繁项集的挖掘,由此可见闭频繁项集在关联规则挖掘种的重要作用。本文以购物篮关联规则分析为场景,对... 关联规则挖掘,通过数据挖掘事务之间的关联关系,被广泛应用到各个领域,主要是通过频繁项集产生关联规则,而频繁项集的挖掘又归结到闭频繁项集的挖掘,由此可见闭频繁项集在关联规则挖掘种的重要作用。本文以购物篮关联规则分析为场景,对闭频繁项集的理论进行了梳理,针对闭包算子定义中的函数i和t进行了单调性证明;对闭包算子定义满足的三条性质进行了证明;对频繁项集和其闭包的支持度进行了探讨;对封闭频繁项集和其超集之间的支持度进行了关系讨论。最后,按照频繁项集及其闭包所形成的等价类的性质进行了研究,给出了有关定理和证明,以及结论等。 展开更多
关键词 关联规则挖掘 频繁项集 支持度 闭包 频繁项集
下载PDF
数据立方体与频繁项集的统一计算框架研究
15
作者 徐静文 游进国 +2 位作者 王全鹍 黄星瑞 贾连印 《计算机学报》 EI CAS CSCD 北大核心 2023年第4期780-802,共23页
数据立方体和频繁项集挖掘分别是数据仓库和数据挖掘领域的重要技术,已开展了大量的相关研究工作,取得了较好的进展.数据立方体和频繁项集挖掘依据各自的数据单元和项集构造了类似的代数格(Lattice)结构;数据立方体的等价类上界单元与... 数据立方体和频繁项集挖掘分别是数据仓库和数据挖掘领域的重要技术,已开展了大量的相关研究工作,取得了较好的进展.数据立方体和频繁项集挖掘依据各自的数据单元和项集构造了类似的代数格(Lattice)结构;数据立方体的等价类上界单元与频繁项集挖掘的闭项集也是相对应的.如果能够论证二者的统一性,则可以为彼此提供更广泛的研究思路,有利于两种技术的相互促进,如:在数据库中利用冰山立方体计算实现频繁项集挖掘来避免数据迁移、利用频繁项集挖掘算法优化数据立方体计算等.之前的工作没有将二者系统地结合起来研究,也没有建立二者之间较为完整的联系.本文在深入研究数据立方体的计算和频繁项集挖掘的过程后,将二者有效地结合在一起,提出了统一的计算框架,给出了二者众多计算性质和方法之间的映射关系,进行了相关概念泛化,具体地建立了冰山立方体、浓缩立方体和商立方体等主要数据立方体计算与相应频繁项集挖掘方法的对应关系.通过算法和实验进一步论证统一计算的有效性:(1)将频繁项集挖掘事务集导入关系数据库,用冰山立方体计算方式进行频繁项集挖掘,从而在数据库中用标准的或扩展的SQL可以实现对关系表进行频繁项集挖掘;(2)验证了浓缩立方体与频繁项集挖掘的统一性并对比了计算效率;(3)将基本表转换为频繁项集挖掘事务集,引入高效的频繁项集挖掘算法LCM计算商立方体,以提升数据立方体计算效率.在公开的真实数据集和人工合成的数据集上验证二者结合、统一计算的正确性,通过改变元组数、维数和倾斜度进行对比验证有效性.实验发现,在大数据集上可令时间效率提升高达92%. 展开更多
关键词 数据立方体 频繁项集挖掘 格结构 统一计算方法 计算效率
下载PDF
基于N-list和DiffNodeset结构的频繁项集并行挖掘算法
16
作者 张阳 王瑞 +1 位作者 吴贯锋 刘弘毅 《计算机科学》 CSCD 北大核心 2023年第11期55-61,共7页
频繁项集挖掘是数据挖掘中的一个基本问题,在许多数据挖掘应用中发挥着重要作用。针对并行频繁项集挖掘算法MrPrePost在大数据环境存在密集数据集下算法效率下降、计算节点负载量不均衡和冗余搜索等问题,提出了基于N-lists和DiffNodese... 频繁项集挖掘是数据挖掘中的一个基本问题,在许多数据挖掘应用中发挥着重要作用。针对并行频繁项集挖掘算法MrPrePost在大数据环境存在密集数据集下算法效率下降、计算节点负载量不均衡和冗余搜索等问题,提出了基于N-lists和DiffNodeset两种结构的并行频繁项集挖掘算法(Parallel Mining algorithm of Frequent Itemset based on N-list and DiffNodeset structure,PFIMND)。首先,根据N-list和DiffNodeset在存储不同数据集上的优势,设计了稀疏度估计函数(Sparsity Estimation,SE),根据数据集稀疏程度灵活选取其中之一压缩数据集,相比采用单一存储结构消耗的内存更少;其次,提出了计算量估计函数(Computation Estimation,CE)来估计频繁1项集F-list中每一项的负载量,并根据计算量进行均匀分组;最后采用集合枚举树作为搜索空间,为避免组合爆炸和冗余搜索问题,设计了超集剪枝策略和基于宽度优先搜索的剪枝策略,生成最终的挖掘结果。实验结果表明,相比同类算法HP-FIMBN,PFIMND算法在Susy数据集上挖掘频繁项集的效果提升了12.3%。 展开更多
关键词 频繁项集 负载估计 MAPREDUCE 稀疏度估计 集合枚举树
下载PDF
基于ESCS剪枝策略的闭频繁项集挖掘算法 被引量:1
17
作者 刘文杰 杨海军 《吉林大学学报(信息科学版)》 CAS 2023年第2期329-337,共9页
由于在现有的闭频繁项集挖掘算法中,剪枝策略相对单一,大都是针对1-项集进行剪枝,对2-项集和n-项集(n≥3)的剪枝策略相对匮乏,而有效的剪枝策略可以提前发现并剪掉大量没有希望的项集,因此改进闭频繁项集的剪枝策略对此类算法效率的提... 由于在现有的闭频繁项集挖掘算法中,剪枝策略相对单一,大都是针对1-项集进行剪枝,对2-项集和n-项集(n≥3)的剪枝策略相对匮乏,而有效的剪枝策略可以提前发现并剪掉大量没有希望的项集,因此改进闭频繁项集的剪枝策略对此类算法效率的提升具有很大的帮助。为此在ESCS(Estimated Support Co-occurrence Structure)结构基础上,提出针对2-项集的ESCS剪枝策略,并应用其将经典闭频繁项集挖掘算法DCI_Closed(Direct Count Intersect Closed)改进为DCI_ESCS(Direct Count Intersect Estimated Support Co-occurrence Structure)算法,同时对ESCS剪枝策略的效果加以验证。在多个公开数据集上、不同最小支持度阈值下,对改进前后算法时间性能进行比较实验。实验结果表明,改进的DCI_ESCS算法在事务和项集较长的、较稠密的数据集上表现良好,时间效率均有一定程度的提高。 展开更多
关键词 频繁项集 剪枝策略 数据挖掘
下载PDF
基于局部重构树的数据流频繁项集挖掘方法
18
作者 王景兰 丁丽 孙慧婷 《新乡学院学报》 2023年第3期22-25,共4页
针对传统的数据流频繁项集挖掘方法缺乏对事务数据的压缩,导致挖掘效率较低的问题,提出基于局部重构树的数据流频繁项集挖掘方法。通过构建局部重构树,对事务数据进行压缩,并对频繁项集数据进行滤波处理,调整支持度的最大值与最小值,实... 针对传统的数据流频繁项集挖掘方法缺乏对事务数据的压缩,导致挖掘效率较低的问题,提出基于局部重构树的数据流频繁项集挖掘方法。通过构建局部重构树,对事务数据进行压缩,并对频繁项集数据进行滤波处理,调整支持度的最大值与最小值,实现对挖掘函数的构建与优化。利用对比实验对提出的方法进行了挖掘效率的验证,实验结果表明,在采用所提出的方法对数据流频繁项集进行挖掘时,算法执行耗时较少,挖掘效率较高,具有一定的应用价值。 展开更多
关键词 局部重构树 数据流 频繁项集 最小支持度
下载PDF
概念格的频繁项集生成算法
19
作者 周向荣 吴清寿 《武夷学院学报》 2023年第3期38-44,共7页
为提高频繁项集的生成效率,提出一种基于概念格的频繁项集生成算法。首先将事务数据库映射为形式背景,利用概念格构建算法从形式背景中生成概念及其偏序关系,概念内涵表示项集,概念外延表示项集对应的支持度计数。根据概念的外延长度将... 为提高频繁项集的生成效率,提出一种基于概念格的频繁项集生成算法。首先将事务数据库映射为形式背景,利用概念格构建算法从形式背景中生成概念及其偏序关系,概念内涵表示项集,概念外延表示项集对应的支持度计数。根据概念的外延长度将所有概念划分到不同的层中,层的序号与概念外延长度相同,将层按照序号进行降序排列,从层序号大于等于最小支持度计数的概念中生成频繁项集。在两个人工数据集上的实验结果表明所提算法在时间性能上优于对比算法,最小支持度计数的值越小,所提算法的优势越明显。 展开更多
关键词 概念格 频繁项集 关联规则 形式背景分析
下载PDF
基于频繁项集的海上目标编组挖掘
20
作者 卫强 袁昱纬 邓勇 《火力与指挥控制》 CSCD 北大核心 2023年第10期139-144,152,共7页
从海量海上目标数据中挖掘出编组信息,并评估其任务能力,对海上目标身份刻画有着重要意义。探讨了轨迹相似及轨迹聚类理论在海上目标编组挖掘中的应用模式,提出一种基于频繁项集的目标编组快速挖掘算法,并提出基于海量数据的海上目标编... 从海量海上目标数据中挖掘出编组信息,并评估其任务能力,对海上目标身份刻画有着重要意义。探讨了轨迹相似及轨迹聚类理论在海上目标编组挖掘中的应用模式,提出一种基于频繁项集的目标编组快速挖掘算法,并提出基于海量数据的海上目标编组模型,可以自动挖掘并给出不同置信度参数下的潜在目标编组列表。基于船舶AIS数据,实验验证了该方法的有效性,能够从目标轨迹大数据中得到海上目标的典型编组。 展开更多
关键词 频繁项集 关联规则 数据挖掘 置信度 目标编组
下载PDF
上一页 1 2 65 下一页 到第
使用帮助 返回顶部