期刊文献+
共找到343篇文章
< 1 2 18 >
每页显示 20 50 100
Frequent item sets mining from high-dimensional dataset based on a novel binary particle swarm optimization 被引量:2
1
作者 张中杰 黄健 卫莹 《Journal of Central South University》 SCIE EI CAS CSCD 2016年第7期1700-1708,共9页
A novel binary particle swarm optimization for frequent item sets mining from high-dimensional dataset(BPSO-HD) was proposed, where two improvements were joined. Firstly, the dimensionality reduction of initial partic... A novel binary particle swarm optimization for frequent item sets mining from high-dimensional dataset(BPSO-HD) was proposed, where two improvements were joined. Firstly, the dimensionality reduction of initial particles was designed to ensure the reasonable initial fitness, and then, the dynamically dimensionality cutting of dataset was built to decrease the search space. Based on four high-dimensional datasets, BPSO-HD was compared with Apriori to test its reliability, and was compared with the ordinary BPSO and quantum swarm evolutionary(QSE) to prove its advantages. The experiments show that the results given by BPSO-HD is reliable and better than the results generated by BPSO and QSE. 展开更多
关键词 data mining frequent item sets particle swarm optimization
下载PDF
一种面向数据流top-k频繁模式发布的差分隐私保护方案 被引量:7
2
作者 梁文娟 陈红 +1 位作者 赵素云 李翠平 《计算机学报》 EI CAS CSCD 北大核心 2021年第4期741-760,共20页
频繁模式挖掘是事务数据分析的常用技术,面向数据流的频繁模式挖掘具有重要的应用价值.然而当事务为敏感信息时,直接发布频繁模式及支持度会导致个体隐私泄露.差分隐私是一种严格且可证明的隐私保护模型,目前虽然已有基于差分隐私的频... 频繁模式挖掘是事务数据分析的常用技术,面向数据流的频繁模式挖掘具有重要的应用价值.然而当事务为敏感信息时,直接发布频繁模式及支持度会导致个体隐私泄露.差分隐私是一种严格且可证明的隐私保护模型,目前虽然已有基于差分隐私的频繁模式发布方案,但它们大都是面向静态数据做一次性发布的隐私保护.本文是面向数据流频繁模式发布的隐私保护,旨在设计一种兼顾可用性和发布效率的持续发布的差分隐私保护方案.与静态发布方案不同,面向数据流的隐私保护处理面临两大挑战:一是持续发布过程中隐私预算的累计消耗会造成发布结果可用性较低;二是候选模式集增大会造成发布结果误差较大和发布效率较低.为解决隐私预算的累计消耗问题,方案设计了满足event级差分隐私的保护机制.该机制可以最大化隐私预算利用率,提高发布结果可用性.为降低候选模式集大小,从而提高发布结果可用性和发布效率,方案首先设计了一种基于模式估计的长事务拆分预处理策略,并对拆分所致的信息丢失率进行了分析和弥补.然后在持续发布阶段,在基于Cantree的挖掘中,先基于支持度阈值对候选模式集进一步缩减.基于缩减后的候选模式集,本文设计了一种蓄水池抽样和指数机制(EM)相结合的持续更新发布策略,该策略通过一遍扫描抽样集,在保证可用性和隐私保护级别的前提下提高了发布效率.最后,理论证明了该方案满足ε-差分隐私,实验结果验证了该方案具有较好的可用性和较高的工作效率. 展开更多
关键词 模式估计 差分隐私 蓄水池抽样 频繁模式挖掘 事务拆分
下载PDF
微阵列数据中Top-k频繁闭合项集挖掘 被引量:1
3
作者 史建军 缪裕青 《计算机工程》 CAS CSCD 北大核心 2011年第2期60-62,共3页
现有大部分微阵列数据中频繁闭合项集的挖掘需要事先给定最小支持度,但在实际应用中该最小支持度很难确定。针对该问题,提出top-k频繁闭合项集挖掘算法,基于自顶向下宽度优先搜索策略挖掘项集长度不小于min_l的top-k频繁闭合项集,并对... 现有大部分微阵列数据中频繁闭合项集的挖掘需要事先给定最小支持度,但在实际应用中该最小支持度很难确定。针对该问题,提出top-k频繁闭合项集挖掘算法,基于自顶向下宽度优先搜索策略挖掘项集长度不小于min_l的top-k频繁闭合项集,并对搜索空间进行有效修剪,从而提高搜索速度。实验结果表明,该算法的时间性能在多数情况下优于CARPENTER算法。 展开更多
关键词 微阵列数据 top—k频繁闭合项集 自顶向下 宽度优先
下载PDF
用变异FP-树改进CLOSET算法
4
作者 刘迎意 吴春旭 沈陵峰 《计算机仿真》 CSCD 北大核心 2010年第3期98-101,共4页
频繁闭项集提供了频繁项集的一种完整、最小表示,对频繁闭项集的挖掘是近年来数据挖掘领域研究的热点,研究人员从不同角度对算法改进以提高算法的效率。基于频繁项集中共生项集的性质,提出无须进行子集检查的频繁闭项集挖掘方法,并设计... 频繁闭项集提供了频繁项集的一种完整、最小表示,对频繁闭项集的挖掘是近年来数据挖掘领域研究的热点,研究人员从不同角度对算法改进以提高算法的效率。基于频繁项集中共生项集的性质,提出无须进行子集检查的频繁闭项集挖掘方法,并设计一种变异的FP-树结构,利用FP-树结构来存储结点共生项集信息,以改进CLOSET算法,算法无须遍历结果集进行闭合性检查。实验表明,在支持度阈值减小,结果集变大时,改进算法的时间增长率比原有算法小。 展开更多
关键词 数据挖掘 频繁闭项集 算法改进
下载PDF
基于隐结构模型和频繁项集的针刺治疗慢性前列腺炎辨证取穴规律
5
作者 胡创政 孙自学 +4 位作者 张宸铭 樊立鹏 华众 付晓君 门波 《世界中医药》 CAS 北大核心 2024年第8期1182-1187,共6页
目的:探讨针刺治疗慢性前列腺炎的辨证取穴规律,为临床治疗慢性前列腺炎提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中文科技期刊数据库(CCD)等数据库中关于针刺辨证论治慢性前列腺炎的文献,构建包含症状、证型、穴位处方的慢... 目的:探讨针刺治疗慢性前列腺炎的辨证取穴规律,为临床治疗慢性前列腺炎提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中文科技期刊数据库(CCD)等数据库中关于针刺辨证论治慢性前列腺炎的文献,构建包含症状、证型、穴位处方的慢性前列腺炎病历数据库,运用隐结构模型分析、频繁项集等方法,分析针刺治疗慢性前列腺炎的辨证取穴规律。结果:共纳入文献64篇,涉及穴位91个,症状248项。高频穴位如三阴交、中极等;高频症状包括舌体瘀点瘀斑、苔黄腻、滴白、尿急等;构建隐结构模型,得出慢性前列腺炎主要证型有湿热下注、肾阳不足等;挖掘出症状-穴位频繁项集、症状-证型-穴位频繁项集各4项。症状-穴位频繁项集如“尿急+滴白+阳痿+早泄+肾俞+足三里”,症状-证型-穴位频繁项集如“尿频+尿急+苔黄腻+滴白+舌体瘀点瘀斑+湿热瘀阻+三阴交+会阴”,提示治疗时可根据相应症状判定证型及选择对应穴位。结论:针刺治疗慢性前列腺炎多以三阴交、中极、关元等为主要穴位,穴位配伍依据临床情况辨证选穴,此可为临床治疗慢性前列腺炎提供参考。 展开更多
关键词 隐结构模型 频繁项集 慢性前列腺炎 数据挖掘 辨证取穴规律 针刺 穴位 APRIORI算法
下载PDF
基于隐结构模型联合频繁项集的针灸治疗弱精子症不育患者的辨证取穴规律
6
作者 何瑞宣 孙自学 +3 位作者 华众 张芳 张迪 胡创政 《世界中医药》 CAS 北大核心 2024年第14期2185-2190,共6页
目的:探讨针灸治疗弱精子症不育患者的辨证取穴规律,为临床治疗弱精子症不育患者提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中国生物医学文献数据库(CBM)、中国学术期刊数据库(CSPD)及中文科技期刊数据库(CCD)等数据库有关针... 目的:探讨针灸治疗弱精子症不育患者的辨证取穴规律,为临床治疗弱精子症不育患者提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中国生物医学文献数据库(CBM)、中国学术期刊数据库(CSPD)及中文科技期刊数据库(CCD)等数据库有关针灸治疗弱精子症的相关文献,提取症状、取穴处方信息构建医案数据库,采用隐结构模型、频繁项集的数据挖掘方法,分析针灸治疗弱精子症的辨证取穴规律。结果:纳入文献35篇,涉及症状62种,穴位49个。高频症状包括腰酸、神疲乏力等,高频腧穴包括关元、肾俞等。对症状、腧穴、证型进行频繁项集分析,挖掘出症状-腧穴频繁项集4项,包括耳鸣+头晕+腰酸+关元+肾俞等;证型-症状频繁项集4项,包括肾精亏虚证+健忘+性欲淡漠+神疲乏力+脉细等;证型-症状-腧穴频繁项集4项,包括肾精亏虚证+性欲淡漠+神疲乏力+头发易脱+关元等。结论:针灸治疗弱精子症多以关元、肾俞、足三里为主穴。 展开更多
关键词 隐结构模型 频繁项集 弱精子症 辨证取穴规律 数据挖掘 Apriori算法 穴位 针灸
下载PDF
基于隐结构模型与频繁项集探讨特发性肺纤维化的辨证用药规律
7
作者 侯超峰 李亚兰 +2 位作者 杜一杰 陈珂 陈乾 《山东中医杂志》 2024年第2期133-138,152,共7页
目的:探讨中医治疗特发性肺纤维化(IPF)的辨证用药规律,为临床治疗IPF提供参考。方法:在中国知网、万方数据知识服务平台、PubMed、Embase等数据库中,检索建库至2021年8月8日辨证应用中药汤剂治疗IPF的相关文献,提取证型、症状及中药处... 目的:探讨中医治疗特发性肺纤维化(IPF)的辨证用药规律,为临床治疗IPF提供参考。方法:在中国知网、万方数据知识服务平台、PubMed、Embase等数据库中,检索建库至2021年8月8日辨证应用中药汤剂治疗IPF的相关文献,提取证型、症状及中药处方信息,构建IPF医案数据库,采用隐结构模型、频繁项集等数据挖掘方法分析中药汤剂内服治疗IPF的辨证用药规律。结果:共纳入文献39篇,包含病例1497例。纳入文献共包含症状163个,如咳嗽、乏力、气短等,将频次3的53个症状作为显变量构建IPF的隐结构模型,该模型提示气虚血瘀是IPF的常见证型。纳入文献包含的处方中共涉及中药163味,其中高频药物包括黄芪、甘草、丹参、当归、党参等;挖掘出“症状-中药”频繁项集5项,如“胸痛乏力+舌有瘀斑+脉沉细+丹参+桃仁+党参”;“证型-症状-中药”频繁项集4项,如“气虚血瘀+胸闷乏力+舌有瘀斑+黄芪+丹参+当归”。结论:气虚血瘀是IPF的临床常见证型,中药汤剂治疗IPF多以黄芪、甘草、丹参为主要药物,药物配伍根据临床辨证选择。 展开更多
关键词 特发性肺纤维化 数据挖掘 隐结构模型 频繁项集 辨证 用药规律 肺痿
下载PDF
动员需求关联规则挖掘模型
8
作者 高春梅 魏勇 《指挥信息系统与技术》 2024年第1期82-86,共5页
关联规则挖掘是一种成熟的基于规则的数据挖掘算法,已广泛用于发掘数据中感兴趣的关联关系。提出了一种动员需求关联规则模型,并描述了规则挖掘算法实现原理及评价方法。动员需求关联规则模型既可用于辅助快速提报动员需求,又可作为动... 关联规则挖掘是一种成熟的基于规则的数据挖掘算法,已广泛用于发掘数据中感兴趣的关联关系。提出了一种动员需求关联规则模型,并描述了规则挖掘算法实现原理及评价方法。动员需求关联规则模型既可用于辅助快速提报动员需求,又可作为动员需求评估的辅助手段,从而为相关信息系统构建提供参考。 展开更多
关键词 动员需求 关联规则挖掘 频繁项集
下载PDF
基于大数据与关联规则的考评进度动态跟踪系统设计
9
作者 张瑞 张维建 +1 位作者 张新峰 刘颖 《微型电脑应用》 2024年第4期153-156,共4页
为了提高考评进度动态跟踪效果,设计一个基于大数据与关联规则的考评进度动态跟踪系统。在系统硬件部分设计了微控制器、通信模块、存储器模块与信号采集模块;在系统软件部分,采用大数据挖掘技术挖掘员工相关数据,采用关联规则挖掘数据... 为了提高考评进度动态跟踪效果,设计一个基于大数据与关联规则的考评进度动态跟踪系统。在系统硬件部分设计了微控制器、通信模块、存储器模块与信号采集模块;在系统软件部分,采用大数据挖掘技术挖掘员工相关数据,采用关联规则挖掘数据的频繁项集,构建FP树,计算数据的最小支持度和最小置信度,对数据分类,获得员工绩效的关联信息,并整合信息,完成考评进度动态跟踪系统的设计。实验结果表明,该方法能够准确地对员工绩效打分,并在多并发用户访问与多条数量处理上,有效提高了考评进度动态跟踪效果。 展开更多
关键词 大数据 关联规则 考评进度 动态跟踪 频繁项集 最小支持度
下载PDF
考虑频繁项集的智能电网统一数据模型构建
10
作者 冯敏 刘建勇 曾念华 《微型电脑应用》 2024年第10期177-181,共5页
在构建的智能电网数据模型中,存在模型类型纷杂、计算耗时较长等问题,对此构建一种考虑频繁项集的智能电网统一数据模型。提出了频繁项集设计改进的Aprioro算法,改进时考虑4个方面:通过矩阵思想映射事务数据库;优化连接步;优化剪枝步;... 在构建的智能电网数据模型中,存在模型类型纷杂、计算耗时较长等问题,对此构建一种考虑频繁项集的智能电网统一数据模型。提出了频繁项集设计改进的Aprioro算法,改进时考虑4个方面:通过矩阵思想映射事务数据库;优化连接步;优化剪枝步;压缩事务数据库,实施智能电网在线分析系统中文件数据的挖掘。对于挖掘到的文件数据内容,对其实施一系列预处理,包括时序数据修复、时序数据甄别。通过分布式内存数据网格技术实施智能电网统一数据模型的构建,在模型设计中,序列化方法选用writeData方法,反序列化方法选用readData方法,通过3个步骤实现模型的搭建。测试结果:模型分析计算时间为0.35 s,当更新数据的母线个数达到70条,模型能够保持60 000次/min左右的更新频率,当更新数据的节点个数达到800个,模型能够保持110 000次/min以上的更新频率;模型的未来态潮流计算与灵敏度计算耗时均较低。 展开更多
关键词 频繁项集 智能电网 改进Aprioro算法 分布式内存数据网格技术 统一数据模型
下载PDF
关联规则挖掘中Apriori算法的研究与改进 被引量:95
11
作者 崔贯勋 李梁 +2 位作者 王柯柯 苟光磊 邹航 《计算机应用》 CSCD 北大核心 2010年第11期2952-2955,共4页
经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和... 经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,减少Apriori算法中的模式匹配所需的时间开销;改进首次对数据库的处理方法,使得整个算法只扫描一次数据库,并由此提出了改进算法。实验结果表明,改进算法在性能上得到了明显提高。 展开更多
关键词 数据挖掘 关联规则 APRIORI算法 频繁项集 候选项集
下载PDF
基于FP-tree频集模式的FP-Growth算法对关联规则挖掘的影响 被引量:25
12
作者 陆楠 王喆 周春光 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2003年第2期180-185,共6页
通过对两个有代表性的算法Apriori和FP-Growth的剖析,说明频集模式挖掘的过程,比较有候选项集产生和无候选项集产生算法的特点,并给出FP-tree结构的构造方法以及对挖掘关联规则的影响,提出了对算法的改进方法.
关键词 数据挖掘 关联规则 频繁项集 无候选项集 FP-tree频集模式 FP-GROWTH算法
下载PDF
多尺度数据挖掘方法 被引量:28
13
作者 柳萌萌 赵书良 +3 位作者 韩玉辉 苏东海 李晓超 陈敏 《软件学报》 EI CSCD 北大核心 2016年第12期3030-3050,共21页
多尺度理论已被引入到数据挖掘领域,但人们对其研究仍不够深入和完善,缺乏普适性理论与方法.随着大数据处理应用的不断深入,其研究变得更加迫切.针对上述问题,进行了普适的多尺度数据挖掘理论和方法的研究.首先,基于概念分层理论给出了... 多尺度理论已被引入到数据挖掘领域,但人们对其研究仍不够深入和完善,缺乏普适性理论与方法.随着大数据处理应用的不断深入,其研究变得更加迫切.针对上述问题,进行了普适的多尺度数据挖掘理论和方法的研究.首先,基于概念分层理论给出了数据尺度划分和数据尺度的定义以及多尺度数据集之间的上下层尺度数据集关系;其次,阐明了多尺度数据挖掘的定义、研究实质和方法分类;最后,提出了多尺度数据挖掘算法框架,给出其理论基础,并将此框架应用于关联规则挖掘,提出了多尺度关联规则挖掘算法MSARMA(multi-scale association rules mining algorithm),实现了多尺度数据集之间知识的跨尺度推导.利用IBM T10I4D100K数据集和H省全员人口真实数据集对MSARMA算法进行了实验和分析,实验结果表明:算法具有较高的覆盖率、精确度和较低的支持度估计误差,是可行且有效的. 展开更多
关键词 多尺度 频繁项集 关联规则 尺度转换 多尺度关联规则挖掘
下载PDF
基于向量内积的关联规则挖掘算法研究 被引量:15
14
作者 刘以安 刘强 +1 位作者 邹晓华 王士同 《计算机工程与应用》 CSCD 北大核心 2006年第21期172-174,182,共4页
针对近年来研究较多的数据关联挖掘问题,论文将向量内积引入到该领域,并通过合理分配数据存储结构来提高数据库频繁项集的生成效率。研究表明,该方法不仅算法简单、只需扫描一次数据库,而且还具有动态剪枝、不保存中间候选项和节省大量... 针对近年来研究较多的数据关联挖掘问题,论文将向量内积引入到该领域,并通过合理分配数据存储结构来提高数据库频繁项集的生成效率。研究表明,该方法不仅算法简单、只需扫描一次数据库,而且还具有动态剪枝、不保存中间候选项和节省大量内存空间等优点。在处理超大型数据库和分布式数据库方面均能得到较好的应用。 展开更多
关键词 数据挖掘 关联规则 频繁项集
下载PDF
基于项目序列集操作的关联规则挖掘算法 被引量:37
15
作者 毛国君 刘椿年 《计算机学报》 EI CSCD 北大核心 2002年第4期417-422,共6页
最大频繁项目序列集的生成是影响关联规则挖掘的关键问题 ,传统的算法是通过对事务数据库的多次扫描实现的 .最新的研究已经开始通过减少事务数据库的扫描次数进而减少挖掘过程的 I/ O代价来获得更高的效率 .随着计算机性能的提高 ,探... 最大频繁项目序列集的生成是影响关联规则挖掘的关键问题 ,传统的算法是通过对事务数据库的多次扫描实现的 .最新的研究已经开始通过减少事务数据库的扫描次数进而减少挖掘过程的 I/ O代价来获得更高的效率 .随着计算机性能的提高 ,探索合适的数据结构来支持基于一次事务数据库扫描的高效算法成为可能 .该文首先给出项目序列集和它的基本操作的严格定义 ,然后在此基础上提出一个称为 ISS- DM的最大频繁项目序列集生成算法 .ISS- DM算法是通过对事务数据库的一次扫描而逐步演化成最大频繁项目序列集的 . 展开更多
关键词 数据挖掘 关联规则 项目序列集 频繁项目序列集 算法 数据库
下载PDF
满足均匀分布的不确定数据关联规则挖掘算法 被引量:18
16
作者 陈爱东 刘国华 +3 位作者 费凡 周宇 万小妹 貟慧 《计算机研究与发展》 EI CSCD 北大核心 2013年第S1期186-195,共10页
云计算为大数据提供了展示和共享的平台.为了防止隐私泄露,这些数据中往往包含人为添加的不确定因素,如何挖掘这些不确定数据是大数据共享亟待解决的问题.在用于共享的大数据中,不确定数据通过对精确数据的泛化处理来实现,具有均匀分布... 云计算为大数据提供了展示和共享的平台.为了防止隐私泄露,这些数据中往往包含人为添加的不确定因素,如何挖掘这些不确定数据是大数据共享亟待解决的问题.在用于共享的大数据中,不确定数据通过对精确数据的泛化处理来实现,具有均匀分布特性,这一特性不利于精确查询,但可为关联规则的挖掘提供便利条件.首先,依据泛化值之间可能的相交或包含关系,将泛化值进行分层聚类,为了保存与不确定数据集挖掘相关的重要信息,给出了构建不确定频繁模式树的算法,在此基础上,提出了频繁项集挖掘子算法(data mining algorithm for uncertain frequent item-sets,UFI-DM)和关联规则生成子算法(algorithm for generating association rules,GAR),分别用于挖掘频繁项集和生成关联规则,最后,通过理论分析和实验比对,论证了算法的可行性和有效性. 展开更多
关键词 大数据 均匀分布不确定数据 数据挖掘 关联规则 频繁项集
下载PDF
关联规则挖掘中对Apriori算法的一种改进研究 被引量:53
17
作者 刘以安 羊斌 《计算机应用》 CSCD 北大核心 2007年第2期418-420,共3页
针对Apriori算法寻找频繁项集问题,通过对事务数据库的布尔化表示,提出了一种直接利用布尔矩阵的行向量去搜寻频繁项集的思想。即通过向量的内积运算和判别准则逐步浓缩布尔矩阵的行向量,从而快速、直观地归纳出事务数据库的频繁项集。... 针对Apriori算法寻找频繁项集问题,通过对事务数据库的布尔化表示,提出了一种直接利用布尔矩阵的行向量去搜寻频繁项集的思想。即通过向量的内积运算和判别准则逐步浓缩布尔矩阵的行向量,从而快速、直观地归纳出事务数据库的频繁项集。研究和分析表明,该方法不仅算法简单、只需扫描一次数据库,而且还具有搜索速度快、节省内存空间和处理项目集维数大等优点。对于处理超大型事务数据库和分布式事务数据库,同样也有较好的应用。 展开更多
关键词 数据挖掘 关联规则 频繁项集
下载PDF
一种基于FP-Growth的频繁项目集并行挖掘算法 被引量:43
18
作者 章志刚 吉根林 《计算机工程与应用》 CSCD 2014年第2期103-106,共4页
FP-Growth算法是基于FP树挖掘频繁项目集的经典算法,为提高FP-Growth算法挖掘大规模数据频繁项目集的效率,提出了一种基于FP-Growth的频繁项目集并行挖掘算法FPPM。该算法基于Map/Reduce并行模型,在每个计算节点上首先构造局部频繁模式... FP-Growth算法是基于FP树挖掘频繁项目集的经典算法,为提高FP-Growth算法挖掘大规模数据频繁项目集的效率,提出了一种基于FP-Growth的频繁项目集并行挖掘算法FPPM。该算法基于Map/Reduce并行模型,在每个计算节点上首先构造局部频繁模式树,并对之进行挖掘得到局部频繁项目集,然后合并局部频繁项目集以得到全局频繁项集,由于此时得到的结果并不完备,所以对合并后未达到最小支持度阈值的项目集,重新计算其支持数。介绍了FPPM算法的设计思想,测试了其性能。实验结果表明FPPM算法具有较好的可扩展性。 展开更多
关键词 频繁项目集 并行挖掘 FP Growth MAP REDUCE
下载PDF
FP-Growth算法的改进 被引量:25
19
作者 杨云 罗艳霞 《计算机工程与设计》 CSCD 北大核心 2010年第7期1506-1509,共4页
基于FP树的FP-Growth算法在挖掘频繁模式过程中需要两次扫描事务集来建立FP树,这不仅降低了算法的效率,而且给数据库服务器带来负担。在原有经典FP-Growth算法的基础上,提出一种基于二维表的方法对原算法进行改进,改进算法通过使用二维... 基于FP树的FP-Growth算法在挖掘频繁模式过程中需要两次扫描事务集来建立FP树,这不仅降低了算法的效率,而且给数据库服务器带来负担。在原有经典FP-Growth算法的基础上,提出一种基于二维表的方法对原算法进行改进,改进算法通过使用二维向量记录频繁度仅需遍历一次事务集,从而省略FP-Growth算法在生成新条件FP树时对条件模式基的第一次遍历,大大缩短了建立FP树的时间。实验结果表明,该算法的改进优于经典算法。 展开更多
关键词 数据挖掘 关联规则 频繁模式 频繁项集 FP树
下载PDF
关联规则挖掘算法介绍 被引量:16
20
作者 陈玉婷 王斌 +2 位作者 刘博 宋斌 李颉 《计算机技术与发展》 2006年第5期21-25,共5页
数据挖掘是一个多学科交叉融合而形成的新兴的学科,它利用各种分析工具在海量数据中发现模型和数据间的关系。而在大规模事务数据库中,挖掘关联规则是数据挖掘领域的一个非常重要的研究课题。文中介绍了关联规则挖掘的研究情况,描述了经... 数据挖掘是一个多学科交叉融合而形成的新兴的学科,它利用各种分析工具在海量数据中发现模型和数据间的关系。而在大规模事务数据库中,挖掘关联规则是数据挖掘领域的一个非常重要的研究课题。文中介绍了关联规则挖掘的研究情况,描述了经典Apriori算法的实现,并对该算法进行了分析和评价,指出了其不足和原因。描述了FP树挖掘最大频繁项集的算法,通过实例对该算法进行了性能评估,并得到结论:数据库中潜在的最大频繁模式越多,运行时间越长。 展开更多
关键词 数据挖掘 关联规则 频繁项集 FP树
下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部