期刊文献+
共找到48篇文章
< 1 2 3 >
每页显示 20 50 100
Efficient maintenance of multiple-level association rules for deletion of records
1
作者 HONG Tzung-Pei HUANG Tzu-Jung CHANG Chao-Sheng 《通讯和计算机(中英文版)》 2008年第12期1-9,共9页
关键词 信息技术 信息数据库 数据管理 计算方法
下载PDF
A Fast Algorithm for Mining Association Rules 被引量:17
2
作者 黄刘生 陈华平 +1 位作者 王洵 陈国良 《Journal of Computer Science & Technology》 SCIE EI CSCD 2000年第6期619-624,共6页
In this paper, the problem of discovering association rules between items in a large database of sales transactions is discussed, and a novel algorithm, BitMatrix, is proposed. The proposed algorithm is fundamentally ... In this paper, the problem of discovering association rules between items in a large database of sales transactions is discussed, and a novel algorithm, BitMatrix, is proposed. The proposed algorithm is fundamentally different from the known algorithms Apriori and AprioriTid. Empirical evaluation shows that the algorithm outperforms the known ones for large databases. Scale-up experiments show that the algorithm scales linearly with the number of transactions. 展开更多
关键词 DATABASE data mining large itemset association rule minimum support minimum confidence
原文传递
Efficient Mining of Association Rules by Reducingthe Number of Passes over the Database 被引量:2
3
作者 李庆忠 王海洋 +1 位作者 闫中敏 马绍汉 《Journal of Computer Science & Technology》 SCIE EI CSCD 2001年第2期182-188,共7页
This paper introduces a new algorithm of mining association rules. The algorithm RP counts the itemsets with different sizes in the same pass of scanning over the database by dividing the database into m partitions. ... This paper introduces a new algorithm of mining association rules. The algorithm RP counts the itemsets with different sizes in the same pass of scanning over the database by dividing the database into m partitions. The total number of passes over the database is only (k + 2m - 2)/m, where k is the longest size in the itemsets. It is much less than k. 展开更多
关键词 data mining association rule ITEMSET large itemset
原文传递
基于多维关联规则的大规模数据并行挖掘研究
4
作者 赵林燕 雷沁怡 +2 位作者 洪德华 孙琦 刘翠玲 《电子设计工程》 2023年第24期159-162,167,共5页
为了解决因数据离散程度过大导致大规模数据并行挖掘质量变差的问题,提出基于多维关联规则的大规模数据并行挖掘方法。遵循多维关联思想建立关联树结构,根据RFM值计算公式完善多维运算法则,利用多维关联规则构建数据集合。求取近邻值指... 为了解决因数据离散程度过大导致大规模数据并行挖掘质量变差的问题,提出基于多维关联规则的大规模数据并行挖掘方法。遵循多维关联思想建立关联树结构,根据RFM值计算公式完善多维运算法则,利用多维关联规则构建数据集合。求取近邻值指标、逆近邻值指标的数值,以此确定离散挖掘系数,结合该系数并行挖掘大规模数据。实验结果表明,在多维关联规则作用下,数据离散度取值小于35%,数据分布不再呈现稀疏状态,能有效提升大规模数据并行挖掘质量。 展开更多
关键词 多维关联规则 大规模数据 并行挖掘 RFM值 近邻值 逆近邻值
下载PDF
多段支持度数据挖掘算法研究 被引量:23
5
作者 李雄飞 苑森淼 +1 位作者 董立岩 全勃 《计算机学报》 EI CSCD 北大核心 2001年第6期661-665,共5页
在基于相联规则的数据挖掘算法中 ,Apriori等算法最为著名 .它分为两个主要步骤 :(1)通过多趟扫描数据库求解出频繁项集 ;(2 )利用频繁项集生成规则 .随后的许多算法都沿用 Apriori中“频繁项集的子集必为频繁项集”的思想 ,在频繁项集 ... 在基于相联规则的数据挖掘算法中 ,Apriori等算法最为著名 .它分为两个主要步骤 :(1)通过多趟扫描数据库求解出频繁项集 ;(2 )利用频繁项集生成规则 .随后的许多算法都沿用 Apriori中“频繁项集的子集必为频繁项集”的思想 ,在频繁项集 Lk- 1 上进行 JOIN运算构成潜在 k项集 Ck.由于数据库和 Ck 的规模较大 ,需要相当大的计算量才能生成频繁项集 .Apriori Tid算法给每个事务增加了一个唯一标识 Tid ,其特点是只扫描一趟数据库 ,其余趟扫描 (如第 k趟扫描 )均在相应的数据集 Ck上进行 .由于数据规模改变不大 ,各算法的效率差别并不明显 .该文提出分段计算支持度的思想 ,是把一个项集的支持度分段计算 ,每一个段记录该项集在相应规模事务中出现的频度 ,从而构成一个支持度向量 .由于有了项集的多段支持度 ,可以推测出该项集能否包含在更大规模的频繁项集中 ,采用这种算法既提高了在扫描数据库过程中的信息获取率 ,又能及时剔除超集不是频繁项集的项集 ,进一步缩减了潜在项集的规模 .在数据集扫描过程中 ,按文中定理 1的思想调整数据集 。 展开更多
关键词 数据挖掘 相联规则 算法 频繁项集 多段支持度 数据库
下载PDF
关联规则发现的一种改进算法 被引量:9
6
作者 张晓辉 何耀东 +1 位作者 万家华 赵宏 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2001年第4期401-404,共4页
在Apriori算法基础上 ,给出一个改进的关联规则发现算法·由于这个算法只需对交易数据库进行一次搜索 ,能大量减少所需的I/O次数 ,且内存开销适中 ,因此同其他关联规则发现算法相比具有快速的优点 ,适合于大型交易数据库·使用... 在Apriori算法基础上 ,给出一个改进的关联规则发现算法·由于这个算法只需对交易数据库进行一次搜索 ,能大量减少所需的I/O次数 ,且内存开销适中 ,因此同其他关联规则发现算法相比具有快速的优点 ,适合于大型交易数据库·使用合成数据作试验表明这个算法尤其对大型数据库的性能优于先前已有的一些关联规则算法· 展开更多
关键词 数据挖掘 关联规则 交易数据库 频繁项集 算法
下载PDF
基于高校人事信息库的数据挖掘研究 被引量:11
7
作者 陈丽 陈根才 《计算机工程》 CAS CSCD 北大核心 2000年第11期117-119,140,共4页
:运用关联规则发现技术对人事信息库进行数据挖掘,寻找影响学科发展的因素,发现应如何评价一个学科,以及影响学科发展的各要素间的关联关系.该文分析和指出了现有一些挖掘算法的优缺点,提出了Tid-optim算法,并对发现的... :运用关联规则发现技术对人事信息库进行数据挖掘,寻找影响学科发展的因素,发现应如何评价一个学科,以及影响学科发展的各要素间的关联关系.该文分析和指出了现有一些挖掘算法的优缺点,提出了Tid-optim算法,并对发现的规则进行分析,结合实际工作,为管理决策提供参考. 展开更多
关键词 数据挖掘 关联规则 人事信息库 高校 数据库
下载PDF
一种无冗余的快速关联规则发现算法 被引量:7
8
作者 吴伟平 林馥 贺贵明 《计算机工程》 CAS CSCD 北大核心 2003年第8期90-91,108,共3页
关联规则的发现是数据挖掘的一个重要方面。传统算法不但涉及大量的数据库操作,而且生成的关联规则之间存在着大量的冗余规则。文章给出了一种无冗余的快速关联规则算法,能大量减少所需的I/O的次数,内存开销适中,并且利用规则之间... 关联规则的发现是数据挖掘的一个重要方面。传统算法不但涉及大量的数据库操作,而且生成的关联规则之间存在着大量的冗余规则。文章给出了一种无冗余的快速关联规则算法,能大量减少所需的I/O的次数,内存开销适中,并且利用规则之间的冗余关系消除了规则之间的冗余性。 展开更多
关键词 数据挖掘 关联规则 频繁项集 冗东性
下载PDF
基于矩阵的关联规则增量更新算法 被引量:5
9
作者 牛小飞 刘浩 +1 位作者 牛学东 刘秀婷 《计算机工程与应用》 CSCD 北大核心 2006年第21期169-171,206,共4页
该算法用以处理事务数据库不变而最小支持度发生变化后相应关联规则的更新问题。它在充分利用ABM算法挖掘结果的基础上,不需要重新扫描数据库,也不需要额外地为其分配内存单元就能挖掘出所有新的频繁项目集,实验分析证明了UBM算法的正... 该算法用以处理事务数据库不变而最小支持度发生变化后相应关联规则的更新问题。它在充分利用ABM算法挖掘结果的基础上,不需要重新扫描数据库,也不需要额外地为其分配内存单元就能挖掘出所有新的频繁项目集,实验分析证明了UBM算法的正确性和高效性。 展开更多
关键词 数据挖掘 关联规则 频繁项目集 增量更新
下载PDF
AprioriTid算法的改进 被引量:3
10
作者 向程冠 姜季春 +1 位作者 陈梅 王翰虎 《计算机工程与设计》 CSCD 北大核心 2009年第15期3581-3583,共3页
针对关联规则挖掘的AprioriTid算法缺点提出了一种改进的算法,即在构造k阶Tid表时,考虑当前交易项包含的所有k阶候选项的全部元素组成的集合,它肯定是当前交易项的子集。如果它的范数大于k就将其写入k阶Tid表中,而不是它所包含的所有k... 针对关联规则挖掘的AprioriTid算法缺点提出了一种改进的算法,即在构造k阶Tid表时,考虑当前交易项包含的所有k阶候选项的全部元素组成的集合,它肯定是当前交易项的子集。如果它的范数大于k就将其写入k阶Tid表中,而不是它所包含的所有k阶候选项集都写入表中,这样必然减少下一次寻找k+1阶大项集时所需要扫描的交易量,从而使AprioriTid算法得到进一步优化。通过在Northwind数据集上的实验,验证了该算法有效地优化了空间复杂度和时间复杂度。 展开更多
关键词 关联规则挖掘 AprioriTid 大项集 范数 Tid表
下载PDF
挖掘关联规则中对Apriori算法的一个改进 被引量:23
11
作者 芦洁 刘志镜 《微电子学与计算机》 CSCD 北大核心 2006年第2期10-12,共3页
文章针对关联规则中的Apriori算法进行了深入研究,提出了Apriori-I算法。由于这个算法只需要对交易数据库进行一次搜索,能大量减少所需的I/O次数,且内存开销适中,因此同其他关联规则算法相比具有快速的优点,适用于大型交易数据库。使用... 文章针对关联规则中的Apriori算法进行了深入研究,提出了Apriori-I算法。由于这个算法只需要对交易数据库进行一次搜索,能大量减少所需的I/O次数,且内存开销适中,因此同其他关联规则算法相比具有快速的优点,适用于大型交易数据库。使用合成数据作试验表明这个算法尤其对大型数据库的性能优于先前已有的一些关联规则算法。 展开更多
关键词 数据挖掘 关联规则 交易数据库 频繁项集 APRIORI算法
下载PDF
基于图的关联规则挖掘高效算法研究 被引量:4
12
作者 刘独玉 杨晋浩 +1 位作者 钟守铭 李正良 《计算机工程与设计》 CSCD 北大核心 2006年第23期4475-4478,4493,共5页
通过对文献[1]中介绍的基于图的关联规则挖掘算法的详细分析,提出了一种新的基于完全子图的关联规则挖掘算法。该算法利用完全子图与频繁项集的对应关系,以完全子图结点的度作为判断标准,完全避免了不必比较项目之间的比较;同时通过设... 通过对文献[1]中介绍的基于图的关联规则挖掘算法的详细分析,提出了一种新的基于完全子图的关联规则挖掘算法。该算法利用完全子图与频繁项集的对应关系,以完全子图结点的度作为判断标准,完全避免了不必比较项目之间的比较;同时通过设置关联图结点的order值,完全避免了相同项目集的重复比较,从而在寻找k-项频繁集(≥3)的过程中,时间复杂度远小于原算法的k-11。因此,该算法减小了存储空间,加快了挖掘速度,提高了算法的效率。 展开更多
关键词 关联规则 数据挖掘 关联图 完全子图 频繁项集
下载PDF
基于数据挖掘建立高校系科办学评估体系的合理性评价系统 被引量:5
13
作者 陈丽 陈根才 《浙江大学学报(理学版)》 CAS CSCD 2001年第3期263-268,共6页
本文运用关联规则发现方法对人事信息库进行数据挖掘 ,寻找高校系科办学评估体系中各因素间的关联关系 ,并根据关联关系强弱分析各因素的权重设置的合理性 .本文分析和指出了现有一些算法的优缺点 ,提出了 Tid- optim算法 ,并对发现的... 本文运用关联规则发现方法对人事信息库进行数据挖掘 ,寻找高校系科办学评估体系中各因素间的关联关系 ,并根据关联关系强弱分析各因素的权重设置的合理性 .本文分析和指出了现有一些算法的优缺点 ,提出了 Tid- optim算法 ,并对发现的规则进行分析 ,通过数据抽样建立合理性评价系统 ,有效地解决了权重设置的不合理问题 ,为高校管理决策提供科学依据 . 展开更多
关键词 数据挖掘 关联规则 样本抽取 高校 系科办学评估体系 评价系统 权重设置
下载PDF
基于数据挖掘建立动态人事管理决策系统 被引量:3
14
作者 陈丽 孔志洪 陈根才 《计算机工程与应用》 CSCD 北大核心 2001年第20期160-162,165,共4页
运用关联规则发现方法对人事信息库进行数据挖掘,生成了对当前数据库有效的关联规则,为高校管理决策提供科学依据。但数据库的更新操作经常发生,原来有效的部分规则可能在更新后的数据库中会成为无效,原无效的部分规则也同样有可能会成... 运用关联规则发现方法对人事信息库进行数据挖掘,生成了对当前数据库有效的关联规则,为高校管理决策提供科学依据。但数据库的更新操作经常发生,原来有效的部分规则可能在更新后的数据库中会成为无效,原无效的部分规则也同样有可能会成为有效。文章提出了EPUA算法,有效解决了数据更新后关联规则的更新问题,对FUP2算法进行了补充和改进。 展开更多
关键词 高校 人事管理 决策系统 数据挖掘 关联规则
下载PDF
基于向量和矩阵的挖掘关联规则的高效算法 被引量:12
15
作者 牛小飞 石冰 《计算机工程与应用》 CSCD 北大核心 2004年第12期170-173,共4页
挖掘关联规则是数据挖掘中一个重要的课题,产生频繁项目集是其中的一个关键步骤。文章提出了一种基于向量和矩阵的挖掘算法AVM,并将该算法与两种经典的发现频繁项目集的算法进行了比较。该算法只需要对数据库扫描一遍,并且存放辅助信息... 挖掘关联规则是数据挖掘中一个重要的课题,产生频繁项目集是其中的一个关键步骤。文章提出了一种基于向量和矩阵的挖掘算法AVM,并将该算法与两种经典的发现频繁项目集的算法进行了比较。该算法只需要对数据库扫描一遍,并且存放辅助信息所需要的空间也少。实验表明与原先的算法相比,该算法的效率较好。 展开更多
关键词 数据挖掘 关联规则 频繁项集 基于向量和矩阵的算法
下载PDF
大型港机结构应力峰值与小车位置关联规则的数据挖掘 被引量:4
16
作者 宓为建 徐子奇 刘园 《上海海事大学学报》 北大核心 2006年第3期42-46,共5页
通过选取结构的典型测点,建立相应的数据挖掘模型,对大型港机在运行中结构的应力峰值与小车相应位置之间的相互关系进行分析,应用可视化的技术手段,对两者之间的关联规则进行深入挖掘,并通过对支持度、可信度和作用度的计算,衡量挖掘得... 通过选取结构的典型测点,建立相应的数据挖掘模型,对大型港机在运行中结构的应力峰值与小车相应位置之间的相互关系进行分析,应用可视化的技术手段,对两者之间的关联规则进行深入挖掘,并通过对支持度、可信度和作用度的计算,衡量挖掘得到的关联规则的有用性和确定性. 展开更多
关键词 大型港机 数据挖掘 关联规则 支持度 可信度 作用度
下载PDF
概念格递增修正关联规则挖掘方法 被引量:3
17
作者 赵奕 施鹏飞 熊范纶 《上海交通大学学报》 EI CAS CSCD 北大核心 2000年第5期684-687,共4页
研究了一种知识发现与数据挖掘中关联规则的发现方法 .关联规则是数据挖掘的重要方法之一 ,其核心是各大项目集的获取 .针对货篮关联规则挖掘方法 ,提出了一种改进的概念格递增修正方法 .该方法适应于数据库的动态数据递增或递减更新 ,... 研究了一种知识发现与数据挖掘中关联规则的发现方法 .关联规则是数据挖掘的重要方法之一 ,其核心是各大项目集的获取 .针对货篮关联规则挖掘方法 ,提出了一种改进的概念格递增修正方法 .该方法适应于数据库的动态数据递增或递减更新 ,通过记录项目集 (即概念格中的结点 )在数据库中出现的频率值 ,不需要构造完整的格即可求得项目集的支持度值和可信度值 ,以获取大项目集 ,进而求得关联规则 .同时 ,该方法运用 Hasse图解进行可视化操作 。 展开更多
关键词 数据库 数据挖掘 概念格 关联规则 知识发现
下载PDF
挖掘空间关联规则的前缀树算法设计与实现 被引量:8
18
作者 刘君强 潘云鹤 《中国图象图形学报(A辑)》 CSCD 北大核心 2003年第4期476-480,共5页
空间关联规则挖掘是在空间数据库中进行知识发现的一类重要问题 .为此提出了挖掘空间关联规则的二阶段策略 ,通过多轮次单层布尔型关联规则挖掘 ,自顶向下逐步细化空间谓词的粒度 ,从而空间谓词的计算量大大减少 .同时 ,设计了一种基于... 空间关联规则挖掘是在空间数据库中进行知识发现的一类重要问题 .为此提出了挖掘空间关联规则的二阶段策略 ,通过多轮次单层布尔型关联规则挖掘 ,自顶向下逐步细化空间谓词的粒度 ,从而空间谓词的计算量大大减少 .同时 ,设计了一种基于前缀树的单层布尔型关联规则挖掘算法 (FPT- Generate) ,不需要反复扫描数据库 ,不产生候选模式集 ,并在关键优化技术上取得了突破 .实验表明 ,以 FPT- Generate为挖掘引擎的空间关联规则发现系统的时间效率与空间可伸缩性远远优于以经典算法 Apriori为引擎的系统 . 展开更多
关键词 空间关联规则挖掘 空间数据库 前缀树算法 数据组织 检索技术 知识发现 挖掘策略 挖掘方法 性能评价
下载PDF
基于约简概念格的关联规则提取改进算法 被引量:7
19
作者 陈湘 吴跃 《计算机应用研究》 CSCD 北大核心 2011年第4期1293-1295,共3页
为了提高在概念格上生成频繁项集的效率,提出了一个基于约简概念格的生成频繁项集的新算法。该算法通过利用节点之间的父子关系能够直接生成全部频繁项集,省略了对节点进行排序的时间开销,大大减少了节点比较次数,从而提高了频繁项集的... 为了提高在概念格上生成频繁项集的效率,提出了一个基于约简概念格的生成频繁项集的新算法。该算法通过利用节点之间的父子关系能够直接生成全部频繁项集,省略了对节点进行排序的时间开销,大大减少了节点比较次数,从而提高了频繁项集的生成效率。实验结果证明了其可靠性和高效性。 展开更多
关键词 知识发现 数据挖掘 关联规则 频繁项集 约简概念格
下载PDF
关联规则挖掘综述 被引量:20
20
作者 王小虎 《计算机工程与应用》 CSCD 北大核心 2003年第33期190-193,共4页
简要论述了关联规则挖掘的研究情况,给出了关联规则的分类方法,分析和评价了关联规则的一些典型算法,指出了关联规则的兴趣度,最后提出了关联规则研究的发展趋势。
关键词 数据挖掘 关联规则 频集 OLAP
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部