-
题名基于项目序列集操作理论的关联规则的挖掘算法
- 1
-
-
作者
张雷
刘中杰
刘慧巍
-
机构
渤海大学信息科学与工程学院
-
出处
《兰州工业高等专科学校学报》
2005年第4期20-24,共5页
-
文摘
在关联规划挖掘理论研究上,首次给出了项目序列集格空间,并且探讨了在这个空间上的基本操作算子、基于项目序列集格空间及其操作,建立了关联规则挖掘模型.在关联规则挖掘算法方面,设计了基于项目序列集操作理论的关联规则挖掘算法SIS,该算法执行时间整体上优于Apriori算法,而且随着数据量的增大,该算法执行时间的增长幅度也小于Apriori算法.
-
关键词
数据挖掘
关联规则
项目序列集
-
Keywords
data mining
association rules
set of itemsequences
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名分段扫描生成频繁项目序列集的挖掘算法
- 2
-
-
作者
毛国君
刘椿年
-
机构
北京市多媒体与智能软件重点实验室
北京工业大学计算机学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2004年第7期19-21,202,共4页
-
基金
国家自然科学基金(编号:60173014)
北京市自然科学基金(编号:4022003)
北京市教委资金资助
-
文摘
关联规则挖掘是数据挖掘研究的重要分支。发现频繁项目序列集又是关联规则挖掘中的一个关键阶段。十几年来,许多发现频繁项目集的算法已经被提出。近几年来,人们更关注于在大型数据集中高效发现频繁项目集的算法研究,特别是在减少数据库的扫描次数、提高内存利用率等方面。该文提出一个称为DFISP的算法,它是基于数据分段扫描策略的,并且只需两次数据库扫描即可完成频繁项目序列集的生成。实验表明,DFISP算法是稳定而高效的。
-
关键词
数据挖掘
关联规则
项目序列(集)
数据分段扫描
-
Keywords
data mining,association rules,itemsequences(itemsequence sets),data-partitioning scan
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-