-
题名基于最大频繁项目序列集挖掘DMFIA算法的改进
被引量:1
- 1
-
-
作者
宋卫林
徐惠民
-
机构
北京邮电大学电信工程学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2007年第7期1493-1496,1500,共5页
-
文摘
为了有效地解决客户序列视图数据库的数据挖掘问题,借鉴了关联规则挖掘最大频繁项目集DMFIA算法的相关思想。详细阐述了该算法,针对原算法不能有效地解决客户序列视图数据库的数据挖掘这一问题,在原算法的基础上结合序列模式提出了改进的DMFIA算法,并在原算法的基础上有了较大的改进。为了验证算法的正确性,运用Ora-cle9i数据库的PL/SQL进行了相应的验证。实验结果证实了改进算法的有效性和实用性,并具有较好的创新性和理论价值。
-
关键词
数据挖掘
关联规则
序列模式
DMFIA算法
最大频繁项目集
最大频繁项目序列集
-
Keywords
data mining
association rule
sequence pattern
DMFIA algorithm
maximum frequent item sets
maximum frequent item sequence sets
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于最大频繁项目序列集挖掘ISS_DM算法的改进
- 2
-
-
作者
宋卫林
徐惠民
-
机构
北京邮电大学电信工程学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2007年第3期500-503,共4页
-
文摘
阐述了挖掘最大频繁项目序列集ISS_DM算法,针对该算法不能有效地解决客户序列视图数据库的数据挖掘问题,结合序列模式提出了改进的ISS_DM算法,并进行了相应的验证。实践证明,改进后的算法同原算法相比,对相同的数据量进行挖掘,算法执行时间明显减少,效益较高。
-
关键词
数据挖掘
序列模式
最大频繁项目序列集
最大频繁客户序列集
关联规则
-
Keywords
data mining
sequence pattern
maximum fi'equent item sequence sets
maximum fi'equent customer sequence sets
association rule
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名改进的最大频繁项目序列集挖掘算法
- 3
-
-
作者
李瑞
马春艳
-
机构
大连交通大学软件学院
-
出处
《大连交通大学学报》
CAS
2008年第2期54-57,共4页
-
文摘
影响关联规则挖掘的关键问题是最大频繁项目序列集的生成问题,而传统的算法往往要求对事务数据库进行多次扫描,从而提高了I/O代价.阐述了项目序列集和它的基本操作的定义,然后详细描述了ISS-DM的最大频繁项目序列集生成算法,并在此基础上提出了一种改进的ISS-DM算法,最后进行了相应的验证.实践证明,改进后的算法同原算法相比,对相同的数据量进行挖掘,算法执行时间明显减少,效率较高.
-
关键词
关联规则
最大频繁项目序列集
ISS-DM算法
-
Keywords
association rules
maximal frequent item sequence sets
ISS-DM algorithm
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于项目序列集操作的关联规则挖掘算法
被引量:37
- 4
-
-
作者
毛国君
刘椿年
-
机构
北京工业大学计算机学院
-
出处
《计算机学报》
EI
CSCD
北大核心
2002年第4期417-422,共6页
-
基金
国家自然科学基金 (60 173 0 14 )
北京市自然科学基金(4 0 2 2 0 0 3 )
北京市教委资金资助
-
文摘
最大频繁项目序列集的生成是影响关联规则挖掘的关键问题 ,传统的算法是通过对事务数据库的多次扫描实现的 .最新的研究已经开始通过减少事务数据库的扫描次数进而减少挖掘过程的 I/ O代价来获得更高的效率 .随着计算机性能的提高 ,探索合适的数据结构来支持基于一次事务数据库扫描的高效算法成为可能 .该文首先给出项目序列集和它的基本操作的严格定义 ,然后在此基础上提出一个称为 ISS- DM的最大频繁项目序列集生成算法 .ISS- DM算法是通过对事务数据库的一次扫描而逐步演化成最大频繁项目序列集的 .
-
关键词
数据挖掘
关联规则
项目序列集
频繁项目序列集
算法
数据库
-
Keywords
data mining,association rule, set of item sequences,frequent set of item sequences
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名时态约束下的数据挖掘问题及算法
被引量:5
- 5
-
-
作者
毛国君
刘椿年
-
机构
北京市多媒体与智能软件重点实验室
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2003年第11期1690-1694,共5页
-
基金
国家自然科学基金 (No .60 1 730 1 4 )
北京市自然科学基金 (No.40 2 2 0 0 3)
北京市教委资金
-
文摘
对于一个大型数据库而言 ,为了提高挖掘效率 ,必须考虑减少数据库的扫描次数 ,同时使内存需求量保持在一个适当的水平上 .把时态约束应用到事务数据库的挖掘中 ,可以获得更好的效率 .本文首先利用时态区间代数操作实现原始数据库的过滤和挖掘时态区间的合并 ;然后在定义项目序列集操作的基础上 ,提出一个称为TISS DM的发现频繁项目序列集的高效算法 ;最后讨论了这个算法的效率 .
-
关键词
数据挖掘
关联规则
时态区间
频繁项目序列
-
Keywords
data mining
association rule
temporal interval
frequent itemsequence
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-