-
题名基于索引数组的频繁项集挖掘算法
被引量:2
- 1
-
-
作者
张忠平
李岩
林志杰
王爱杰
-
机构
燕山大学信息科学与工程学院计算机应用技术
-
出处
《计算机应用研究》
CSCD
北大核心
2009年第1期44-46,共3页
-
基金
国家自然科学基金资助项目(60773100)
国家教育部科学技术研究重点资助项目(205014)
河北省教育厅科研计划资助项目(2006143)
-
文摘
基于现有的关联规则挖掘算法,提出了一种通过循环迭代增加项为项集后缀的方式产生所有项集的新方法,构造了一种新的数据结构—索引数组,存储所发现的频繁1-项集及其相关信息,以便快速发现项集与事务之间的关系;并提出了一种基于索引数组的频繁项集挖掘新算法。该算法只需扫描数据库两次就能发现所有频繁项集。实验结果表明,该算法可以有效提高频繁项集的挖掘效率。
-
关键词
数据挖掘
关联规则
频繁项集
索引数组
-
Keywords
data mining
association rule
frequent itemsets
index array
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于结构图的ETL过程建模方法
被引量:5
- 2
-
-
作者
张忠平
赵瑞珍
-
机构
燕山大学信息科学与工程学院计算机应用技术系
-
出处
《计算机应用研究》
CSCD
北大核心
2008年第11期3354-3356,共3页
-
基金
国家自然科学基金资助项目(60773100)
国家教育部科学技术研究重点资助项目(205014)
河北省教育厅科研计划资助项目(2006143)
-
文摘
ETL是数据仓库获得高质量数据的重要环节,在数据仓库建设过程中占有极其重要的地位。为了便于ETL过程的设计、维护和修改,提出一种基于结构图的ETL过程建模方法,并依据该方法完成了ETL概念模型的设计。通过图形化ETL过程中的元素和关联,该模型清晰直观地反映了数据的来源和流向、源数据与目标数据之间的映射和转换关系,辅助设计人员更好地进行ETL过程的设计和ETL过程的编码实现,使整个ETL设计过程更加方便、灵活。
-
关键词
数据仓库
抽取转换加载
结构图
模型
-
Keywords
data warehouse
ETL
architecture graph
model
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-