期刊文献+

基于数据仓库和作业的高效改进Apriori算法

Efficiently improved Apriori algorithm based on data warehouse and job
下载PDF
导出
摘要 数据挖掘需要有"纯净"的数据和良好的数据组织,数据的质量直接影响到数据挖掘的效果,数据仓库从各类数据源中抽取数据,经过清洗、集成、选择、转换处理,为数据挖掘所需要的高质量数据提供了保证。本文提出以数据仓库为数据源,采用作业定时预先生成简化的频繁2-项集,应用存储过程执行效率高的特点,在压缩数据库大小的同时也压缩频繁i项集的大小,实现高效改进Apriori算法。 Data mining needs to have pure data and good data organization, the quality of data directly affects the effectiveness of data mining, and data warehouse extracts data from various data sources, by cleaning, integration, choice and transformation, and provides a guarantee for data mining. Based on the data warehouse, this paper improves efficiently the Apriori algorithm, firstly, by the way of Job generating the frequent 2-set, timing, and application of the characteristics implementation efficiently of the stored procedure, compressing the database and frequent i-set.
出处 《河北省科学院学报》 CAS 2008年第2期10-14,共5页 Journal of The Hebei Academy of Sciences
基金 天津市科技发展计划资助项目(04310941R)
关键词 APRIORI算法 数据仓库 DTS包 作业 存储过程 最小支持度 Apriori Data warehouse DTS Job Stored procedure Minimum support
  • 相关文献

参考文献4

二级参考文献8

  • 1周焕银,张永,蔺鹏.一种不产生候选项挖掘频繁项集的新算法[J].计算机工程与应用,2004,40(15):182-185. 被引量:14
  • 2王创新.关联规则提取中对Apriori算法的一种改进[J].计算机工程与应用,2004,40(34):183-185. 被引量:32
  • 3龙银香.移动计算环境下的数据挖掘研究[J].微计算机信息,2005,21(07X):35-38. 被引量:17
  • 4JiaweiHan MichelineKamber 范明 孟小峰译.数据挖掘概念和技术[M].北京:机械工业出版社,2001..
  • 5Agrawal R,Srikant R.Fast algorithms for mining association rules [C].In Proceeding of the 20th International Conference on Very Large Databases. 1994, 487-499
  • 6R Agrawal, Tlmielinski, A Swami. Mining associationrules between sets of items in large databases[C]. In: Proceedings of zhe ACM SIG MOD International Conference on Management of data.Washington DC,1993:207-216
  • 7AGRAWAL R. Database Ming: A Performance Prospective [J].IEEE Transaction on knowledge and data engineering 1993.5:914-925
  • 8李雄飞,数据挖掘与知识发现[M].北京:高等教育出版社,2004.

共引文献38

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部