一种提高并行数据挖掘效率的方法被引量：2

A Method to Improve the Performance of Parallel Data Mining

下载PDF

导出

摘要发现关联规则是数据挖掘的一项重要任务,本文介绍了几种数据挖掘的串行和并行算法。其中IDD算法是一种高效的和易于扩展的发现关联规则的并行算法,然而,当处理器数目增加时,由于负载的失衡导致其效率的严重下降,于是通过引入近似算法成功地解决了这个问题。我们给出了两种近似算法和其性能证明,其一是在线算法,另一种是离线算法。在本文的最后,我们进行了改进的IDD算法的复杂性分析。 Discovery of association rules is an important data mining task. Several parallel and sequential algorithms have been proposed in this paper to solve the problem. IDD algorithm is an efficient and scalable parallel method applied in the discovery of association rules in the field of data mining- However.it becomes less effective when processors increases due to the imbalance. Therefore, IDD is improved by means of introducing approximate algorithms to solve the problem of load balance effectively. There are two approximate algorithms,one is called online algorithm.and the other is named offline algorithm. After that,we give the proof of their performance ratio. In the last part.it is the complexity analysis of the improved IDD algorithm.

作者佘春东范植华孙世新车著明唐剑

机构地区电子科技大学计算机科学与工程学院中国科学院软件研究所西昌卫星发射中心技术部

出处《计算机科学》 CSCD 北大核心 2004年第2期132-134,166,共4页 Computer Science

基金中国科学院知识创新工程方向性研究项目基金(名称:大型数字对象应用环境及其并行模拟批准号:KGCX2-JG-09) 总装备部西昌卫星发射中心实验技术项目基金

关键词数据库知识发现并行数据挖掘效率关联规则数据集合数据驱动计算机 Data mining, Parallel processing. Association rules , Load balance , Scalability, Approximate algorithm. Online algorithm, Off line algorithm

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献12

1[1]Stonebraker M,et al.DBMS research at A crossroads:The Vienna update.In:Proc. of the 19th VLDB Conf.Dublin,Ireland,1993.688～692
2[2]Chen M S,Han J,Yu P S.Data mining: An overview from database perspective.IEEE Transactions on knowledge and Data Eng.,1996,8(6):866～833
3[3]Mannila H,Toivonen H,Verkamo I. Efficient algorithms for discovering association rules.In:AAAI Wkshp. Knowledge Discovery in Databases,1994
4[4]Agrawal R,Imielinski T,Swami A. Mining association rules between sets of items in large databases.In:ACM SIGMOD Intl. Conf. Management of Data,1993
5[5]Park J,Chen M,Yu P S. An effective hash based algorithm for mining association rules.In:ACM SIGMOD Intl. Conf. Management of Data,1995a
6[6]Holsheimer M,Kersten M,Mannila H,Toivonen H.a perspective on databases and data mining.In:1st Intl. Conf. Knowledge Discovery and datamining,1995
7[7]Houstma M,Swami A. Set-oriented mining of association rules in relational databases. In:11th Intl. Conf. Data Engineering,1994
8[8]Agrawal R,Srikant R. Fast algorithms for mining association rules.In:Proc.of the 20th VLDB Conf.Santiago,Chile,1994.487～499
9[9]Savasere A,Omiecinski E,Navathe S.An efficient algorithm for mining association rules in large databases.In:Proc.of the 21st VLDB Conf.Zurich,Switzerland,1995.432～443
10[10]Agrawal R,Shafer J. Parallel mining of association rules. IEEE transactions on knowledge and Data Eng.,1996,8(6):962～969

同被引文献11

1刘华元,袁琴琴,王保保.并行数据挖掘算法综述[J].电子科技,2006,19(1):65-68. 被引量：15
2赵岩,赵慧娟.数据挖掘理论与技术[J].福建电脑,2006,22(2):54-54. 被引量：14
3陈良维.数据挖掘中聚类算法研究[J].微计算机信息,2006(07X):209-211. 被引量：32
4王轶,达新宇.分布式并行数据挖掘计算框架及其算法研究[J].微电子学与计算机,2006,23(9):223-225. 被引量：9
5[1]韩家炜.数据挖掘概念与技术[M].北京:高等教育出版社,2000.
6[4]Jin R,Yang G,Agrawal G.Shared Memory Parallelization of-Data Mining Algorithms:Techniques,Programming Interface,and Performance.IEEE Transaction on Knowledge and DataMining,2005,17(1),72～73.
7倪巍伟,陈耿,孙志挥.一种基于数据垂直划分的分布式密度聚类算法[J].计算机研究与发展,2007,44(9):1612-1617. 被引量：8
8张文燕,欧阳为民.水平划分数据的私密保持序贯模式挖掘[J].计算机工程,2007,33(19):170-172. 被引量：1
9庄艳,陈继明,徐丹,潘金贵.基于Multi-agents系统的分布式数据挖掘[J].计算机科学,2007,34(12):163-167. 被引量：10
10汤效琴,戴汝源.数据挖掘中聚类分析的技术方法[J].微计算机信息,2003,19(1):3-4. 被引量：87

引证文献2

1高翔,侯小静.数据挖掘技术综述[J].牡丹江教育学院学报,2008(6):109-110. 被引量：2
2华铨平.面向数据特征的分布式数据挖掘研究[J].计算机工程与设计,2010,31(6):1313-1315. 被引量：2

二级引证文献4

1成亮星.数据挖掘技术在军事情报管理系统中的应用[J].科技情报开发与经济,2010,20(7):90-92. 被引量：4
2何开锋,钱炜祺,汪清,孔轶男,王文正.数据融合技术在空气动力学研究中的应用[J].空气动力学学报,2014,32(6):777-782. 被引量：16
3邓仲华,李志芳.基于情报学视角的科学研究第四范式需求分析[J].情报科学,2015,33(7):3-6. 被引量：11
4杨向荣,王希武,王涌鑫.基于特征值的标称数据相关分析[J].计算机与数字工程,2016,44(5):822-824.

1佘春东,孙世新,范植华,胡世祥,车著明.一种改进的并行挖掘关联规则的算法[J].小型微型计算机系统,2004,25(12):2139-2142.
2颜雪松,蔡之华.一种改进的挖掘关联规则的并行算法研究[J].计算机工程,2002,28(6):104-107. 被引量：2
3吴磊,陈鹏.基于并行计算的关联规则挖掘优化算法[J].计算机应用,2005,25(9):1989-1991. 被引量：3
4周莲英,朱锋.一种改进的社交网络影响力最大化算法[J].信息技术,2015,39(3):117-120.
5陈涛,石伟胜,陈启买.关联规则的并行挖掘算法研究[J].现代计算机,2006,12(7):27-30. 被引量：1
6邢丽娟,杨世忠.基于多椭圆集序列的鲁棒模型预测优化控制[J].计算机仿真,2013,30(8):350-355.
7沈益民,范玉顺.企业协同服务组合的在线选择方法[J].计算机集成制造系统,2008,14(4):799-805. 被引量：6
8于阳,李涛,胡晓勤,王丹丹,王姝妲,刘莎.一种安全电子招标系统中专家抽取的方法[J].计算机应用研究,2007,24(1):180-182. 被引量：13
9商昱.点击网络[J].青年科学,2003(7):15-15.
10宗美玲,童小念.视景仿真系统中模型数据库的优化实现[J].武汉理工大学学报,2009,31(18):102-104. 被引量：7

计算机科学

2004年第2期

浏览历史

内容加载中请稍等...

一种提高并行数据挖掘效率的方法被引量：2

参考文献12

同被引文献11

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

一种提高并行数据挖掘效率的方法 被引量：2

参考文献12

同被引文献11

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

一种提高并行数据挖掘效率的方法被引量：2