聚类思想在挖掘关联规则中的运用被引量：3

Cluster Analysis in Mining Association Rules for Huge Transaction Database

下载PDF

导出

摘要数据挖掘中的关联分析技术旨在发现大量数据项集之间有趣的关联关系。虽然A priori算法利用剪枝方法有效地提高运算效率,但在处理超大型事务数据库时,仍会存在内存瓶颈问题。按照项集对数据库进行聚类预处理,然后在各个数据簇内进行关联分析以提高运算效率,且簇的数目可根据情况由数据挖掘者根据情况预先指定。通过对该算法的复杂度分析得出在一定条件下运算的时间复杂度确实有所下降的结论。 Association rule mining finds interesting association relationships among a large set of data items. Although the Apriori algorithm can reduce computing times in its prune step,there is stilt a high complexity in dealing with huge transaction database. Some ideal of cluster analysis are applied in Association Rule Mining to reduce the complexity.

作者艾晶宋自林赵靓赵文飞

机构地区解放军理工大学指挥自动化学院研究生解放军理工大学指挥自动化学院指挥自动化系解放军理工大学气象学院雷达教研室南京军区气象水文中心

出处《广西师范大学学报（自然科学版）》 CAS 北大核心 2009年第1期117-120,共4页 Journal of Guangxi Normal University:Natural Science Edition

基金国家863计划资助项目(2007AA01Z126)

关键词数据挖掘关联分析聚类分析频繁项集 data mining association rule mining cluster analysis frequent itemsets

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献6

1[美]TAN Pang-ning,MICHAEL S,VIPIN K.数据挖掘导论[M].范明,范宏建.北京:人民邮电出版社.2006:67.
2HAN Jia-wei,MICHELINE K. Data mining--concepts and techniques[M].北京:高等教育出版社,2001:73-117.
3刘以安,羊斌.关联规则挖掘中对Apriori算法的一种改进研究[J].计算机应用,2007,27(2):418-420. 被引量：53
4臧少杰.数据挖掘常用聚类算法[J].科技信息,2007(30):75-75. 被引量：1
5王晓峰,王天然,赵越.一种自顶向下挖掘长频繁项的有效方法[J].计算机研究与发展,2004,41(1):148-155. 被引量：27
6王涛伟,杨爱民.加权关联规则研究及其在个性化推荐系统中的应用[J].郑州大学学报（理学版）,2007,39(2):65-69. 被引量：6

二级参考文献28

1宫雨,武森,尹阿东,高学东.加权关联规则的改进算法[J].计算机工程与应用,2004,40(22):177-179. 被引量：9
2皮德常,秦小麟,王宁生.基于动态剪枝的关联规则挖掘算法[J].小型微型计算机系统,2004,25(10):1850-1852. 被引量：16
3周晓云,孙志挥,倪巍伟.一种基于加权的高效关联规则挖掘算法的设计与实现[J].计算机工程与应用,2004,40(20):17-19. 被引量：10
4尹群,王丽珍,田启明.一种基于概率的加权关联规则挖掘算法[J].计算机应用,2005,25(4):805-807. 被引量：18
5赵红玲,宋瀚涛,牛振东,刘桂山.Web日志挖掘中数据预处理的研究[J].计算机应用研究,2005,22(6):67-69. 被引量：20
6[1]R Agrawal, T Imielinski, A Swami. Mining association rules between sets of items in large databases. In: Peter Buneman, Sushil Ajodia eds. Proc of ACM SIGMOD Conf on Management of Data, New York: ACM Press, 1993. 207～216
7[2]J Han, J Pei. Mining frequent patterns by pattern-growth: Methodology and implications. ACM SIGKDD Explorations (Special Issue on Scalable Data Mining Algorithms), 2000, 2(2): 14～20
8[3]J Han, J Pei, Y Yin. Mining frequent patterns without candidate generation, In: M Dunham, J Naughton, W Chen eds. Proc of 2000 ACM-SIGMOD Int'l Conf on Management of Data (SIGMOD'00). Dallas, TX, New York: ACM Press, 2000. 1～12
9[4]J Roberto, Jr Bayardo. Efficiently mining long patterns from databases. In: Ashutosh Tiwary, Boeing Co eds. Proc of the 1998 ACM-SIGMOD Int'l Conf on Management of Data (SIGMOD'98), New York: ACM Press, 1998. 85～93
10[5]D-I Lin, Z M Kedem. Pincer-Search: A new algorithm for discovering the maximum frequent set. In: Bertram Ludscher, Wolfgang May eds. Proc of the 6th European Conf on Extending database technology, Proceedings, Lecture Note in Computer 1377. Berlin: Springer 1998, 1998. 105～119

共引文献83

1宋余庆,朱玉全,孙志挥,杨鹤标.一种基于频繁模式树的约束最大频繁项目集挖掘及其更新算法[J].计算机研究与发展,2005,42(5):777-783. 被引量：21
2王评,陈国龙.一种基于人工免疫的新的频繁项挖掘算法[J].计算机科学,2005,32(8):155-157. 被引量：1
3陈凯,冯全源.最大频繁项集的高效挖掘[J].微电子学与计算机,2005,22(8):22-25. 被引量：13
4陈耿,朱玉全,杨鹤标,陆介平,宋余庆,孙志挥.关联规则挖掘中若干关键技术的研究[J].计算机研究与发展,2005,42(10):1785-1789. 被引量：62
5陈凯,冯全源.基于矩阵伪投影策略的频繁项集挖掘方法[J].微计算机信息,2005,21(11X):85-87. 被引量：8
6陈耿,朱玉全,宋余庆,陆介平,孙志挥.基于频繁模式树的约束最大频繁项目集挖掘算法研究[J].应用科学学报,2006,24(1):64-69. 被引量：4
7杨汝鉴.解放思想开拓创新把档案工作做大做强——在2006年全省档案局馆长会议上的讲话(摘要)[J].云南档案,2006(1):6-14.
8朱玉全,陈耿,杨鹤标.正负关联规则挖掘算法研究[J].计算机科学,2006,33(3):188-190. 被引量：10
9石巍,傅彦.基于FP-参考树/表的频繁模式挖掘算法[J].计算机科学,2006,33(6):206-209. 被引量：2
10朱玉全,杨鹤标.负关联规则挖掘算法研究[J].应用科学学报,2006,24(4):382-386. 被引量：5

同被引文献25

1秦如新,田英杰,陈静,邓乃扬,张海斌.双聚类的关联规则挖掘方法[J].北京工业大学学报,2009,35(4):561-565. 被引量：4
2孔锐,张国宣,施泽生,郭立.基于核的K-均值聚类[J].计算机工程,2004,30(11):12-13. 被引量：46
3TUNG A K H, LU Hong-jun, HAN Jia-wei, et al. Efficient mining of intertransaetion association rules[J]. IEEE Transactions on Knowledge and Data Engineering, 2003,15 (1) : 43-56.
4CAMPELLO R J G B,HRUSCHKA E R. On comparing two sequence of numbers and its applications to clustering analysis[J]. Information Sciences, 2009,179(8) : 1025-1039.
5SHI Na ,LIU Xu-min,GUAN Yong. Research on k-means clustering algorithm :an improved k-means clustering algorithm[C].//Proceedings of the 2010 Third International Symposium on Intelligent Information Technology and Security Informatics. Washington DC :IEEE Comtuter Society, 2010 : 63-67.
6LEE A J T,WANG ehun-sheng,WENG Wan-Yu,et al. An efficient algorithm for mining closed inter-transaction itemsets [J]. Data and Knowledge Engineering, 2008,66 (1) : 68-91.
7BUZIKASHVILI N. Sliding window technique for the Web log analysis[C]//Proceedings of the 16th international conference on World Wide Web. New York:ACM Press ,2007 :1213-1214.
8JAIN A K,DUBES R C. Algorithms for clustering data[M]. Englewood Cliffs ,NJ :Prentice-Hall, 1988 : 1-29.
9DING Shi-fei,XU Li,ZHU Hong,et al. Research and progress of cluster algorithms based on granular computing[J]. International Journal of Digital Content Technology and its Applications, 2010,4 (5) : 96-104.
10PAWLAK Z. Rough set[J]. International Journal of Computer and Information Science, 1982,11 (15):341-356.

引证文献3

1祁艳艳,任永功.一种基于聚类分析的事务间关联规则挖掘算法[J].广西师范大学学报（自然科学版）,2011,29(1):98-101.
2徐丽,丁世飞,郭锋锋.基于改进属性约简的粗核聚类算法[J].广西师范大学学报（自然科学版）,2011,29(3):105-109. 被引量：2
3屈展,陈雷.一种改进的APRIORI算法在电子商务中的应用[J].西安石油大学学报（自然科学版）,2012,27(1):91-93. 被引量：4

二级引证文献6

1洪月华.基于粗糙k-均值的分布式聚类算法[J].广西工学院学报,2013,24(1):89-93. 被引量：1
2栗青霞,王换换,傅喆.改进的Apriori算法在试题关联分析中的应用[J].电子科技,2014,27(2):35-38. 被引量：2
3田伟,于泳海.Apriori算法在电子商务中的应用[J].数字技术与应用,2014,32(3):114-114.
4陈霄,曾振东.基于关联规则挖掘的高职院校计算机专业课程设置[J].中国教育信息化（基础教育）,2014(10):75-77. 被引量：1
5卢睿.刑事案件的属性约简聚类算法研究[J].中国人民公安大学学报（自然科学版）,2015,21(1):73-76.
6刘建花.Apriori算法的改进及实例[J].电子技术与软件工程,2019(10):147-147. 被引量：1

1吕刚,郑诚.基于本体的模糊关联规则算法[J].合肥学院学报（自然科学版）,2009,19(2):29-32.
2辛志,刘少辉,史忠植.关联规则算法的实现与改进[J].计算机工程与应用,2002,38(24):190-192. 被引量：14
3李鹏飞,李海波.云制造环境下基于功能需求的资源发现方法[J].微型机与应用,2014,33(8):71-74. 被引量：2
4李绪成,王保保.挖掘关联规则中Apriori算法的一种改进[J].计算机工程,2002,28(7):104-105. 被引量：70
5吴玉霄,白尚旺,王永明.一种支持QoS预测的语义Web服务发现模型[J].电脑开发与应用,2013,26(6):51-54.
6崔江,王友仁.基于聚类预处理和支持向量机的模拟电路故障诊断技术[J].计算机应用,2006,26(8):1977-1979. 被引量：2
7刘硕,高海宁,李蜀瑜.保证服务质量的Web服务优化选取[J].微计算机应用,2011,32(9):1-8.
8夏骄雄,徐俊,吴耿锋.基于本体核与直方图的聚类预处理方法[J].上海大学学报（自然科学版）,2008,14(1):19-25. 被引量：1
9郏方贵,泮海敏.一个高效剪枝的新关联规则挖掘算法[J].计算机应用研究,2004,21(11):168-169. 被引量：5
10徐俊,夏骄雄,李青.用主成份提取进行数据库聚类预处理[J].上海大学学报（自然科学版）,2007,13(6):705-710. 被引量：7

广西师范大学学报（自然科学版）

2009年第1期

浏览历史

内容加载中请稍等...

聚类思想在挖掘关联规则中的运用被引量：3

参考文献6

二级参考文献28

共引文献83

同被引文献25

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

聚类思想在挖掘关联规则中的运用 被引量：3

参考文献6

二级参考文献28

共引文献83

同被引文献25

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

聚类思想在挖掘关联规则中的运用被引量：3