一种多重最小支持度关联规则挖掘算法被引量：10

An algorithm for mining association rules with multiple minimum supports

下载PDF

导出

摘要针对单一最小支持度挖掘关联规则不能反应不同数据项出现频度与性质的问题,提出了一个基于频繁模式树的多重支持度关联规则挖掘算法MSDMFIA(Multiple minimum Supports for Discover Maximum Fre-quent Item sets Algorithm),根据不同数据项的特点定义多重支持度,通过挖掘数据库中的最大频繁项目集,计算最大频繁候选项目集在数据库中的支持度来发现关联规则.该算法可以解决关联规则挖掘中经常出现的稀少数据项问题,并解决了传统的关联规则挖掘算法中的生成频繁候选集和多次扫描数据库的性能瓶颈.实验结果表明,本文提出的算法在功能和性能方面均优于已有算法. Aiming at the problem that traditional methods with only one minsup can not completely reflect different appearing frequencies and natures of different data items, based on FP-Tree, a new algorithm is proposed called MSDMFIA （Multiple minimum Supports for Discover Maximum Frequent Item sets Algorithm）. The algorithm allows users to specify multiple minsups to reflect various items natures. Through mining the maximum frequent item sets, calculating minsups of the maximum candidate frequent item sets, the association rules can be discovered. The algorithm resolves the bottlenecks in traditional algorithms, e. g. , the rare item problem, the frequent generation of candidate item sets and database scanning. Experimental results show that functionality and performance of the proposed algorithm is significantly improved compared with existing algorithms.

作者吴华瑞张凤霞赵春江

机构地区北京工业大学计算机学院聊城大学数学科学学院国家农业信息化工程技术研究中心

出处《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2008年第9期1447-1451,共5页 Journal of Harbin Institute of Technology

基金国家自然科学基金资助项目(60871042) 国家高技术研究发展计划资助项目(2003AA118010 2007AA01Z179)

关键词数据挖掘关联规则最小支持度频繁模式树多重支持度 data mining association rule minimum support FP-Tree multiple supports

分类号 TP182 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献10

1AGGARWAL C, YU P. Online generation of association rules[ C]// International Conference on Data Engineering (ICDE). Orlando : [s.n.].1998:402 - 411.
2AGRAWAL R, IMIELINSKI T, SWAMI A. Mining association rules between sets of items in large databases [ C ]//ACM/SIGMOD Annual Conference on Management of Data. Washingon : [ s. n.], 1993:207 - 210.
3AGRAWAL R, SRIKANT R. Fast algorithms for mining association rules [ C ]//International Conference on Very Large Data Bases(VLDB). Santiago de Chile: [s. n. ], 1994:487 - 499.
4HOUTSMA M, SWAMI A. Set-oriented mining for association rules in relational databases [ C ]// International Conference on Data Engineering. Los Alamitos: IEEE Computer Society Press, 1995:25 - 33.
5SAVASERE A, OMIECINSKI E, NAVATHE S M. An efficient algorithm for mining association rules[ C ]//International Conference on Very Large Data Bases (VEDB). Zurich :[s. n.], 1995:432 - 444.
6LIND I, KEDEM Z M. A new algorithm for discovering the maxhnum frequent set[ C ]//Proceedings of the 6th European Conference on Extending Database Technology. Heidelberg: pringer - Verlag, 1998:105 - 119.
7路松峰,卢正鼎.快速开采最大频繁项目集[J].软件学报,2001,12(2):293-297. 被引量：113
8欧阳为民,郑诚,蔡庆生.数据库中加权关联规则的发现[J].软件学报,2001,12(4):612-619. 被引量：96
9宋余庆,朱玉全,孙志挥,陈耿.基于FP-Tree的最大频繁项目集挖掘及更新算法[J].软件学报,2003,14(9):1586-1592. 被引量：164
10刘君强,孙晓莹,王勋,潘云鹤.挖掘最大频繁模式的新方法[J].计算机学报,2004,27(10):1328-1334. 被引量：15

二级参考文献12

1[1]Agrawal R., Imielinski T., Swami A.. Mining association rules between sets of items in large databases. In: Proceedings of the 1993 ACM SIGMOD International Conference on Management of Data, Washington, D. C. , USA, 1993, 207～216
2[2]Lin D-I. , Kedem Z. M.. Pincer-search: A new algorithm for discovering the maximum frequent set. In: Proceedings of the 6th International Conference on Extending Database Technology, Valencia, Spain, 1998, 105～119
3[3]Bayardo R. J.. Efficiently mining long patterns from databases.In: Proceedings of the 1998 ACM SIGMOD International Conference on Management of Data, Seattle, Washington, USA,1998, 85～93
4[4]Aggarwal C. , Agarwal R. , Prasad V. V. V.. Depth first generation of long patterns. In: Proceedings of the 6th ACM SIGKDD International Conference on Knowledge Discovery ＆ Data Mining, Boston, MA, USA, 2000, 108～118
5[5]Burdick D. , Calimlim M. , Gehrke J.. MAFIA: A maximal frequent itemset algorithm for transactional databases. In: Proceedings of the 17th International Conference on Data Engineering, Heidelberg, Germany, 2001, 443～452
6[6]Agrawal R. , Srikant R.. Fast algorithms for mining association rules. In: Proceedings of the 20th International Conference on Very Large Data Bases, Santiago, Chile, 1994, 487～499
7[7]Liu Jun-Qiang, Pan Yun-He, Wang Ke, Han Jia-Wei. Mining frequent item sets by opportunistic projection. In: Proceedings of the 8th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Alberta, Canada, 2002, 229～238
8[8]Wang Ke, Liu Tang, Han Jia-Wei, Liu Jun-Qiang. Top down FP-growth for association rule mining. In: Proceedings of the 6th Pacific-Asia Conference on Knowledge Discovery and Data Mining, Taipei, Taiwan, China, 2002, 334～340
9Lin Dao I，Proc the 6th European Conference on Extending Database Technology，1998年，105页
10Agrawal R，Proc the 11th Inter Conference on Data Engineering，1995年，3页

共引文献318

1杨近松,胡君.光学镜头结构智能化设计系统[J].光学精密工程,2005,13(z1):21-24. 被引量：5
2魏伟杰,张明卫,张斌,王波.基于最小加权支持的加权序列模式挖掘算法[J].吉林大学学报（工学版）,2008,38(S2):178-183. 被引量：2
3谢志强,朱孟杰,杨静.基于改进FP-树的最大项目集挖掘算法[J].计算机应用研究,2009,26(2):502-505. 被引量：1
4张自敏.基于Apriori的加权关联规则挖掘[J].贺州学院学报,2009,25(1):121-124. 被引量：1
5姜晗,贾泂.基于标记域FP-Tree快速挖掘最大频繁项集[J].计算机研究与发展,2007,44(z2):334-349. 被引量：4
6杨种学.基于并行FP-growth算法挖掘网上关联交易规则[J].南京晓庄学院学报,2005,21(5):65-70.
7蔡红,陈荣耀,陈波.关联规则挖掘最小支持度阀值设定的优化算法研究[J].微型电脑应用,2011(6):33-36. 被引量：9
8王盛,董黎刚,李群.一种基于逆序编码的关联规则挖掘研究[J].杭州电子科技大学学报（自然科学版）,2010,30(5):169-172. 被引量：1
9范全润,李丽,杨泽民.数据挖掘在电子商务中的应用分析[J].德州学院学报,2002,18(4):48-50. 被引量：1
10陈晴光,李际军.汽车ERP中关联规则挖掘与动态更新的实现策略[J].机械制造,2004,42(6):69-72. 被引量：2

同被引文献141

1蔡红,陈荣耀,陈波.关联规则挖掘最小支持度阀值设定的优化算法研究[J].微型电脑应用,2011(6):33-36. 被引量：9
2张桂刚,李超,张勇,邢春晓.一种基于海量信息处理的云存储模型研究[J].计算机研究与发展,2012,49(S1):32-36. 被引量：23
3王彦集,陈天恩,徐刚,陈立平.基于SOA的农田测绘成图系统的设计和实现[J].农业工程学报,2009,25(S2):267-271. 被引量：5
4伍星,陈进,李如强,陈一鸣.基于数据挖掘的设备状态监测和故障诊断[J].振动与冲击,2004,23(4):70-74. 被引量：22
5廖军,谭浩,刘锦德.基于Pi-演算的Web服务组合的描述和验证[J].计算机学报,2005,28(4):635-643. 被引量：107
6查骏雄.数据挖掘在土壤侵蚀分析系统中的应用[J].南昌工程学院学报,2005,24(2):46-48. 被引量：4
7闫伟,张浩,陆剑峰.模糊加权关联规则在设备监控中的应用研究[J].计算机工程与应用,2005,41(28):4-6. 被引量：4
8吴小波,徐维祥.多支持度关联规则在网络使用挖掘中的应用[J].计算机工程与应用,2005,41(31):164-167. 被引量：9
9段军,戴居丰.基于多支持度的挖掘加权关联规则算法[J].天津大学学报,2006,39(1):114-118. 被引量：14
10王艳,姜保庆,宋晶晶.一种新的加权关联规则模型[J].计算机工程与应用,2006,42(5):162-164. 被引量：14

引证文献10

1刘晶,季海鹏,朱清香.改进多重最小支持度关联规则算法在故障诊断中的应用[J].工业工程,2010,13(4):108-111. 被引量：6
2李彦伟,戴月明,王金鑫.多最小支持度的加权关联规则挖掘算法[J].计算机工程与设计,2011,32(3):955-957. 被引量：2
3孙志刚,朱小冬,曲长征.基于关联规则挖掘的维修专业合并研究[J].装备指挥技术学院学报,2011,22(6):116-120.
4张争龙,李星毅.一种多最小支持度加权关联规则挖掘算法[J].科学技术与工程,2013,21(19):5687-5691. 被引量：3
5张志彦,谷川.基于关联规则的含噪高光谱图像分类系统[J].激光杂志,2018,39(12):52-56.
6贺海涛,郑山红,李万龙,彭馨仪.基于关联规则和语义规则的本体概念提取研究[J].吉林大学学报（信息科学版）,2014,32(6):657-663. 被引量：8
7黄水源,段文影,陈桂香,胡苏阳.基于多支持度的增量式关联规则挖掘算法[J].南昌大学学报（理科版）,2015,39(2):139-142. 被引量：1
8陈天恩,刘军萍,王登位,史晓慧.农业云服务可适性技术研究进展[J].中国农业信息,2018,30(1):67-78. 被引量：4
9于海洋.快速挖掘最大频繁项集算法在图书馆管理中的应用[J].计算机与现代化,2020,0(6):68-72. 被引量：2
10王雪平,林甲祥,巫建伟,高敏节.基于可决系数的自适应关联规则挖掘算法[J].智能系统学报,2020,15(2):352-359. 被引量：3

二级引证文献29

1朱清香,滕丽丽,刘晶.基于变权关联规则的设备故障诊断研究[J].燕山大学学报,2011,35(2):167-172. 被引量：2
2孙志刚,朱小冬,曲长征.基于关联规则挖掘的维修专业合并研究[J].装备指挥技术学院学报,2011,22(6):116-120.
3孙志刚,朱小冬,王毅刚.基于改进关联规则的维修专业组合与优化模型[J].计算机应用研究,2013,30(2):410-413. 被引量：2
4朱清香,焦朋沙,刘晶,郝红红.矩阵加权关联规则在故障诊断系统中的应用[J].工业工程,2013,16(2):87-91. 被引量：5
5张争龙,李星毅.一种多最小支持度加权关联规则挖掘算法[J].科学技术与工程,2013,21(19):5687-5691. 被引量：3
6季海鹏,安雅程,杨镇豪,宋美贤,冯海领.数据挖掘在设备维护阶段的应用[J].山东工业技术,2016(2):94-94. 被引量：1
7季海鹏,安雅程,杨镇豪.数据挖掘在设备制造阶段的应用[J].信息系统工程,2016,0(2):33-33.
8金泽龙.基于加权数据勘探技术构建图书馆阅读统计与评价体系研究[J].图书情报导刊,2016,1(5):68-74. 被引量：2
9董洋溢,李伟华,于会.基于混合余弦相似度的中文文本层次关系挖掘[J].计算机应用研究,2017,34(5):1406-1409. 被引量：20
10董洋溢,李伟华,于会.文本特征和复合统计量的领域术语抽取方法[J].西北工业大学学报,2017,35(4):729-735. 被引量：7

1陶芳,郝忠孝.正负关联规则挖掘[J].哈尔滨理工大学学报,2009,14(A01):27-30.
2刘晶,季海鹏,朱清香.改进多重最小支持度关联规则算法在故障诊断中的应用[J].工业工程,2010,13(4):108-111. 被引量：6
3陈超,陈性元,汪永伟,代向东.基于粗糙集理论的冗余规则处理方法[J].计算机工程与设计,2014,35(1):21-25. 被引量：9
4张文静,马冬来,么炜.基于改进Apriori算法的决策推导过程[J].河北农业大学学报,2013,36(2):122-124. 被引量：2
5倪志伟,蔡庆生,方瑾.用神经网络来挖掘数据库中的关联规则[J].系统仿真学报,2000,12(6):685-687. 被引量：10
6曹静.基于用户兴趣度的关联规则挖掘算法[J].计算机光盘软件与应用,2012,15(16):170-171.
7张慧哲,王坚.多重最小支持度频繁项集挖掘算法研究[J].计算机应用,2007,27(9):2290-2293. 被引量：3
8吕刚,王昆仑,郑诚.应用模糊本体的广义关联规则挖掘算法[J].计算机工程与科学,2009,31(9):105-107.
9占美星,杨颖,杨磊.基于树结构多重最小支持度的挖掘算法研究[J].计算机技术与发展,2014,24(8):45-50.
10袁本刚,陈莉,金燕.挖掘数据库中的负频繁模式[J].计算机工程与应用,2010,46(8):117-119. 被引量：1

哈尔滨工业大学学报

2008年第9期

浏览历史

内容加载中请稍等...

一种多重最小支持度关联规则挖掘算法被引量：10

参考文献10

二级参考文献12

共引文献318

同被引文献141

引证文献10

二级引证文献29

相关作者

相关机构

相关主题

浏览历史

一种多重最小支持度关联规则挖掘算法 被引量：10

参考文献10

二级参考文献12

共引文献318

同被引文献141

引证文献10

二级引证文献29

相关作者

相关机构

相关主题

浏览历史

一种多重最小支持度关联规则挖掘算法被引量：10