一种基于并行矩阵目标明确的Apriori算法被引量：5

An Apriori algorithm with purpose based on the parallel matrix

下载PDF

导出

摘要传统的Apriori算法需要频繁扫描数据库,导致系统I/O、内存和通信的开销增大,且由于挖掘目标不明确,产生大量的无用或无意义的规则,导致关联规则的挖掘速度不理想,难以满足大数据时代下的数据挖掘需求.针对这些问题,提出了一种基于并行矩阵目标明确的Apriori算法,该算法结合数据划分原理与MapReduce将规则挖掘过程并行化,同时将事务数据库矩阵化使数据库扫描次数减少到两次,并且设定目标项缩小了候选项集的规模和挖掘过程系统开销,提高了算法的性能,使算法更适用于分布式系统进行大数据的挖掘.最后通过实验证明改进后算法具有更好的性能,且挖掘出来的规则更符合用户需求. The tranditional Apriori algorithm need to scan database frequently,which means increased overhead for system I/O,memory,and communications.At the same time,due to the aimless searching,which will output some useless rules and the association rule mining speed is not ideal,it will be difficult to meet the data mining needs in the big-data age.In order to solve those problems,a new Apriori algorithm is proposed.This algorithm combines the principle of data partitioning and parallelizing the rule mining process with MapReduce.At the meantime,it can reduce the size of the candidate set and the overhead of the mining process by setting target items.It can improve the performance of the algorithm and be more suitable for distributed systems for large data mining.Finally,we use an experiment to prove that improved algorithm has better performance and the minded rules are more meet user needs.

作者李伟朱赵元

机构地区浙江工业大学计算机科学与技术学院

出处《浙江工业大学学报》 CAS 北大核心 2017年第5期574-579,共6页 Journal of Zhejiang University of Technology

关键词数据挖掘 APRIORI算法矩阵 MAPREDUCE 关联规则 data mining Apriori-based algorithm matrix MapReduce association rules

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献12

1罗丹,李陶深.一种基于压缩矩阵的Apriori算法改进研究[J].计算机科学,2013,40(12):75-80. 被引量：46
2周欣,沙朝锋,朱扬勇,施伯乐.兴趣度——关联规则的又一个阈值[J].计算机研究与发展,2000,37(5):627-633. 被引量：91
3魏玲,魏永江,高长元.基于Bigtable与MapReduce的Apriori算法改进[J].计算机科学,2015,42(10):208-210. 被引量：22
4邓波,张玉超,金松昌,林旺群.基于MapReduce并行架构的大数据社会网络社团挖掘方法[J].计算机研究与发展,2013,50(S2):187-195. 被引量：10
5官亚雄,陈卫东.基于数据挖掘的促销决策支持系统[J].浙江工业大学学报,2006,34(2):174-178. 被引量：6
6张忠林,田苗凤,刘宗成.大数据环境下关联规则并行分层挖掘算法研究[J].计算机科学,2016,43(1):286-289. 被引量：27
7孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,50(1):146-169. 被引量：2391
8郝平,倪国华,余育青.基于OLAP分析和关联规则的区域能耗预警系统研究[J].浙江工业大学学报,2013,41(5):534-538. 被引量：6
9杨泽民.基于时序和兴趣度约束的加权关联规则挖掘算法研究[J].计算机科学,2013,40(3):259-262. 被引量：5
10黄名选,严小卫,张师超.基于矩阵加权关联规则挖掘的伪相关反馈查询扩展[J].软件学报,2009,20(7):1854-1865. 被引量：70

二级参考文献244

1李小兵,吴锦林,薛永生,翁伟.关联规则挖掘算法的改进与优化研究[J].厦门大学学报（自然科学版）,2005,44(4):468-471. 被引量：9
2董祥军,宋瀚涛,姜合,陆玉昌.时态关联规则的研究[J].计算机工程,2005,31(15):24-26. 被引量：12
3芦洁,刘志镜.挖掘关联规则中对Apriori算法的一个改进[J].微电子学与计算机,2006,23(2):10-12. 被引量：23
4王艳,姜保庆,宋晶晶.一种新的加权关联规则模型[J].计算机工程与应用,2006,42(5):162-164. 被引量：14
5程玉胜,邓小光,江效尧.Apriori算法中频繁项集挖掘实现研究[J].计算机技术与发展,2006,16(3):58-60. 被引量：16
6沈国强,覃征,沈云斐.一种高效的多维多层关联规则挖掘算法[J].计算机工程与应用,2006,42(12):174-176. 被引量：7
7陈刚良,郝平.制造执行系统(MES)在染色车间的应用[J].浙江工业大学学报,2007,35(2):132-135. 被引量：4
8李晓虹,尚晋.一种改进的新Apriori算法[J].计算机科学,2007,34(4):196-198. 被引量：26
9郭福亮,左凯伶.关联规则挖掘中Apriori算法的一种改进[J].计算机与数字工程,2007,35(5):3-4. 被引量：3
10左万利刘居正.包含正负属性的关联规则及其挖掘.第十六届全国数据库学术会议论文集[M].兰州,1999.288-292.

共引文献2696

1韩莹莹,钟专,褚月娇,康春阳,李东霓,王志佳,刘晓阳,张白羽.基于大数据智能化背景下神经病学实践教学体系构建的探索[J].中国实验诊断学,2023,27(8):1006-1009.
2李坪.大数据赋权正当性证成[J].中山大学法律评论,2020(1):3-21. 被引量：1
3孙昊鹏.大数据在新冠肺炎疫情中的应用和缺失[J].郑州师范教育,2020,9(3):91-96. 被引量：1
4闫妍.刍议大数据时代背景下全面预算管理对提升项目储备精益化管理水平的价值[J].质量与市场,2020,0(1):19-21. 被引量：6
5叶青.违法立案的检察监督机制研究[J].国家检察官学院学报,2024,32(1):53-68. 被引量：1
6刘厚营.大数据在安保工作情报分析中的应用[J].工程技术研究,2018,3(1):243-244. 被引量：1
7肖楠,陈红梅.从融媒体到智媒体:一种技术驱动下的传媒经济发展路径[J].新闻知识,2020(9):19-22. 被引量：3
8张嘉,白晓飞,陶超,张小桐.大规模空间矢量数据分布式存储与计算优化[J].计算机系统应用,2020,29(12):251-256. 被引量：6
9杨东,郑清洋.从TikTok事件看数字人民币的路径选择:从流量入口到金融优势的转化[J].新疆师范大学学报（哲学社会科学版）,2021,42(4):126-135. 被引量：6
10刘生龙,张晓明,杨竺松.互联网使用对农村居民收入的影响[J].数量经济技术经济研究,2021,38(4):103-119. 被引量：68

同被引文献35

1雷蕾,崔蒙,秘仲凯.关联规则挖掘在治疗肺癌组分中药发现中的应用研究[J].中国中药杂志,2010,35(16):2192-2195. 被引量：24
2苗苗苗,王玉英.基于矩阵压缩的Apriori算法改进的研究[J].计算机工程与应用,2013,49(1):159-162. 被引量：29
3应毅,任凯,刘正涛.基于云计算技术的数据挖掘[J].微电子学与计算机,2013,30(2):161-164. 被引量：20
4张敏,姚良威,侯宇.基于向量和矩阵的频繁项集挖掘算法研究[J].计算机工程与设计,2013,34(3):939-943. 被引量：7
5晏杰,亓文娟.基于Aprior&FP-growth算法的研究[J].计算机系统应用,2013,22(5):122-125. 被引量：29
6阴爱英.基于线程并行计算的Apriori算法[J].西安科技大学学报,2014,34(1):71-74. 被引量：6
7翟广宇,王式功,董继元,尚可政,张莹.兰州市上呼吸道疾病与气象条件和空气质量的关联规则分析[J].兰州大学学报（自然科学版）,2014,50(1):66-70. 被引量：18
8刘芳,吴广潮.一种基于压缩矩阵的改进Apriori算法[J].山东大学学报（工学版）,2018,48(6):82-88. 被引量：9
9黄常海,高德毅,胡甚平,耿鹤军,彭宇.基于Apriori算法的船舶交通事故关联规则分析[J].上海海事大学学报,2014,35(3):18-22. 被引量：27
10吴青,罗儒国,王权于.基于关联规则的网络学习行为实证研究[J].现代教育技术,2015,25(7):88-94. 被引量：20

引证文献5

1王玉珍,常丹.基于Apriori算法的农资网站用户行为分析[J].邵阳学院学报（自然科学版）,2018,15(2):19-25.
2陈海军.基于Apriori数据挖掘算法的信息推荐图书管理系统设计[J].现代电子技术,2019,42(23):115-119. 被引量：16
3吴昊,刘钊,顾进广.基于哈希表与十字链表存储的Apriori算法优化[J].计算机应用与软件,2022,39(7):247-255. 被引量：1
4吴昊,刘钊,顾进广.基于邻接表存储与哈希表的频繁项集挖掘算法[J].计算机应用与软件,2023,40(7):266-273.
5汪敏,朱习军.基于改进的Apriori算法的关联规则分析[J].计算机科学与应用,2021,11(6):1706-1716. 被引量：2

二级引证文献19

1单凯轩.基于云计算的数据挖掘系统设计分析[J].计算机产品与流通,2020(9):187-188.
2胡正雨,刘文锐.基于Agent的图书管理信息系统的功能研究[J].信息记录材料,2020,21(4):161-162.
3李昕,谢颖华.基于关联规则算法的检查器组优化建议机制[J].信息技术与网络安全,2020,39(7):67-71.
4孙秀惠.Web环境下图书管理系统开发分析[J].电子技术与软件工程,2020(22):30-31.
5杨鑫,赵凯,马原东,杨典,杨秀璋,罗子江.基于情感分析和Word2Vec的图书推荐方法[J].图书情报导刊,2021,6(3):46-52. 被引量：4
6陈翠娟.基于关联分析的计算机软件数据挖掘技术[J].安阳师范学院学报,2021(2):28-31. 被引量：6
7阳馨,张晓,张修阳,刘语欢.基于有限计算环境的推荐信息过滤算法[J].太赫兹科学与电子信息学报,2021,19(2):319-323.
8杨宇环,张开生.融合FP-Growth和RBM的图书推荐算法研究[J].陕西科技大学学报,2021,39(4):156-160. 被引量：4
9陈辉,张福峰,曲永强,赵铁英,刘玖珑.基于学习者建模和数据挖掘的个性化党建推荐系统研究[J].现代科学仪器,2021,38(4):262-265.
10祝婷,马琳.2000-2020年我国图书馆学术资源推荐研究知识图谱分析[J].当代图书馆,2021(3):4-11.

1许普乐,纪允.一种基于Rymon枚举树的快速挖掘无关集算法[J].轻工学报,2017,32(5):103-108.
2王健.如何结合数据进行软包装印刷的智能化排产[J].印刷技术,2017,0(6):56-58.
3张捷,熊明科,项辉,李文锋.电信运营商大数据商业应用综述[J].中小企业管理与科技,2017,1(27):194-196.
4刘晓华.航司精准营销的关键手段——大数据[J].空运商务,2017,0(8):47-47.
5苏玉红.大数据时代的高中历史史料教学探微[J].文理导航（教育研究与实践）,2017,0(7):58-58. 被引量：2
6俄考古学家在罗斯托夫地区发现14世纪的中国器皿[J].美术观察,2017(9):38-38.
7艾金勇.基于关联规则的高校图书馆读者借阅行为研究——以西藏民族大学图书馆为例[J].西藏民族大学学报（哲学社会科学版）,2017,38(4):142-146. 被引量：2
8祝智庭,彭红超,雷云鹤.解读教育数据智慧[J].开放教育研究,2017,23(5):21-29. 被引量：25
9茹蓓,贺新征.减少候选项集的数据流高效用项集挖掘算法[J].计算机应用研究,2017,34(11):3379-3383. 被引量：3
10何文浩,付涛.基于车流量监测系统的荆岳大桥拥堵预警方法探讨[J].中国交通信息化,2017(9):138-139. 被引量：4

浙江工业大学学报

2017年第5期

浏览历史

内容加载中请稍等...

一种基于并行矩阵目标明确的Apriori算法被引量：5

参考文献12

二级参考文献244

共引文献2696

同被引文献35

引证文献5

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

一种基于并行矩阵目标明确的Apriori算法 被引量：5

参考文献12

二级参考文献244

共引文献2696

同被引文献35

引证文献5

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

一种基于并行矩阵目标明确的Apriori算法被引量：5