一种高效的改进频繁项集挖掘算法被引量：5

An Efficient and Improved Algorithm for Mining Frequent Itemsets

下载PDF

导出

摘要提出一种结合投影与排序频繁项集位置索引表的挖掘频繁项集改进算法,通过单趟扫描数据库,建立存储项集关系的"投影"数据结构,直接找到频繁1-项集及通过内积运算获得频繁2-项集.然后建立高阶项集的位置索引表,通过跨越式搜索和连接,依次找出后续频繁项集.通过实验分析,大大提高了寻找频繁项集的效率. This paper proposes an improved algorithm for mining frequent itemsets based on the projection andsorting location index table of frequent itemsets. The data structure of ＂projection＂ is set up by scan database once,and find the frequent 1- itemsets directly and obtain frequent 2- itemsets by inner product operation. Then, thelocation index table of the higher order itemsets is established, find the frequent itemsets by leaping searching andlinking. Through the experimental analysis, the efficiency of finding frequent itemsets is greatly improved.

作者王杰乐红兵

机构地区江南大学物联网工程学院

出处《微电子学与计算机》 CSCD 北大核心 2018年第2期49-51,共3页 Microelectronics & Computer

关键词关联规则频繁项集位置索引表跨越搜索 association rule frequent itemsets location index table leaping search

分类号 TP39 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1孟祥萍,钱进,刘大有.基于数组的关联规则挖掘算法[J].计算机工程,2003,29(15):98-99. 被引量：20
2黄龙军,段隆振,章志明.一种基于上三角项集矩阵的频繁项集挖掘算法[J].计算机应用研究,2006,23(11):25-26. 被引量：11
3张文东,尹金焕,贾晓飞,黄超,苑衍梅.基于向量的频繁项集挖掘算法研究[J].山东大学学报（理学版）,2011,46(3):31-34. 被引量：7
4王柏盛,刘寒冰,靳书和,马丽艳.基于矩阵的关联规则挖掘算法[J].微计算机信息,2007,23(05X):144-145. 被引量：18

二级参考文献17

1杜跃,王治和,景永霞.基于数组的关联规则挖掘算法[J].甘肃联合大学学报（自然科学版）,2007,21(3):56-57. 被引量：1
2陈刚,李秀,刘文煌.基于“新颖度”的关联挖掘算法[J].微计算机信息,2006,22(08X):1-3. 被引量：4
3王柏盛,刘寒冰,靳书和,马丽艳.基于矩阵的关联规则挖掘算法[J].微计算机信息,2007,23(05X):144-145. 被引量：18
4AGRAWAL R, IMIELINSKE T, SWAMI A. Mining as- sociation rules between sets of items in large databases [ C ]// Proceeding of the ACM SICMOD Conference on Management of Data. New York: ACM Press, 1993: 207-216.
5Han J,Kambr M. Data Mining:Concepts and Techniques[M]. Beijing: Higher Education Press,2001.
6Agrawal R, Srikant R. Fast Algorithms for Mining Association Rules Santiago, Chile: Proc. of the 20th Int'l Conference on Very Large Databases, 1994 : 487-499.
7Park J S, Chen Mingsyan, Yu P S. An Effective Hash-based Algorithm for Mining Association Rules. San Jose, CA:Proc. of the ACM SIGMOD Intl Conf. on Management of Data, 1995:175-186.
8Chen M S, Han J, Yu P S. Data Mining: An Overview from Database Perspective[J]. IEEE Transactions on Knowledge and Data Engineering,1996,8(6) : 866-883.
9R Agrawal, T Srikant. Fast Algorithms for Mining Association Rules in Large Database [ C ]. Santiago : Proceedings of the 20th VLDB Conference, 1994. 487-499.
10J Han, J Pei, Y Yin. Mining Frequent Patterns without Candiate Generation [ C ]. Dallas : SIGMOD, 2000.1-12.

共引文献49

1杜跃,王治和,景永霞.基于数组的关联规则挖掘算法[J].甘肃联合大学学报（自然科学版）,2007,21(3):56-57. 被引量：1
2高晓红.档案信息网络管理风险及安全防范措施[J].黑龙江档案,2006(2):8-8. 被引量：3
3朱嘉贤.一个基于散列技术的关联规则挖掘算法[J].肇庆学院学报,2004,25(5):67-70.
4彭勇.一种基于超级哈希树的关联规则挖掘算法[J].株洲工学院学报,2005,19(4):32-34.
5陈文庆,许棠.关联规则挖掘Apriori算法的改进与实现[J].微机发展,2005,15(8):155-157. 被引量：21
6刘翠娟,王保义,秦艳凯.基于项集特性的关联规则挖掘中Apriori算法的改进[J].山西电子技术,2005(6):20-22. 被引量：1
7刘莹,郭福亮.基于数组的关联规则挖掘算法[J].计算机与数字工程,2006,34(1):38-40. 被引量：8
8钱少华,蔡勇,钱雪忠.基于数组的Apriori算法的改进[J].计算机应用与软件,2006,23(2):111-113. 被引量：16
9卢雪燕,王勇,周永权.一种基于位矩阵的负关联规则挖掘新算法[J].广西民族大学学报（自然科学版）,2007,13(4):57-60. 被引量：3
10李卫华,刘卫国.一种基于压缩矩阵的Apriori改进算法[J].计算机系统应用,2008,17(3):27-30. 被引量：9

同被引文献32

1李峰,李芳.中文词语语义相似度计算——基于《知网》2000[J].中文信息学报,2007,21(3):99-105. 被引量：106
2胡文江,胡大伟,高永兵,郝斌.基于关联规则与标签的好友推荐算法[J].计算机工程与科学,2013,35(2):109-113. 被引量：25
3高永兵,杨红磊,刘春祥,胡文江.基于内容与社会过滤的好友推荐算法研究[J].微型机与应用,2013,32(14):75-78. 被引量：8
4张启徽.关联规则挖掘中查找频繁项集的改进算法[J].统计与决策,2015,31(4):32-35. 被引量：21
5黄红星.挖掘完全频繁项集的蚁群算法[J].微电子学与计算机,2014,31(12):144-147. 被引量：4
6杨新武,马壮,袁顺.基于弱分类器调整的多分类Adaboost算法[J].电子与信息学报,2016,38(2):373-380. 被引量：28
7吕杰,关欣,李锵,张立毅.一种融合用户上下文信息和动态预测的协同过滤推荐算法[J].小型微型计算机系统,2016,37(8):1680-1685. 被引量：6
8谭熠峰,孙婷婷,徐新民.基于动态因子和共享适应度的改进粒子群算法[J].浙江大学学报（理学版）,2016,43(6):696-700. 被引量：8
9董洋溢,李伟华,于会.基于混合余弦相似度的中文文本层次关系挖掘[J].计算机应用研究,2017,34(5):1406-1409. 被引量：20
10刘琼,赵海飞.基于多目标果蝇算法面向低碳的车间布局与调度集成优化[J].机械工程学报,2017,53(11):122-133. 被引量：26

引证文献5

1刘春贵,赵筱蓉.PLC控制在高压系统中的应用[J].四川冶金,2000,22(2):57-59.
2向程冠,熊世桓,王东,熊伟程.基于关联规则与相似度的社交好友推荐算法[J].计算机工程,2019,45(4):175-180. 被引量：14
3周尔民,邓洪,费卫卫,张广航.基于数据挖掘的多行设备动态布局[J].制造业自动化,2020,42(1):44-48. 被引量：1
4古良云,乐红兵.基于改进的BPSO算法的关联规则挖掘[J].计算机与数字工程,2021,49(3):451-455. 被引量：2
5耿立校,李恒昱,刘丽莎.基于主成分分析的模糊频繁项集合挖掘方法[J].计算机仿真,2022,39(2):410-413. 被引量：2

二级引证文献19

1梁天恺,曾碧,刘建圻.基于FP-Growth的智能家居用户时序关联操控习惯挖掘方法[J].计算机应用研究,2020,37(2):385-389. 被引量：9
2刘春燕.徒手扩张阴道术40例临床分析[J].青海医药杂志,2000,30(4):38-39.
3杨欢,王新房.改进预测评分矩阵的协同过滤算法[J].软件导刊,2019,18(10):90-93. 被引量：1
4熊才权,陈曦.基于FP-Growth的社交好友推荐方法研究[J].湖北工业大学学报,2020,35(1):33-37. 被引量：1
5纪文璐,王海龙,苏贵斌,柳林.基于关联规则算法的推荐方法研究综述[J].计算机工程与应用,2020,56(22):33-41. 被引量：48
6吕鹏,李蒙迪,张卓.数字化社交的双重逻辑[J].西安交通大学学报（社会科学版）,2021,41(2):71-77. 被引量：1
7谭鸿乐,沈春龙,何嘉欣.面向软件外包平台的协同过滤推荐算法的研究[J].现代计算机,2021,27(19):41-44.
8李杨,代永强.基于客户喜好的双向个性化推荐算法[J].计算机应用研究,2021,38(9):2701-2704. 被引量：3
9孙德厂.基于数据挖掘的ATO系统特征分析[J].现代制造技术与装备,2021,57(8):125-127.
10邹子豪,邓辉.智能变电站三层两网结构下二次系统运检关键点分析[J].湖北电力,2021,45(4):47-51. 被引量：9

1张成,褚莹,凌力.一种基于动态索引表的对称可搜索加密方案[J].微型电脑应用,2017,33(11):39-41. 被引量：2
2白川平,杨志翀.基于加权滑动窗口的数据流频繁项集挖掘算法[J].宁夏师范学院学报,2017,38(6):49-55. 被引量：3
3付裕.基于模糊聚类的关联规则优化算法[J].电脑迷,2017(5):4-5. 被引量：1
4付小妮.基于hadoop与医疗大数据的apriori算法并行化研究[J].信息通信,2017,30(9):30-31. 被引量：1
5叶明全,童九翠,胡骅,盛鑫,杭荣华.基于FP-Growth算法的精神障碍用药ADR关联挖掘与预警[J].宿州学院学报,2017,32(10):99-103. 被引量：2
6夏洪涛,施永益,宋国超.Apriori改进算法及其在电网运营数据关联性测算研究[J].电力科技与环保,2017,33(6):58-60. 被引量：1
7田学东,崔晓娟.基于数学表达式特征的科技文档检索模型[J].河北大学学报（自然科学版）,2017,37(6):652-661. 被引量：1
8宋薇,张晓民,郭东恩.基于前缀路径图的频繁闭项集挖掘算法[J].计算机与数字工程,2017,45(11):2290-2294. 被引量：1
9姚晓鹏,高圣兴,薛君志,陆敏超.全局模式下的深网数据抽取与挖掘[J].计算机应用与软件,2018,35(2):91-95. 被引量：1
10李伟,朱赵元.一种基于并行矩阵目标明确的Apriori算法[J].浙江工业大学学报,2017,45(5):574-579. 被引量：5

微电子学与计算机

2018年第2期

浏览历史

内容加载中请稍等...

一种高效的改进频繁项集挖掘算法被引量：5

参考文献4

二级参考文献17

共引文献49

同被引文献32

引证文献5

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

一种高效的改进频繁项集挖掘算法 被引量：5

参考文献4

二级参考文献17

共引文献49

同被引文献32

引证文献5

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

一种高效的改进频繁项集挖掘算法被引量：5