基于矩阵伪投影策略的频繁项集挖掘方法被引量：8

Mining Frequent Itemsets Based on pseudo-Projection of Array

下载PDF

导出

摘要挖掘频繁项集是数据挖掘应用中关键的问题。经典的FP-growth算法利用FP-tree有效的压缩了数据集的规模,但是在挖掘过程中需要反复递归构造条件FP-tree成为限制算法效率的瓶颈。本文通过将FP-tree映射成矩阵,通过在矩阵自身上进行伪投影得到条件模式阵,避免了递归构造FP-tree,从而节约了内存消耗和计算时间。 It is key point of data mining application mining frequent itemsets. Classic frequent itemsets mining algorithm FP-growth compresses the scale of dataset effectively using FP-tree structure, But it has own bottleneck that for getting complete fre- quent itemsets it need build conditional FP-tree recursively in the mining process. This paper proposes a new frequent itemsets mining algorithm that maps FP-tree structure into FP-array and mines upon it. In the mining process, this algorithm can avoid building conditional FP-tree. So, it saves time and memory very much .

作者陈凯冯全源

机构地区四川成都西南交通大学计算机与通信工程学院

出处《微计算机信息》北大核心 2005年第11X期85-87,150,共4页 Control & Automation

基金国家自然科学基金资助的项目基金号:60371017 四川省学术和技术带头人资助项目

关键词数据挖掘关联规则频繁项集矩阵 data mining association rule frequent itemsets array

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献8

1R. Agrawal, and R. Srikant. Fast Algorithms for Mining Association Rules [A]. In Proceeding of the 20th VLDB Conferencei [C], Santiago,Chile, 1994.
2A. Silbersehatz, and A. Tuzhilin. What Make Patterns Interesting in Knowledge Diseovery Systems [J]. In IEEE Transaetion on Knowledge and Data Engineering, Dec. 1996.
3J. Han, J. Pei, and Y. Yin. Mining Frequent Patterns without Candidate Generation [A]. In Proceeding of ACM SIGMOD" 00 [C], May. 2000.
4M. J. Zaki, and C. Hsiao. CHARM: An Efficient Alogrithm for Closed Itemset Mining [A]. In SDM" 02 [C], Apr. 2002.
5L. Li, and F. Jin. A New Algorithm form Mining Frequent Pattern [A].Journal of Southwest Jiaotong University, May. 2002.
6J. Han and M. Kamber. Data Mining: Concepts and Techniques [M].Morgan Kaufmann Publishers, San Francisco, CA, 2001.
7宋余庆,朱玉全,孙志挥,陈耿.基于FP-Tree的最大频繁项目集挖掘及更新算法[J].软件学报,2003,14(9):1586-1592. 被引量：164
8王晓峰,王天然,赵越.一种自顶向下挖掘长频繁项的有效方法[J].计算机研究与发展,2004,41(1):148-155. 被引量：27

二级参考文献9

1[1]R Agrawal, T Imielinski, A Swami. Mining association rules between sets of items in large databases. In: Peter Buneman, Sushil Ajodia eds. Proc of ACM SIGMOD Conf on Management of Data, New York: ACM Press, 1993. 207～216
2[2]J Han, J Pei. Mining frequent patterns by pattern-growth: Methodology and implications. ACM SIGKDD Explorations (Special Issue on Scalable Data Mining Algorithms), 2000, 2(2): 14～20
3[3]J Han, J Pei, Y Yin. Mining frequent patterns without candidate generation, In: M Dunham, J Naughton, W Chen eds. Proc of 2000 ACM-SIGMOD Int'l Conf on Management of Data (SIGMOD'00). Dallas, TX, New York: ACM Press, 2000. 1～12
4[4]J Roberto, Jr Bayardo. Efficiently mining long patterns from databases. In: Ashutosh Tiwary, Boeing Co eds. Proc of the 1998 ACM-SIGMOD Int'l Conf on Management of Data (SIGMOD'98), New York: ACM Press, 1998. 85～93
5[5]D-I Lin, Z M Kedem. Pincer-Search: A new algorithm for discovering the maximum frequent set. In: Bertram Ludscher, Wolfgang May eds. Proc of the 6th European Conf on Extending database technology, Proceedings, Lecture Note in Computer 1377. Berlin: Springer 1998, 1998. 105～119
6[6]Z Pawlak. Rough Sets Theoretical Aspects of Reasoning about Data. Holland: Kluwer Academic Publishers, 1991
7[7]Hu Xiaohua. Knowledge discovery in database: An attribute-oriented rough set approach [Dissertation]. University of Regina, Canada, 1995
8[8]Collections of data for developing, evaluating, and comparing learning methods. 2001. http://www.cs.toronto.edu/～delve/data/mushrooms/desc.html
9路松峰,卢正鼎.快速开采最大频繁项目集[J].软件学报,2001,12(2):293-297. 被引量：113

共引文献184

1谢志强,朱孟杰,杨静.基于改进FP-树的最大项目集挖掘算法[J].计算机应用研究,2009,26(2):502-505. 被引量：1
2姜晗,贾泂.基于标记域FP-Tree快速挖掘最大频繁项集[J].计算机研究与发展,2007,44(z2):334-349. 被引量：4
3杨种学.基于并行FP-growth算法挖掘网上关联交易规则[J].南京晓庄学院学报,2005,21(5):65-70.
4王盛,董黎刚,李群.一种基于逆序编码的关联规则挖掘研究[J].杭州电子科技大学学报（自然科学版）,2010,30(5):169-172. 被引量：1
5朱玉全,宋余庆,陈耿.约束最大频繁项目集的增量式更新算法[J].计算机工程,2004,30(18):31-32.
6杨君锐,赵群礼.一种不产生候选集的最大频繁集快速挖掘算法[J].微电子学与计算机,2004,21(11):125-128. 被引量：4
7张莹,韩芳溪,柴乔林.基于频繁模式树的AOI聚类算法[J].计算机工程与应用,2004,40(35):178-179.
8李清峰,杨路明,张晓峰.关联规则中最大频繁项目集的研究[J].计算机应用研究,2005,22(1):93-95. 被引量：3
9吉根林,杨明,宋余庆,孙志挥.最大频繁项目集的快速更新[J].计算机学报,2005,28(1):128-135. 被引量：47
10陈天敏,姜丽红.基于预制数据库的FP-tree构造算法[J].计算机工程,2004,30(B12):58-61.

同被引文献44

1阮幼林,李庆华,刘干.分布环境中的并行频繁模式挖掘算法[J].计算机工程与应用,2005,41(25):1-3. 被引量：3
2郑启鹏,李秀,刘文煌,李兵.支持向量机在银行贷款客户分类中的应用研究[J].微计算机信息,2005,21(11X):68-70. 被引量：7
3数据挖掘概念与技术，iawei Han Micheline Kamber著；范明，孟小峰等译.机械工业出版社
4NET分布式编程-C#篇，OM BARNABY著,黎媛，王小锋等译.清华大学出版社
5Jiawei Han, Micheline Kamber. Data Mining Concepts and Techniques[M].China Machine Press, 2001
6W.Wang, J.Yang and P.Yu "Efficient mining of weighted association rules(WAR)", Proc. of the ACM SIGKDD Conf on Knowledge Discovery and Data Mining, 270-274, 2000.
7Avi Silberschatz, Alexander Tuzhilin What Makes Patterns Interesting in Knowledge Discovery Systems
8B.Shekar, Rajesh Natarajan A Framework for Evaluating Knowledge-Based lnterestingness of Association Rules Fuzzy Optimization and Decision Making, 3, 157-185,2004
9Rakesh Agrawal, Ramakrishnan Srikant. Mining sequential pattern. ICDE,1995
10S.D.Lee,David W.Cheung,Ben Kao. ls Sampling Useful in Data Mining? A Case in the Maintenance of Discovered Association Rules.

引证文献8

1杨洪志.村官申利洲[J].中国大学生就业,2005(12):25-26. 被引量：1
2胡鹏,童恒建,徐来.利用分布式数据库实现高效查找频繁项集[J].微计算机信息,2006(05X):175-177.
3陈刚,李秀,刘文煌.基于“新颖度”的关联挖掘算法[J].微计算机信息,2006,22(08X):1-3. 被引量：4
4郭志勇,杨炳儒,王璐.抽样技术在序列模式增量更新中的应用[J].微计算机信息,2006,22(08X):4-6. 被引量：2
5刘文予,谢传荣.基于聚集矩阵的审计日志关联规则更新算法[J].微计算机信息,2006,22(10X):49-51. 被引量：1
6刘发升,杨惠.关联规则集合的鱼眼视图可视化[J].微计算机信息,2006(12X):225-227. 被引量：5
7刘芝怡,常睿.频繁项集高效挖掘算法研究[J].微计算机信息,2012,28(10):491-493. 被引量：2
8丁洁.一种基于云平台的频繁项集数据挖掘改进算法[J].自动化技术与应用,2019,38(7):74-77. 被引量：6

二级引证文献21

1梁小平,朱芸.基于平衡三叉树实现归并算法的研究[J].微计算机信息,2007,23(3):236-237. 被引量：1
2王柏盛,刘寒冰,靳书和,马丽艳.基于矩阵的关联规则挖掘算法[J].微计算机信息,2007,23(05X):144-145. 被引量：18
3陈富强.PKTS view:一种多媒体数据库视图[J].微计算机信息,2007,23(03X):200-202.
4邓铁军,杨庆祥.基于事务标识符序列的频繁集发现方法[J].安阳工学院学报,2008,7(2):48-51.
5方炜炜,杨炳儒,宋威,侯伟.基于布尔矩阵的关联规则算法研究[J].计算机应用研究,2008,25(7):1964-1966. 被引量：18
6魏吉,李兴明.适合通信网的动态加权关联规则挖掘算法[J].微计算机信息,2008,24(24):141-143. 被引量：1
7汪育健,邹攀.基于线性链表的关联规则数据挖掘技术在数字图书馆中的应用[J].图书馆杂志,2009,28(12):52-54. 被引量：4
8孟辉,洪文学.蛋白质组数据模式可视化分析[J].微计算机信息,2009,25(36):198-199.
9彭剑,王小玲.基于聚类矩阵的入侵日志关联规则算法[J].计算机工程,2010,36(22):170-172.
10朱宝湘,曾祥慧,张晓文.关于树形Focus+Context信息可视化技术的探讨[J].工业控制计算机,2011,24(1):74-75. 被引量：1

1汤阳,张宏,张琨,李千目.奇数变元代数免疫最优布尔函数的构造方法[J].计算机科学,2011,38(3):83-86.
2汪成亮,罗昌银.一种基于组合方式改进的频繁项集挖掘算法[J].计算机系统应用,2010,19(1):67-71. 被引量：3
3王春风,周宁.数据挖掘算法的改进及其在Chord网络中的应用[J].计算机应用,2012,32(1):199-201. 被引量：2
4郑斌.基于SQL技术的频繁模式的发掘[J].中原工学院学报,2008,19(5):56-60.
5飞云.巧用代码实现简洁替换[J].电脑爱好者,2012(23):66-66.
6刘炜,杨道平,简岩.基于层次结构的大数据秘密共享方案[J].吉林大学学报（理学版）,2016,54(4):827-832.
7廖福蓉,王成良.基于有序FP-tree的最大长度频繁项集挖掘算法[J].计算机工程与应用,2012,48(30):147-150. 被引量：4
8王景中,任虎.一种改进的FP_growth算法[J].网络安全技术与应用,2010(7):79-81.
9杨鹏坤,彭慧,周晓锋,孙玉庆.改进的基于频繁模式树的最大频繁项集挖掘算法——FP-MFIA[J].计算机应用,2015,35(3):775-778. 被引量：16
10李金忠,梁正友.一种引入索引加速挖掘关联规则的高效算法[J].计算机工程与科学,2009,31(4):69-71.

微计算机信息

2005年第11X期

浏览历史

内容加载中请稍等...

基于矩阵伪投影策略的频繁项集挖掘方法被引量：8

参考文献8

二级参考文献9

共引文献184

同被引文献44

引证文献8

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

基于矩阵伪投影策略的频繁项集挖掘方法 被引量：8

参考文献8

二级参考文献9

共引文献184

同被引文献44

引证文献8

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

基于矩阵伪投影策略的频繁项集挖掘方法被引量：8