基于倒排表和集合的TOP-N最频繁项集挖掘算法

Top-N Most Frequent Itemsets Mining Algorithm Based On Inverted File and Set

下载PDF

导出

摘要最频繁项集挖掘是文本关联规则挖掘中研究的重点和难点,它直接决定了文本关联规则挖掘算法的效率。本文首先分析了当前在最频繁项集挖掘方面的不足,然后给出了几个命题和推论,紧接着结合最小支持度阈值动态调整策略,提出了一个基于倒排表和集合的TOP-N最频繁项集挖掘IntvSet算法,最后对所提算法进行验证。实验结果表明,该算法的规则有效率和时间性能比常用的两个TOP-N最频繁项集挖掘算法:NApriori算法,IntvMatrix算法都好。

作者孙序

机构地区江苏省特种设备安全监督检验研究院无锡分院

出处《科技信息》 2011年第27期I0045-I0047,共3页 Science & Technology Information

关键词最频繁项集关联规则最小支持度 IntvSet算法

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献8

1田宏,董爱杰.基于向量矩阵的频繁项集挖掘算法[J].大连交通大学学报,2008,29(3):74-77. 被引量：2
2战立强,刘大昕.频繁项集快速挖掘算法研究[J].哈尔滨工程大学学报,2008,29(3):266-271. 被引量：11
3冯凤.快速更新挖掘最大频繁项集[J].合肥学院学报（自然科学版）,2007,17(4):46-49. 被引量：3
4陈晓云,胡运发.N个最频繁项集挖掘算法[J].模式识别与人工智能,2007,20(4):512-518. 被引量：6
5陈晓云.文本挖掘若干关键技术研究[D]复旦大学,复旦大学2005.
6A.W.-C.Fu,R.W.-W.Kwong,J.Tang.Mining N-most Interesting Itemsets. Proc.of 12thInternational Symposium on Methodologies for IntelligentSystems(ISMIS‘00) . 2000
7HAJJ M E,,ZAIANE O R.Non recursive generation of frequent k-itemsets from frequent pattern tree representations. Proceedings of5th International Conference on Data Warehousing and Knowledge Discovery . 2003
8M.El-Hajj,O.R.Za‘iane.Inverted matrix:Efficient discovery of frequent items in large datasets in the context of interactive mining. Proc 2003 Int‘l Conf.on Data Mining and Knowledge Discovery (ACM SIGKDD) . 2003

二级参考文献33

1郑玲霞,李大学,马万里.基于有向图的关联规则算法[J].重庆邮电学院学报（自然科学版）,2005,17(4):495-498. 被引量：5
2陈耿,朱玉全,杨鹤标,陆介平,宋余庆,孙志挥.关联规则挖掘中若干关键技术的研究[J].计算机研究与发展,2005,42(10):1785-1789. 被引量：62
3陈晓云,陈袆,王雷,李荣陆,胡运发.基于分类规则树的频繁模式文本分类[J].软件学报,2006,17(5):1017-1025. 被引量：19
4陈明,史忠植,王文杰.一种有效的基于图的关联规则挖掘算法[J].计算机应用,2006,26(11):2654-2656. 被引量：10
5贾彩燕倪现君.关联规则挖掘研究述评[J].计算机科学,2003,30(4):145-148.
6[1]Agrawal R,Imielinski T,Swami A.Mining Association Rules Between Sets of Items in Large Database[C]// Agrawal R,Imielinski T,Swami A.Proc ACM SIGMOD Int Conf Management of Date.Washington D C:ACM Press,1993:207-216.
7[2]Houtsma M,Swami A.Set-oriented Mining for Association Rules in Relational Database[C] //Yu P,Chen A.Proc of the Int Conf on Data Engineering.California:IEEE Computer Society Press,1995:25-33.
8[3]Savasere A,Omiecinski E,Navathe S.An Efficient Algorithm for Mining Association Rule[C]//Savasere A,Omiecinski E,Navathe S.Proc 21th Int Conf on VLDB,New York:ACM Pr ess,1995:432-444.
9[4]Han J,Kamber M.Data Mining:Concepts and Techniques[M].Beijing:High Education Press,2001.
10[5]Agrawal R,Srikant R.Fast Algorithm for Mining Association Rules[C] //Agrawal R,Srikant R.Proc 20th Int Conf on VLDB.Santiago:Morgan Kaufman Pub Inc,1994:487-499.

共引文献14

1许娅.快速更新最小频繁概念格[J].合肥工业大学学报（自然科学版）,2009,32(5):667-669.
2戴小廷.典型Apriori改进算法的分析与比较[J].微计算机信息,2010,26(9):159-160. 被引量：4
3戴小廷.Apriori算法的改进及其在电力数据挖掘中的应用[J].沈阳理工大学学报,2010,29(1):18-22. 被引量：5
4朱颢东,李红婵.关于Top-N最频繁项集挖掘的研究[J].电子科技大学学报,2010,39(5):757-761.
5郎振红.网络化物业管理系统中数据挖掘的应用[J].沈阳教育学院学报,2011,13(4):88-91.
6尹士闪,马增强,毛晚堆.基于频繁项目集链式存储方法的关联规则算法[J].计算机工程与设计,2012,33(3):1002-1007. 被引量：4
7陈小玉,杨艳燕,刘克成,朱颢东.基于改进倒排表和集合的最频繁项集挖掘算法[J].计算机应用研究,2012,29(6):2135-2137. 被引量：1
8陈超,刘才铭.基于最小支持度阈值动态调整策略的最频繁项集挖掘算法[J].兰州理工大学学报,2012,38(4):85-88. 被引量：1
9谢岳山,樊晓平,廖志芳,王志尧.TopN显著连续序列算法[J].小型微型计算机系统,2013,34(1):155-158.
10戴小廷.关联规则数据挖掘算法及其在智能物流中的应用分析[J].科技和产业,2014,14(2):113-116. 被引量：7

1孟祥鹏.一种改进的频繁项集挖掘算法[J].濮阳职业技术学院学报,2009,22(4):148-150.
2朱颢东,李红婵.关于Top-N最频繁项集挖掘的研究[J].电子科技大学学报,2010,39(5):757-761.
3陈超,刘才铭.基于最小支持度阈值动态调整策略的最频繁项集挖掘算法[J].兰州理工大学学报,2012,38(4):85-88. 被引量：1
4陈应霞,陈艳.关联规则中的Apriori挖掘算法改进[J].长江大学学报（自科版）（上旬）,2008,5(4):341-343. 被引量：6
5陈小玉,杨艳燕,刘克成,朱颢东.基于改进倒排表和集合的最频繁项集挖掘算法[J].计算机应用研究,2012,29(6):2135-2137. 被引量：1
6刘战东.Web数据挖掘与挖掘算法探讨[J].电脑与电信,2008(12):65-67. 被引量：1
7胡传平.智能视频分析检索助力大数据的实现[J].中国公共安全,2015,0(8):68-71. 被引量：4
8耿新青,娄亚斌,张恩胜.一种基于哈希技术的文本关联规则算法[J].鞍山师范学院学报,2007,9(6):36-39.
9王少茹.基于Web数据挖掘的探索[J].电子世界,2014(4):11-12.
10杨勇.采用数据库优化技术的Apriori算法改进研究[J].计算机与数字工程,2014,42(8):1352-1354. 被引量：2

科技信息

2011年第27期

浏览历史

内容加载中请稍等...

基于倒排表和集合的TOP-N最频繁项集挖掘算法

参考文献8

二级参考文献33

共引文献14

相关作者

相关机构

相关主题

浏览历史