正相关频繁项集的挖掘算法被引量：1

A Mining Algorithm of Positively Correlated Frequent Itemsets

下载PDF

导出

摘要由频繁项集产生的关联规则往往不能保证规则前、后件中的项是正相关的,因此可能产生无意义的关联规则;当这些关联规则用于分类时,会产生大量无用分类规则,增加了时间开销.因此,基于数学期望提出了正相关的频繁项集的分类算法.该算法在挖掘正相关频繁项集时,利用置信度进行规则选取,生成正相关关联规则组成的分类器对数据集进行分类.实验表明,这种分类算法可以大幅度减少所产生的频繁项集数量,分类准确率达到C4.5和CMAR的水平,且显著减少了算法的时间. The association rules from frequent itemsets can not ensure items positive correlation in the antecedent or the consequent of a rule ,the association rule has no meaning, and these rules are used to classify, some no use classification rules will be produced, and the time complicated will be very high. So,a mining algorithm of the positively correlated frequent itemsets is proposed,when mining positively correlated itemsets,the method is selecting the predictive rules by confidence and generating classifiers which are composed by positively correlated association rules. The experiments show that,this algorithm can decrease the number of generated frequent itemsets largely,the classification accuracy is close to C4.5 and CMAR, and the time complicated degree has been reduced obviously.

作者田保慧

机构地区河南交通职业技术学院

出处《华北水利水电学院学报》 2008年第4期65-67,共3页 North China Institute of Water Conservancy and Hydroelectric Power

关键词频繁项集关联规则分类正相关 frequent itemsets association rules classification positivity

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献4

1编著责任者不详.数据挖掘:概念与技术[M].范明,孟小峰,译.北京:机械工业出版社,2001:185-222.
2Han J, Pei J, Yin Y. Mining Frequent Patterns without Candidate Generation [ M ]. In SIGMOD' 00, Dallas, TX, 2000 : 1 -12.
3范明,王秉政.一种直接在Trans-树中挖掘频繁模式的新算法[J].计算机科学,2003,30(8):117-120. 被引量：10
4Li W,Han J,Pei J. CMAR:Accurate and Efficient Classification Based on Multiple Class-association Rules [ M ]. In ICDM' 01, San Jose, CA ,2001:369 - 376.

二级参考文献10

1Agrawal R, Srikant R. Fast algorithms for Mining association rules. In:Proc 1994 Int'l Conf on Very Large Data Bases,Sept.1994- 487-499.
2Park J S,Chen M S. Yu P S. An effective hash-based algorithm for mining association rules. In: Proc 1995 ACM-SIGMOD Int'l Conf on Management of Data, May 1995. 175-186.
3Brin S,Motwani R ,Silverstein C. Beyond market basket: Generalizing association rules to correlations. In: Proc 1997 ACM-SIGMOD Int'l Conf on Management of Data, May 1997. 265-276.
4Agrawal R,Srikant R. Mining sequential patterns, In ICDE'95, pages 3-14.
5Dong G, Li J. Efficient mining of emerging patterns : Discovering trends and differences. In: Proc of the fifth ACM SIGKDD Intl Conf on Knowledge Discovery and Data Mining, Aug.1999. 43-52.
6Han J, Pel J, Yin Y. Mining frequent patterns without candidate generation. In:Proc 2000 ACM-SIGMOD Intl Conf on Managernent of Data, May 2000. 1-12.
7Bykowski A,Rigotti C. A Condensed Representation to Find Frequent Patterns. In:Proc of the 20th ACM SIGACT-SIGMODSIGART Symposium on Principles of Database Systems (PODS 2001) ,Santa Barbara,CA,USA,ACM Press ,2001. 267-273.
8.[EB/OL].http://www. ics. uci. edu/-mlearn/MLRepository. html,.
9HartJiawei KamberM著范明孟小峰译.效据挖掘:概念与技术[M].机械工业出版社,2001.149-184.
10Han J Kamber M.数据挖掘:概念与技术[M].北京:机械工业出版社,2001..

共引文献9

1肖基毅,邹腊梅,刘丰.频繁项集挖掘算法研究[J].情报杂志,2005,24(11):2-3. 被引量：2
2马海兵,张锦,范颖杰,胡运发.基于静态IS-树的频繁模式挖掘[J].模式识别与人工智能,2005,18(6):664-669.
3王春凯,李睿楠,范明.挖掘正相关的频繁项集[J].计算机应用,2007,27(1):108-110.
4林丽,冯少荣,薛永生.基于有限个条件FP_树中挖掘频繁模式[J].计算机工程与应用,2007,43(5):175-177.
5孙莉.数据库和数据流频繁项集挖掘算法研究[J].现代机械,2007(5):54-57.
6马洁.云计算环境下关联规则数据挖掘算法研究[J].重庆工商大学学报（自然科学版）,2012,29(11):36-39. 被引量：4
7刘宁,管涛.云计算下的威胁数据挖掘模型仿真[J].控制工程,2014,21(6):958-961. 被引量：10
8郭玲.可产生潜在威胁的网络数据挖掘模型仿真分析[J].科技通报,2015,31(3):216-219. 被引量：1
9肖凡智,张雨竹,尹耀宽,许建潮,刘钢.城市计算中的显露模式分析方法研究[J].计算机与数字工程,2021,49(4):766-770.

同被引文献10

1林鸿飞,杨志豪,赵晶.基于内容和合作模式的信息推荐机制[J].中文信息学报,2005,19(1):48-55. 被引量：14
2谢丹霞,黄争舸.信息时代高校选课系统的智能化构建[J].高等农业教育,2006(9):63-65. 被引量：4
3李雪峰,刘鲁,张曌.基于协同过滤的在线拍卖商品推荐[J].计算机工程,2006,32(23):18-20. 被引量：8
4王惠敏,聂规划.融合用户和项目相关信息的协同过滤算法研究[J].武汉理工大学学报,2007,29(7):160-163. 被引量：5
5李金娟,王卫锋.基于FP-growth算法在学生成绩中的关联规则分析[J].巢湖学院学报,2007,9(6):30-33. 被引量：5
6郭艳红,邓贵仕.协同过滤的一种个性化推荐算法研究[J].计算机应用研究,2008,25(1):39-41. 被引量：27
7陈月英,宗平,庄卫华,张乐河.高校选课系统中的公平算法及其研究[J].计算机工程与应用,1998,34(11):40-41. 被引量：14
8陶俊,张宁.基于用户兴趣分类的协同过滤推荐算法[J].计算机系统应用,2011,20(5):55-59. 被引量：17
9铁治欣,陈奇,俞瑞钊.关联规则采掘综述[J].计算机应用研究,2000,17(1):1-5. 被引量：48
10赵亮,胡乃静,张守志.个性化推荐算法设计[J].计算机研究与发展,2002,39(8):986-991. 被引量：140

引证文献1

1孙彦超.基于协同过滤的个性化选课模式研究与实践[J].北京信息科技大学学报（自然科学版）,2015,30(2):92-96. 被引量：1

二级引证文献1

1任磊.协同过滤算法在高校课程推荐中的应用研究[J].福建电脑,2019,35(8):21-26. 被引量：1

1关鑫.基于压缩近邻的样本选择方法在字符识别上的应用[J].电子技术与软件工程,2016(14):167-167.
2肖光磊,陆建峰,李文林,陈涤平.正相关关联规则及其在中医药中的应用[J].计算机工程与应用,2010,46(6):227-230. 被引量：9
3冯林,张名举,贺明峰,戚正君,滕弘飞.用分层互信息和薄板样条实现医学图像弹性自动配准[J].计算机辅助设计与图形学学报,2005,17(7):1492-1496. 被引量：16
4黄玫,孙兴华,金国英,徐光祐.新闻视频显著人脸检索系统[J].计算机工程与应用,2003,39(27):60-63.
5C／S模式遥感影像纠正相关技术[J].中国科技成果,2008(21):53-53.
6韩敏,范迎南,孙燕楠.改进的模糊神经网络应用于投标报价[J].系统工程理论方法应用,2005,14(5):443-448. 被引量：5
7Norman Hendrich,Hannes Bistry,Jianwei Zhang.Architecture and Software Design for a Service Robot in an Elderly-Care Scenario[J].Engineering,2015,1(1):27-35. 被引量：3
8易可夫,王东豪,万江文.基于优化字典学习算法的压缩数据收集[J].北京航空航天大学学报,2016,42(6):1203-1209. 被引量：1
9董微,刘学,倪宏.基于信息增益的自适应特征选择方法[J].计算机工程与设计,2014,35(8):2856-2859. 被引量：8
10方明,徐晶.基于负相关的可信赖模式匹配[J].长春理工大学学报（自然科学版）,2011,34(3):149-151. 被引量：1

华北水利水电学院学报

2008年第4期

浏览历史

内容加载中请稍等...

正相关频繁项集的挖掘算法被引量：1

参考文献4

二级参考文献10

共引文献9

同被引文献10

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

正相关频繁项集的挖掘算法 被引量：1

参考文献4

二级参考文献10

共引文献9

同被引文献10

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

正相关频繁项集的挖掘算法被引量：1