基于领域知识的冗余关联规则消除算法被引量：3

Elimination algorithm of redundant rules in association rules mining based on domain knowledge

下载PDF

导出

摘要关联规则挖掘算法用于从大型数据库中提取感兴趣的规则,然而,在领域知识中已经能清晰表示的知识并没有被充分考虑,关联规则挖掘算法提取的规则中包含了大量已知的关联性,从而产生了很多冗余规则。文章提出一种算法DKARM,同时考虑了数据本身以及相关的领域知识,以消除在领域知识中清晰表示的已知关联性。实验表明,该算法合理消除了冗余规则,有效降低了规则数目。 Many association rule mining algorithms have been developed to extract interesting patterns from large databases.However,a large amount of knowledge explicitly represented in domain knowledge（DK） has not been used to reduce the number of association rules.A significant number of well known dependences are unnecessarily extracted by association rule mining algorithms,which results in the generation of hundreds or thousands of non-interesting association rules.This paper presents a DKARM algorithm,which takes both database and relative DK into account,to eliminate all associations explicitly represented in DK.Experiments on the proposed algorithm show the significant reduction of the number of rules and the elimination of non-interesting rules.

作者张晶张斌胡学钢

机构地区合肥工业大学计算机与信息学院

出处《合肥工业大学学报（自然科学版）》 CAS CSCD 北大核心 2011年第2期246-250,共5页 Journal of Hefei University of Technology：Natural Science

基金安徽省教学研究课题资助项目(2008jyxm240) 合肥工业大学科学研究发展基金资助项目(2009HGXJ0035)

关键词数据挖掘关联规则领域知识冗余规则 data mining association rule domain knowledge（DK） redundant rule

分类号 TU182 [建筑科学—建筑理论]

引文网络
相关文献

参考文献9

1Han Jiawei,Kamber M.Data mining-concepts and techniques[M].Morgan Kaufman Publishers,2001:1-30.
2Agrawal R,Imielinski T,Swami A.Mining association rules between sets of items in large databases[C]//Proc of the ACM SIGMOD Conference on Management of Data,1993:207-216.
3Han Jiawei,Pei Jian,Yin Y.Mining frequent patterns without candidate generation[C]//Proc of the ACM SIGMOD Conference on Management of Data,2000:1-12.
4Fayyad U,Piatetsky-Shapiro G,Smyth P.From data mining to knowledge discovery:an overview[C]//Advances in Knowledge Discovery and Data Mining.Menlo Park,California:AAAI Press,1996:1-35.
5Zaki M.Generating non-redundant association rules[C]//Proc of the 6th ACM-SIGKDD International Conference on Knowledge Discovery and Data Mining,Boston,Massachusetts,USA,2000:34-43.
6Liu B,Hsu W,Ma Y.Pruning and summarizing the discovered associations[C]//Proc of the 5th ACM-SIGKDD International Conference on Knowledge Discovery and Data Mining,San Diego,California,1999:125-134.
7邢平平,施鹏飞,赵奕.基于本体论的数据挖掘方法[J].计算机工程,2001,27(5):15-16. 被引量：32
8钟佩思,徐文胜,曾庆良,熊光楞.领域知识获取与有效性检查过程集成研究[J].机械科学与技术,2001,20(5):798-800. 被引量：5
9谢亮,张晶,胡学钢.主从关系数据库中关联规则挖掘算法研究[J].合肥工业大学学报（自然科学版）,2009,32(5):663-666. 被引量：5

二级参考文献20

1张伟,杨炳儒,宋威.多关系数据挖掘研究综述[J].计算机工程与应用,2006,42(2):1-6. 被引量：4
2徐光美,杨炳儒,张伟,宁淑荣.多关系数据挖掘方法研究[J].计算机应用研究,2006,23(9):8-12. 被引量：5
3Dehaspe L,Raedt L D.Mining association rules in multiple relations[C]//Dzeroski S,Lavrac N.Proc of the 7th Int'l Workshop on Inductive Logic Programming,LNAI 1297.Berlin:Springer-Verlag,1997:125-132.
4Dehaspe L,Toivonen H.Discovery of frequent datalog patterns[J].Data Mining and Knowledge Discovery,1999,3(1):7-36.
5Nijssen S,Kok J.Faster association rules for multiple relations[C]//Nebel B.Proc of the 17th Int'l Joint Conf on Artificial Intelligence (IJCAI 2001),2001:891-896.
6Lavrac N,Dzeroski S.Inductive logic programming:techniques and and applications[M].Prentice Hall,1994:1.
7Yin Xiaoxin,Han Jiawei,Yang Jiong,et al.Efficient classification across multiple database relations:a CrossMine approach[J].IEEE Transactions on Knowledge and Data Engineering,2006,18(6):770-783.
8Zhang Shichao,Wu Xindong,Zhang Chengqi.Multi-database ming[J].IEEE Computational Intelligence Bulletin,2003,2(1):5-13.
9Yin Xiaoxin,Han Jiawei,Yang Jiong,et al.CrossMine:efficient classification across multiple database relations[C]//ICDE,2004:399-410.
10Liu Huan,Lu Hongjun,Yao Jun.Toward multidatabase mining:identifying relevant databases[J].IEEE Transactions on Knowledge and Data Engineering,2001,13(4):541-553.

共引文献39

1罗清磊,章文,李卫华.基于本体的Web智能信息Agent[J].广东工业大学学报,2004,21(3):57-60. 被引量：2
2马骞,杨以涵,郭金智.基于本体的调度决策支持软件系统的设计[J].电力系统自动化,2004,28(20):57-62. 被引量：14
3王敬贵,苏奋振,杜云艳,杨晓梅,陈秀法.基于Ontology的空间知识查询方法及其应用[J].地球信息科学,2004,6(4):93-99. 被引量：18
4赵勇,吕娜.基于Ontology的专利知识服务系统研究[J].现代情报,2005,25(3):93-95. 被引量：4
5苏财茂,柯映林.冲压产品异地协同设计/制造系统[J].计算机辅助设计与图形学学报,2005,17(3):592-599. 被引量：2
6王文涛,高绍强,王文会,孔美静.基于本体论的信息可视化研究[J].河北科技大学学报,2005,26(1):70-73. 被引量：1
7田春虎.国内语义Web研究综述[J].情报学报,2005,24(2):243-249. 被引量：37
8沈洁,许有志,罗建利.基于MAS的本体在企业知识管理中的应用研究[J].计算机工程与设计,2005,26(11):2963-2965. 被引量：5
9王强.贵阳市银行卡市场调查分析报告[J].金卡工程,2006,10(10):41-46.
10周倩.基于User-Ontology的图书馆用户数据挖掘研究[J].图书馆杂志,2006,25(10):58-63. 被引量：15

同被引文献50

1潘海为,韩启龙,印桂生,张炜,李建中.基于领域知识指导的医学图像关联规则挖掘[J].计算机研究与发展,2007,44(z3):424-428. 被引量：3
2李蕾,高铁曼.产生式规则专家系统的原理与实现[J].微计算机应用,2006,27(5):631-634. 被引量：21
3赵秀梅.规则库的冗余测试[J].电脑开发与应用,2006,19(12):6-8. 被引量：1
4CHEN Guo-qing, LIU Hong-yan, YU Lan, et al. A new approach to classification based on association rule mining [ J ]. Decision Sup- port Systems,2006,42 (2) :674- 689.
5Aronis J M,Kolluri V,Buchanan F J. The WoRLD:Knowledge discovery from multiple distributed databases[A].1997.337-341.
6Liu H,Lu H J,Yao J. Identifying relevant databases for multi database mining[A].1998.210-221.
7Yan J,Liu N,Yang Q. Mining adaptive ratio rules from distributed data sources[J].Data Mining and Knowledge Discovery,2006,(2/3):249-273.
8Peng W C,Liao Z X. Mining sequential patterns across multiple sequence databases[J].Data and Knowledge Engineering,2009,(10):1014-1033.
9Zhang S C,Zhang C Q,Wu XD. Knowledge discovery in multiple databases[M].New York:springer-verlag,2004.110-120.
10Adhikari A,Rao R R,Pedrycz W. Developing multi-database mining applications[M].New York:springer-verlag,2010.78-92.

引证文献3

1付珊珊,孙忠林,陈欣.应急响应系统的规则冗余检测技术研究[J].计算机应用研究,2011,28(10):3671-3674.
2林耀进,胡学钢.多数据源中局部模式挖掘研究[J].合肥工业大学学报（自然科学版）,2013,36(1):53-58. 被引量：2
3陆鑫赟,王兴芬.基于领域关联冗余的教务数据关联规则挖掘[J].计算机科学,2019,46(B06):427-430. 被引量：12

二级引证文献14

1宗万里,朱习军.基于Apriori算法的食品抽检数据的关联规则挖掘[J].食品安全质量检测学报,2020,11(4):1334-1337. 被引量：4
2林雍泰,徐志虎,叶凯洲,谢渊源,张世伟.基于新权重的多数据源规则合成算法[J].计算机与现代化,2013(10):10-12.
3张维访,徐蕾.园区网的网络故障状态预测方法[J].沈阳航空航天大学学报,2016,33(4):73-77. 被引量：1
4刘维军,李晓会.基于模型驱动的终端在线教育数据挖掘技术研究[J].现代电子技术,2020,43(16):112-114. 被引量：1
5周青云,夏爽,邱钟涛,肖叶枝,王鹏.基于决策树算法的多级冗余数据智能检索方法研究[J].电子设计工程,2020,28(19):175-178. 被引量：4
6艾云昊,杨超宇,李慧宗.基于聚类的关联规则后处理算法研究[J].黑龙江工业学院学报（综合版）,2020,20(9):126-131. 被引量：2
7李英,汤庸.基于关联规则与相似度的数据挖掘算法研究[J].华南师范大学学报（自然科学版）,2021,53(5):121-127. 被引量：35
8王寒明,王顺.高校教务管理信息化与智慧化建设的反思[J].中国继续医学教育,2022,14(3):8-11. 被引量：7
9王红艳,李选芒.基于数据挖掘的物流信息监控系统设计[J].电子设计工程,2022,30(6):71-75. 被引量：4
10沈鸣雁,万鹏夏,劳玲娣,傅亚红,冯志仙.基于关联规则的《外科护理学》在线学习数据挖掘分析研究[J].护理与康复,2022,21(9):23-26. 被引量：1

1刘廷建,王自豪,郑朝霞.基于关联规则的数据挖掘在供水管网故障诊断中的运用[J].科技情报开发与经济,2005,15(14):150-152. 被引量：1
2桂现才,彭宏.原关联规则及其应用[J].微机发展,2005,15(10):35-38.
3成平广.一种改进的关联规则挖掘算法在自选餐厅的应用研究[J].商场现代化,2008(35):19-20.
4许利峰.我国BIM技术应用的重要基础——住房和城乡建设产品BIM大型数据库[J].建设科技,2015(23):40-41.
5单保录,宋威.一种基于确定性方法的关联规则挖掘算法[J].计算机时代,2009(5):42-43.
6叶福兰,施忠兴.关联规则数据挖掘在图书馆个性化服务中的应用[J].福建电脑,2009,25(5):99-99. 被引量：3
7李桂来,元昌安,刘海涛,彭昱忠.关联规则算法与框架探讨[J].电脑编程技巧与维护,2009(4):22-22.
8李红.基于土工试验的数据挖掘中的数据预处理技术[J].合肥学院学报（自然科学版）,2004,14(1):35-36. 被引量：1
9CHEN Yixi,ZHANG Gexiang,WANG Tao,HUANG Xiaoli.Automatic Design of P Systems for Five Basic Arithmetic Operations within One Framework[J].Chinese Journal of Electronics,2014,23(2):302-304. 被引量：3
10钱德凤.综合数据库系统中关联规则挖掘[J].福建电脑,2005,21(12):103-104. 被引量：1

合肥工业大学学报（自然科学版）

2011年第2期

浏览历史

内容加载中请稍等...

基于领域知识的冗余关联规则消除算法被引量：3

参考文献9

二级参考文献20

共引文献39

同被引文献50

引证文献3

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于领域知识的冗余关联规则消除算法 被引量：3

参考文献9

二级参考文献20

共引文献39

同被引文献50

引证文献3

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于领域知识的冗余关联规则消除算法被引量：3