基于领域知识和聚类的关联规则深层知识发现研究被引量：18

Research on Algorithm of Post-processing Association Rules Based on Clustering and Domain Knowledge

导出

摘要本文针对传统关联规则挖掘算法产生大量冗余规则,提出了对关联规则结果进行二次挖掘,并设计了算法对挖掘出的关联规则进行聚类,然后基于已有领域知识对聚类后的关联规则进行新颖度评价,对于新颖度较高价值较大的关联规则可以存储于领域知识库用于决策使用或再次挖掘过程。该算法有效的减少的规则的数量,提高了规则的新颖性和精确度,对商业应用具有很高的价值。文章最后使用UCI开源数据进行了实验分析,并验证了该算法的有效性。 Second mining of the result of association rule mining is proposed in solution of the large numbers of redundant rules in the traditional association rules mining algorithm,and the algorithm for clustering of association rules is designed,then the novelty of the association rules is assessed after clustering based on the existing domain knowledge.It is insited that the association rules with more novelty and higher value can be stored in the domain knowledge base,and can be used for the decision or mining again.The algorithm proposed in this paper is effective to reduce the number of rules and also help to improve the novelty and precision of rule,which has a very high value for business applications.Finally the open source data from UCI is used to carry on the experiment to verify the effectiveness of the algorithm.

作者张玲玲周全亮唐广文李兴森石勇

机构地区中国科学院大学管理学院中国科学院虚拟经济与数据科学研究中心中国科学院大数据挖掘与知识管理重点实验室英大泰和财产保险股份有限公司浙江大学宁波学院

出处《中国管理科学》 CSSCI 北大核心 2015年第2期154-161,共8页 Chinese Journal of Management Science

基金国家自然科学基金资助项目(71471169 71071151)

关键词关联规则聚类领域知识深层知识发现 association rule clustering domain knowledge post-processing

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论] F224 [经济管理—国民经济]

引文网络
相关文献

参考文献6

1马建庆,钟亦平,张世永.基于兴趣度的关联规则挖掘算法[J].计算机工程,2006,32(17):121-122. 被引量：20
2朱恒民,姬小利,王宁生.一种挖掘意外规则的方法[J].南京航空航天大学学报,2005,37(3):381-385. 被引量：1
3韦素云,吉根林,曲维光.关联规则的冗余删除与聚类[J].小型微型计算机系统,2006,27(1):110-113. 被引量：15
4杨立波.基于聚类的关联规则挖掘算法[J].太原大学学报,2011,12(3):113-116. 被引量：3
5朱靖波,陈文亮.基于领域知识的文本分类[J].东北大学学报（自然科学版）,2005,26(8):733-735. 被引量：12
6HandD MannilarH SmythP.数据挖掘原理[M].北京:机械工业出版社,2003..

二级参考文献36

1A. Savasere, E. Omiecinski, S. Navathe, An efficient algorithm for mining association rules in large databases [ C ]. Zurich : Proceedings of 21 th VLDB Conference, 1995:432 - 444.
2Jiawei Han Micheline Kamber.数据挖掘概念与技术[M].北京:机械工业出版社,2001..
3Boykin S, Merlino A. Machine learning of event segmentation for news on demand[J]. Communications of the ACM, 2000,43(2):35-41.
4Luhn H P. A statistical approach to mechanized encoding and searching of literary information[J]. IBM Journal, 1957,10(1):309-317.
5Edmundson H. New methods in automatic extracting[J]. Journal of the ACM, 1969,16(2):264-285.
6Salton G, James A, Buckley C. Automatic analysis, theme generation, and summarization of machine-readable texts[J]. Science, 1994,264(3):1421-1426.
7Lehnert W, Loiselle C. An introduction to plot unit[A]. Semantic Structures-Advances in Natural Language Processing[C]. Hillsdale: Lawrence Erlbaum Associates, 1989.88-111.
8Hearst A. Context and structure in automated full-text information access[D]. Berkeley:University of California, 1994.103-105.
9Peter W F. Latent semantic analysis for text-based research, behavior research methods[J]. Instruments and Computers, 1996,28(2):197-202.
10Fabrizio S. Machine learning in automated text categorization[J]. ACM Computing Surveys, 2002,34(1):1-47.

共引文献71

1吴志勇,吴跃.数据挖掘在电信业中的应用研究[J].计算机应用,2005,25(B12):213-214. 被引量：11
2曾万聃,周绪波,戴勃,常桂然,李春平.关联规则挖掘的矩阵算法[J].计算机工程,2006,32(2):45-47. 被引量：33
3孙亚男,宁士勇,鲁明羽,陆玉昌.中医诊疗决策支持系统中的OLAP与DM融合[J].计算机工程,2006,32(9):251-252. 被引量：3
4王礼刚,左源瑞,李盛瑜.一种基于改进型遗传算法的关联规则提取算法及其应用[J].重庆师范大学学报（自然科学版）,2006,23(2):42-45. 被引量：9
5陈学进.数据挖掘中聚类分析的研究[J].计算机技术与发展,2006,16(9):44-45. 被引量：31
6陈亚东.数据挖掘在图书馆中的应用[J].中华医学图书情报杂志,2006,15(5):16-18. 被引量：3
7孔令富,王晗,练秋生.一种基于关联规则挖掘的组织数据方法[J].计算机工程,2006,32(21):12-14. 被引量：5
8吕宗磊,王建东.一种基于多维空间超球体的快速聚类算法[J].南京航空航天大学学报,2006,38(6):706-711. 被引量：7
9季顺宁,李立乡.基于毕业生跟踪调查数据库分析课程的相关性[J].职业技术教育,2006,27(26):32-34. 被引量：2
10谭学清,罗琳,周洞汝.关联规则兴趣度度量方法的比较研究[J].情报学报,2007,26(2):266-270. 被引量：14

同被引文献333

1白玫.“十四五”时期新能源汽车产业竞争力提升的方向与路径[J].价格理论与实践,2021(2):18-24. 被引量：33
2张涛,吴冲.信息系统安全漏洞研究[J].哈尔滨工业大学学报（社会科学版）,2008,10(4):71-76. 被引量：8
3李民,周晶,高俊.复杂产品系统研制中的知识创造机理实证研究[J].科学学研究,2015,33(3):407-418. 被引量：17
4吴锋,李怀祖.外包环境下的知识管理与控制[J].研究与发展管理,2004,16(4):31-37. 被引量：8
5谢林柏,方华京,王华.网络化控制系统的信息调度与稳定性研究[J].控制与决策,2004,19(5):589-591. 被引量：19
6钱颖一.谈大学学科布局[J].清华大学教育研究,2003,24(6):1-11. 被引量：73
7姚望舒,商琳,陈兆乾.一种基于进化算法的连续属性离散化方法[J].计算机应用与软件,2005,22(3):37-39. 被引量：7
8谷岩,冯华.智能化城市防灾救灾应急处理支持系统的研究[J].计算机工程与设计,2005,26(6):1503-1505. 被引量：5
9蔡华利,刘鲁,李红.基于规则推理的突发事件发生地点识别研究[J].情报学报,2011,30(2):219-224. 被引量：8
10陈淑珍.基于粗集的几种属性约简算法分析[J].武汉工业学院学报,2005,24(3):118-120. 被引量：17

引证文献18

1王宁,刘海园,周雪珂.基于粗糙集的应急案例中概率规则挖掘方法[J].运筹与管理,2018,27(12):84-94. 被引量：2
2蒋勋,徐绪堪,唐明伟,苏新宁.适应突发事件演化的知识表示模型研究[J].情报理论与实践,2016,39(3):122-124. 被引量：12
3徐扬.知识管理在新产品开发中的挑战[J].科技管理研究,2016,36(8):142-145. 被引量：1
4翟丽丽,由扬,何晓燕,张树臣.基于领域知识的O2O电商知识网络构建研究[J].情报杂志,2016,35(10):153-159. 被引量：3
5黄俊杰,谭波,陈孝明,陈江平,阮羚,冯莞舒,熊宇.用Apriori关联规则挖掘算法发现湖北电网雷击灾害的时空分布规律[J].应用科学学报,2017,35(1):31-41. 被引量：8
6洪亮,李雪思,周莉娜.领域跨越:数据挖掘的应用和发展趋势[J].图书情报知识,2017,34(4):22-32. 被引量：18
7蒋勋,苏新宁,周鑫.适应情景演化的应急响应知识库协同框架体系构建[J].图书情报工作,2017,61(15):60-71. 被引量：13
8蒋勋,苏新宁,唐明伟,蔡玉婷.适应情景演化推演的应急决策知识库协同架构研究[J].情报理论与实践,2017,40(11):67-72. 被引量：9
9蒋勋,苏新宁,陈祖琴.多维视角下应急情报管理体系的知识库构建研究[J].情报学报,2017,36(10):1008-1022. 被引量：35
10宋董飞,徐华.DBSCAN算法研究及并行化实现[J].计算机工程与应用,2018,54(24):52-56. 被引量：21

二级引证文献204

1杨金庆,吴乐艳,魏雨晗,陆伟,罗威.科技文献新兴话题识别研究进展[J].情报学进展,2020(1):202-234. 被引量：3
2苏新宁,杨国立.我国情报学学科建设研究进展[J].情报学进展,2020(1):1-38. 被引量：14
3李望月,刘瑾,陈娜.大数据技术在乡村画像中的应用研究[J].大数据,2020,6(1):99-118. 被引量：6
4高继轩.《压力容器安全技术监察规程》问答[J].中国锅炉压力容器安全,2000,16(2):27-29. 被引量：3
5王宜鸿,魏雪迎,叶鹰.大小数据集上的信息分析刍议[J].图书馆杂志,2018,37(12):14-19. 被引量：6
6王婉,滕佳颖,程子轩,张小龙.复杂工程突发事件应急响应情报分析框架[J].智能建筑与智慧城市,2018(12):35-37. 被引量：1
7刘宇,梁循,杨小平.基于Petri网的微博网络信息传播模型[J].中国管理科学,2018,26(12):158-167. 被引量：9
8陈可嘉,赵政.用户交易数据不足情况下的商品关联规则扩展与应用[J].福州大学学报（哲学社会科学版）,2019,33(1):42-47. 被引量：2
9李晓炜,黄荣刚.新产品开发的挑战与管理对策研究[J].经济视野,2016,0(4):60-60.
10蒋勋,苏新宁,周鑫.适应情景演化的应急响应知识库协同框架体系构建[J].图书情报工作,2017,61(15):60-71. 被引量：13

1钱大群,吕勇哉.一个基于深层知识的故障定位方法[J].信息与控制,1989,18(1):1-7. 被引量：3
2张敬普,王建玺.基于linux的备份系统的设计与实现[J].科技风,2010(16).
3万钢.基于VB的网络应用程序设计[J].武汉科技学院学报,2006,19(9):23-24. 被引量：1
4郝文江.互联网开源数据存储与分析技术研究[J].信息网络安全,2013(7):24-27. 被引量：1
5吴勇,朱岩,朱建民,何建华,陈铭.深层知识在故障诊断专家系统中的应用[J].电光与控制,2001,8(2):30-32. 被引量：1
6李楠.与规划编制相关的网络开源数据获取应用研究[J].中国科技纵横,2015,0(24):29-29.
7钱大群,吴智铭.“人工智能及其应用”讲座第五讲深层知识与浅层知识[J].自动化仪表,1991,12(5):42-45.
8张卫华,李传坤,吴重光,王春利.基于SDG的化工过程多故障诊断[J].系统仿真学报,2009,21(21):6972-6977. 被引量：2
9张凡,张倩.开源数据库数据存储策略探析[J].电脑开发与应用,2007,20(12):64-64.
10杜殿林,张光红,吴重光.基于知识故障诊断系统所用的深层知识及SDG方法[J].化工自动化及仪表,2005,32(4):8-11. 被引量：10

中国管理科学

2015年第2期

浏览历史

内容加载中请稍等...

基于领域知识和聚类的关联规则深层知识发现研究被引量：18

参考文献6

二级参考文献36

共引文献71

同被引文献333

引证文献18

二级引证文献204

相关作者

相关机构

相关主题

浏览历史

基于领域知识和聚类的关联规则深层知识发现研究 被引量：18

参考文献6

二级参考文献36

共引文献71

同被引文献333

引证文献18

二级引证文献204

相关作者

相关机构

相关主题

浏览历史

基于领域知识和聚类的关联规则深层知识发现研究被引量：18