基于矩阵的数据流频繁模式预测算法被引量：1

Matrix-based Algorithm for Predicting Frequent Patterns over Data Streams

下载PDF

导出

摘要随着数据挖掘的广泛应用,许多实际的数据挖掘应用需要用过去和当前数据对未来数据状态进行预测,针对这一现状,文中提出基于矩阵的数据流频繁模式预测算法(MFP).MFP算法可预测在下一时间窗口中可能性较大的频繁项集,以满足用户需要.该算法首先将数据转换为0-1矩阵;然后通过矩阵剪裁和位运算更新矩阵,并从中挖掘频繁项集;最后,利用当前窗口数据预测下一时间窗口中可能出现的频繁项集.实验结果表明,MFP算法在不同实验环境下能有效预测频繁项集,该算法是可行的. With the wide application of data mining, many practical data mining applications need to use past and current data to predict the future state of the data. To solve this problem, we propose a new method （MFP） for predicting frequent patterns over data streams. MFP algorithm can predict those frequent itemsets that have high potential to become frequent in the subsequent time windows, to meet users＇ needs. Firstly, the algorithm converts the data to 0--1 matrix. Then it will update the matrix by tailoring it and bit operations, from which mine frequent itemsets as well. Finally, it will predict possible frequent itemsets that may appear in the next time window by using the current data. Experimental results show that MFP algorithm can predict the frequent itemsets in different experimental conditions, therefore, the algorithm is feasible.

作者任永功李雪兰

机构地区辽宁师范大学计算机与信息技术学院

出处《微电子学与计算机》 CSCD 北大核心 2012年第10期60-63,68,共5页 Microelectronics & Computer

基金国家自然科学基金项目(60603047) 教育部留学回国人员科研启动基金项目辽宁省科技计划项目(2008216014) 辽宁省教育厅高等学校科研基金(L2010229) 大连市优秀青年科技人才基金(2008J23JH026)

关键词频繁项集数据流数据挖掘矩阵预测 frequent itemset data stream data mining matrix predict

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献14

1张忠平,王浩,薛伟,夏炎.动态滑动窗口的数据流聚类方法[J].计算机工程与应用,2011,47(7):135-138. 被引量：19
2Haifeng Lathing Chen. Mining non-derivable frequent itemsets over data stream [J]. Data&Knowledge En- gineering, 2009(68) :481-498.
3Hua-Fu Li. Interactive mining of top-K frequent closed, itemsets from data streams[J]. Expert Systems with Applications, 2009(36): 10779-10788.
4Joong Hyuk Chang, Hye-Chung (Monica) Kum Fre- quency-based load shedding over a data stream of tup- les [J]. Information Sciences, 2009(179) : 3733-3744.
5Jin R, Agrawal G. Efficient decision tree construction on streaming data [C] //The ACM SIGKDD 9th Inter- national Conference on Knowledge Discovery and Data Mining. Washington, 2003: 2-6.
6Raymond T Ng,Jiewei HarL Efficient and effetive clus- tering methods of spatial data mining [C]// Proceed- ings of the 20th VLDB Conference. Chile: Santiago, 1994: 144-155.
7Shichao Zhang, Zhi Jin, Jingli Lu. Summary queries for frequent itemsets mining [J] The Journal of Systems and Software, 2010(83): 405-411.
8Tao Li, Shenghuo Zhu, Mitsunori Ogihara. A new dis- tributed data mining model based on similarity [C] ff Proceedings of the 18th Annual ACM Symposium on Applied Computing. Canada: Vancouver, 2003 : 432- 436.
9Agrawal R, Imilienski T, Swami A. Mining associa- tion rules between sets of items in large databases I-C] // Proceedings of the ACMSIGMOD International Conference on Management of Data. Washington, DC, 1993:207-216.
10Han Jiawei, Pei Jian, Yin Yiwer. Mining frequent pat terns without candidate generation[C]/// Proceedings of the ACM SIGMOD' 00. Dallas, TX, USA:ACM Press, 2000.

二级参考文献23

1朱红蕾,李明.一种高效维护关联规则的增量算法[J].计算机应用研究,2004,21(9):107-109. 被引量：9
2Xiu-LiMa,Yun-HaiTong,Shi-WeiTang,Dong-QingYang.Efficient Incremental Maintenance of Frequent Patterns with FP-Tree[J].Journal of Computer Science & Technology,2004,19(6):876-884. 被引量：9
3张素兰.一种基于事务压缩的关联规则优化算法[J].计算机工程与设计,2006,27(18):3450-3453. 被引量：16
4常建龙,曹锋,周傲英+.基于滑动窗口的进化数据流聚类[J].软件学报,2007,18(4):905-918. 被引量：60
5AGRAWAL R, IMIELINSKI T, SWAMI A. Mining association rules between sets of items in large databases [ C ]//Proc of ACM SIGMOD International Conference on Management of Data. New York:ACM Press, 1993:207-216.
6AGRAWAL R, SRIKANT R. Fast algorithm for mining association rules [ C ]//Proc of the 20th International Conference on VLDB. Santiago Chile: [ s,n] ,1994:487-499.
7HAN J, KAMBER M. Data mining: concepts and techniques [ M ]. Beijing : Higher Education Press, 2001 : 123-140.
8HAN Jia-wei, PEI Jian, YIN Yi-wen. Mining frequent patterns without candidate generation : a frequent-pattern tree approach [ J ]. Data Mining and Knowledge Discovery, 2004,8( 1 ) :53-87.
9WANG Jian-yong, Hart J, LU Y, et al. An efficient algorithm for mining top-k frequent dosed itemsets [ J]. IEEE Trans on Knowledge and Data Engineering, 2005,17 (5) :652-663.
10CHEUNG D W, HAN Jia-wei, NG V, et al. Maintenance of discovered association rules in large database : an incremental updating technique [ C ]//Proc of the 12th International Conference on Data Engineering. New Orleans : IEEE Computer Society, 1996 : 106-114.

共引文献23

1肖裕权,周肆清.基于粒子群优化算法的数据流聚类算法[J].计算机技术与发展,2011,21(10):43-46. 被引量：6
2钱琳,秦亮曦.按需系综的数据流分类算法研究[J].计算机工程,2012,38(5):62-63.
3丘晓平,黄小兵.非确定性数据处理技术发展现状与挑战[J].现代计算机,2012,18(18):9-14.
4任永功,李雪兰.基于WCF-tree加权滑动窗口数据流元项集挖掘[J].计算机应用与软件,2012,29(10):75-78. 被引量：1
5荀娇,徐连诚,杨仁华.基于排序索引矩阵的频繁项集挖掘算法[J].计算机工程,2012,38(19):41-44. 被引量：3
6任培花.基于微簇进化学习的数据流快速聚类算法研究[J].计算机仿真,2013,30(3):343-346. 被引量：1
7马彦图.冶金现场信息电子采集系统中数据优化方法研究[J].电气应用,2013,32(16):84-87.
8许颖梅.滑动窗口内动态数据流聚类算法研究[J].陕西理工学院学报（自然科学版）,2014,30(1):42-46.
9郭延锋.基于信息熵的动态数据流分类模型[J].计算机工程与设计,2014,35(3):900-904.
10程军锋.数据流挖掘技术研究[J].洛阳师范学院学报,2014,33(2):37-39. 被引量：1

同被引文献34

1钱鑫,张龙波,田爱奎,邓齐志,汪金苗.一种面向数据密集型计算环境的聚类算法[J].济南大学学报（自然科学版）,2013,27(1):11-15. 被引量：3
2陆斌杰.数据挖掘技术在医院管理中的应用[J].中国医疗器械杂志,2006,30(4):256-257. 被引量：6
3韩家炜.数据挖掘:概念与技术[M].北京:机械工业出版社,2006.
4曾勇.基于关联规则的电子病历挖掘的应用研究[D].广州:华南理工大学.2012.
5NILSSON N J. Artificial intelligence: a new synthesis [M].San Fransisco: Morgan Kaufmann Publishers Inc,1998.
6王曙燕,王晓梅.关联规则挖掘算法在分类中的应用研究[J].计算机与数字工程,2009,37(8):46-49. 被引量：7
7肖光磊,陆建峰,李文林,陈涤平.正相关关联规则及其在中医药中的应用[J].计算机工程与应用,2010,46(6):227-230. 被引量：9
8陈炯华,魏永越,孙骏,王永炎,谢雁鸣.基于数据挖掘的预警方法在双黄连注射剂不良反应监测中的应用研究[J].中国中药杂志,2010,35(3):308-312. 被引量：13
9杨静,张楠男,李建,刘延明,梁美红.决策树算法的研究与应用[J].计算机技术与发展,2010,20(2):114-116. 被引量：49
10高磊,刘兵,李桥.人工神经网络在气象因素预测急症发病中的应用[J].中国医学物理学杂志,2010,27(2):1806-1809. 被引量：6

引证文献1

1刘婵桢,王友俊.医学数据挖掘技术与应用研究[J].生物医学工程学杂志,2014,31(5):1182-1186. 被引量：12

二级引证文献12

1钱立,王红,廉耿,单长丽.互联网大背景下医学影像诊断云平台对保障民生健康工作有效推进机制的研究[J].科教导刊,2021(34):157-160. 被引量：2
2姜龙训,张玲.改进型蚁群聚类算法在单核苷酸多态性(SNPs)数据分析中的应用[J].中国数字医学,2015,10(5):77-80.
3田宗梅,王莉,肖琳.基于数据挖掘的临床路径抽取与应用[J].中国数字医学,2015,10(6):2-4. 被引量：6
4王殿君,邵宗凯.FP-Growth算法在药物相互作用系统中的应用[J].武汉工程大学学报,2015,37(10):57-60. 被引量：2
5黎彩芬,唐瑞璠,卢远新,韦玉玲,陈翠芹,何拥群.病案信息数据挖掘在老年高血压病临床护理中的应用[J].深圳中西医结合杂志,2016,26(12):132-133. 被引量：6
6陈超,沈思鹏,赵杨,陈峰,魏永越.大数据思维与传统统计思维差异的思考[J].南京医科大学学报（社会科学版）,2016,16(6):477-479. 被引量：2
7谢成,李雨晨,张士靖.国内外卫生信息管理领域的研究热点与趋势对比分析[J].中华医学图书情报杂志,2017,26(7):13-20. 被引量：2
8田金,刘振临,常雪非.医学影像信息系统在互联网时代的机遇与挑战[J].中国医疗设备,2016,31(12):169-171. 被引量：6
9梁晓雯,陈智毅.图像分类技术在超声诊断甲状腺结节中的应用进展[J].中国医学影像技术,2018,34(10):1578-1581. 被引量：7
10周晓蕾,王献红,李尊税,张曼林,袁彦丽,吴拥军.基于10项肿瘤标志的决策树模型在肺癌诊断中的应用[J].中国医药导刊,2018,20(11):641-645. 被引量：1

1袁万莲,郑诚,翟明清.一种改进的Apriori算法[J].计算机技术与发展,2008,18(5):51-53. 被引量：19
2李志云,周国祥.一种基于MFP树的快速关联规则挖掘算法[J].计算机技术与发展,2007,17(6):94-96. 被引量：6
3张友志,钱萌,程玉胜.基于MFP算法的Web日志挖掘技术的研究[J].电脑与信息技术,2006,14(2):60-62.
4朱惠.关联规则中Apriori算法的研究与改进[J].电脑知识与技术,2014,10(4X):2697-2701. 被引量：2
5李珺,宋文龙,朱良宽.一种新颖的关联规则数据挖掘算法[J].辽宁工程技术大学学报（自然科学版）,2014,33(6):846-849. 被引量：7
6石磊,孙根正,王仲奇,李西宁,康永刚,胡志明.基于最大独立集的曲面匹配算法研究[J].机械科学与技术,2010,29(12):1617-1622.
7谭国律.计算机纠错码中的0-1矩阵[J].上饶师范学院学报,2002,22(3):21-23.
8魏小锐,袁瑞芬,曲超.0-1矩阵的比特存储类[J].东莞理工学院学报,2010,17(3):44-47. 被引量：1
9高俊,何守才.布尔型关联规则挖掘算法研究[J].计算机工程,2006,32(1):116-118. 被引量：5
10梁洁,蔡琦,初珠立,王海萍.基于微粒群优化的贝叶斯网络结构学习方法[J].华中科技大学学报（自然科学版）,2012,40(12):44-48. 被引量：5

微电子学与计算机

2012年第10期

浏览历史

内容加载中请稍等...

基于矩阵的数据流频繁模式预测算法被引量：1

参考文献14

二级参考文献23

共引文献23

同被引文献34

引证文献1

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

基于矩阵的数据流频繁模式预测算法 被引量：1

参考文献14

二级参考文献23

共引文献23

同被引文献34

引证文献1

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

基于矩阵的数据流频繁模式预测算法被引量：1