一种数据流中的频繁模式挖掘算法被引量：3

Algorithm of frequent-patterns mining in data stream

下载PDF

导出

摘要时序数据流的无限性、流动性和不规则性使得传统的频繁模式挖掘算法难以适用。针对时序数据流的特点,提出了一类特殊非规则数据流频繁模式挖掘的新算法。新算法采用时序数据分段的思想,逐段挖掘局部频繁模式,然后依据局部频繁模式有效地挖掘出所有的全局频繁模式。将新算法应用于电信领域的收入保障项目之中,结果表明,新算法具有良好的性能,能有效发现挖掘时序数据流中的频繁模式。 The limitlessness, mobility, and irregularity of time series data stream make the traditional frequent-pattern mining algorithms difficult to extend to the mining problem of time series data stream. According to the characteristics of time series data stream, a new algorithm for mining the frequent-pattern from a kind of special irregular data stream was proposed, in which, time series data stream was partitioned firstly, and then the local frequent items were mined step by step. Finally, the global frequent items could be mined efficiently based on these local frequent items. After applying the new algorithm in the revenue assurance project of telecommunication field, the results show that the new algorithm has good performance, and can mine frequent-patterns effectively from the irregular data stream of telecommunication field.

作者朱琼施荣华

机构地区中南大学信息科学与工程学院

出处《计算机应用》 CSCD 北大核心 2008年第6期1463-1466,共4页 journal of Computer Applications

关键词数据流频繁模式非规则局部频繁项集全局频繁项集 data stream frequent pattern irregular local frequent item global frequent item

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献10

1CHARIKAR M, CHEN K, FARACH-COLTON M. Finding frequent items in data streams [ C]// Proceedings of the 29th International Colloquium on Automata, Languages, and Programming (ICALP'02), LNCS 2380. London: Springer-Verlag, 2002: 693- 703.
2KARP R M, SHENKER S, PAPADIMITRIOU C H. A simple algorithm for finding frequent elements in streams and bags [J]. ACM Transactions on Database Systems, 2003, 28(1):51 - 55.
3NAN JIANG, LE GRUENWALD. CFI-Stream: Mining closed frequent itemsets in data streams [ C]//The 12th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining ( KDD 06). New York: ACM Press, 2006:592 -597.
4HAN JIA-WEI, PEI JIAN, YIN YI-WEN, et al. Mining frequent patterns without candidate generation: A frequent pattern tree approach [ J]. Data Mining and Knowledge Discovery, 2004, 8 ( 1 ) : 53 - 87.
5CHENG J, KE YI-PING, NG W. Maintaining frequent itemsets over high-speed data streams [ C]// Pacific-Asia Conference on Knowledge Discovery and Data Mining ( PAKDD 2006), LNAI 3918. Berlin: Springer-Verlag, 2006:462-467.
6MANKU G S , MOTWANI R . Approximate frequency counts over data streams [C]// Proceedings of the 28th International Conference on Very Large Data Bases. Hong Kong: Morgan Kaufmann Publishers, 2002:346-357.
7GIANNELL A, HAN J, PEI J, et al. Mining frequent patterns in data streams at multiple time granularities [ C]// Next Generation Data Mining. [S. l. ] : AAAI/MIT Press, 2003:191 -202.
8刘学军,徐宏炳,董逸生,王永利,钱江波.挖掘数据流中的频繁模式[J].计算机研究与发展,2005,42(12):2192-2198. 被引量：25
9HIDBER C. Online association rule mining [ C]// Proceedings of the ACM SIGMOD International Conference on Management of Data (SIGMOD 1999). New York: ACM Press, 1999:145-156.
10CHANG J H, LEE W S. Finding recent frequent itemsets adaptively over online data streams [ C]// Proceedings of the 9th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM Press, 2003:487-492.

二级参考文献12

1C. Giannella, J. Han, J. Pei, et al. Mining frequent patterns in data streams at multiple time granularities. In: H. Kargupta, A.Joshi, K. Sivakumar, eds. Next Generation Data Mining.Cambridge, Massachusetts: MIT Press, 2003. 191-212.
2G.S. Manku, R. Motwani. Approximate frequency counts over streaming data. The 28th Int'l Conf. Very Large Data Bases(VLDB 2002), Hong Kong, 2002.
3宋国杰王腾蛟唐世渭.数据流中频繁模式的评估与维护[A]..第20届全国数据库学术会议[C].长沙,2003..
4R.M. Karp, C. H. Papadimitriou, S. Shenker. A simple algorithm for finding frequent elements in streams and bags. ACM Trans. Database Systems, 2003, 28 (1): 51 - 55.
5M. Charikar, K. Chen, M. Farach-Colton. Finding frequent items in data streams. The 29th Int'l Colloquium on Automata,Languages and Programming, Malaga, Spain, 2002.
6Joong Hyuk Chang, Won Suk Lee. Finding recent frequent itemsets adaptively over online data streams. The 9th ACM SIGKDD Int'l Conf. Knowledge Discovery and Data Mining (KDD 03), Washington, D. C, 2003.
7Wei-Guang Teng, Ming-Syan Chen, Philip S. Yu. A regressionbased temporal pattern mining scheme for data streams. The Int'l Conf. Very Large Data Bases, Berlin, Germany, 2003.
8Graham Cormode, Flip Korn, S. Muthukrishnan, et al. Finding hierarchical heavy hitters in data streams. The Int'l Conf. Very Large Data Bases (VLDB) 2003, Berlin, Germany, 2003.
9Tatsuya Asai, Hiroki Arimura, Kenji Abe, et al. Online algorithms for mining semi-structured data stream. The IEEE Int'l Conf. Data Mining (ICDM) 2002, Maebashi City, Japan,2002.
10Graham Cormode, S. Muthukrishnan. What' s hot and what's not: Tracking most frequent items dynamically. The ACM Symposium on Principles of Database Systems (PODS) 2003, San Diego, CA, USA, 2003.

共引文献24

1史金成,胡学钢.数据流挖掘研究[J].计算机技术与发展,2007,17(11):11-14. 被引量：6
2程转流,王本年.数据流中的频繁模式挖掘[J].计算机技术与发展,2007,17(12):53-55. 被引量：5
3孙莉.数据库和数据流频繁项集挖掘算法研究[J].现代机械,2007(5):54-57.
4庄波,刘希玉.数据流中频繁模式挖掘算法研究及进展[J].福建电脑,2008,24(3):8-8.
5敖富江,颜跃进,黄健,黄柯棣.数据流频繁模式挖掘算法设计[J].计算机科学,2008,35(3):1-5. 被引量：11
6祖悦,党德玉.网格环境下基于分布式数据流频繁模式的数据更新算法[J].吉林化工学院学报,2009,26(1):54-58.
7孟彩霞.一种面向数据流的频繁项集挖掘算法[J].昆明理工大学学报（理工版）,2009,34(5):26-30.
8孟彩霞.面向数据流的频繁模式挖掘研究[J].计算机应用研究,2009,26(11):4054-4056. 被引量：1
9胡为成,王本年,程转流.基于DSCFCI_tree的带项目约束的数据流频繁闭合模式挖掘算法[J].中国科学技术大学学报,2009,39(11):1194-1201. 被引量：2
10陈辉,邓庆山,杨兵.挖掘数据流最近时间窗口内频繁模式[J].小型微型计算机系统,2009,30(12):2404-2408. 被引量：2

同被引文献22

1金澈清,钱卫宁,周傲英.流数据分析与管理综述[J].软件学报,2004,15(8):1172-1181. 被引量：161
2邹宏,陈海,魏勍颋.基于数据挖掘的入侵检测技术研究[J].计算机与现代化,2005(4):39-41. 被引量：6
3宋余庆,朱玉全,孙志挥,杨鹤标.一种基于频繁模式树的约束最大频繁项目集挖掘及其更新算法[J].计算机研究与发展,2005,42(5):777-783. 被引量：21
4张锦,马海兵,胡运发.一种基于FP-Tree的频繁模式挖掘自适应算法[J].模式识别与人工智能,2005,18(6):763-768. 被引量：2
5郑军,胡铭曾,云晓春,郑仲.基于数据流方法的大规模网络异常发现[J].通信学报,2006,27(2):1-8. 被引量：17
6郭山清,谢立,曾英佩.入侵检测在线规则生成模型[J].计算机学报,2006,29(9):1523-1532. 被引量：14
7刘旭,毛国君,孙岳,刘椿年.数据流中频繁闭项集的近似挖掘算法[J].电子学报,2007,35(5):900-905. 被引量：14
8G.Hulten,L.Spencer, P.Domingos.Mining Time -changing Data Streams[C].In Proc.of ACM SIGKDD,2001.
9刘兵.Web数据挖掘[M].北京:清华大学出版社,2009.
10Yeung Dit-Yan, Ding Yuxin. Host-based intrusion detection using dynamic and static behavioral models [ J ]. Pattern Recognition,2006,36( 1 ) : 229.

引证文献3

1王大将,孙洁.数据流挖掘技术研究[J].统计与决策,2010,26(7):161-162.
2许颖梅.基于Web数据流技术的网络入侵检测研究[J].郑州轻工业学院学报（自然科学版）,2012,27(3):11-14. 被引量：1
3吐尔地·托合提,维尼拉·木沙江,艾斯卡尔·艾木都拉.基于频繁模式挖掘的维吾尔文智能组词方法[J].计算机应用,2012,32(10):2920-2922. 被引量：6

二级引证文献7

1莫礼平,周恺卿.方块苗文动态构造方法的形式化描述[J].计算机应用,2014,34(3):861-864. 被引量：2
2徐静,姚志垒,徐森,李永忠,吴素芹.智能电网中分层网络结构的入侵检测系统研究[J].郑州轻工业学院学报（自然科学版）,2015,30(5):88-92. 被引量：1
3吴冰冰,哈力旦.阿布都热依木,阿丽亚.艾尔肯,何燕.人工鱼群优化的维吾尔文文本特征选择方法[J].河南科技大学学报（自然科学版）,2016,37(6):46-50. 被引量：1
4伊尔夏提.吐尔贡,吾守尔.斯拉木,热西旦木.吐尔洪太.基于有监督分词方法的维吾尔文情感分析[J].计算机工程与设计,2017,38(11):3143-3146. 被引量：3
5李成华,孙雅婧,张世娟,艾提日也古丽·艾尼瓦尔.基于CRF模型的维吾尔语分词研究[J].中南民族大学学报（自然科学版）,2019,38(4):596-604.
6孙雅婧,李成华,杨斌,江小平,艾提日也古丽·艾尼瓦尔.基于BI-LSTM-CRF模型的维吾尔语分词研究[J].青海师范大学学报（自然科学版）,2019,35(4):5-12. 被引量：1
7刘畅,阿布都克力木·阿布力孜,姚登峰,哈里旦木·阿布都克里木.维吾尔语形态分析研究综述[J].计算机工程与应用,2021,57(15):42-61. 被引量：3

1张艺雪,黄毅杰.一种基于MapReduce的Apriori改进算法研究[J].兰州工业学院学报,2014,21(6):13-16. 被引量：2
2郭进伟,皮建勇.基于MapReduce的SON算法实现[J].计算机应用,2014,34(A01):100-102. 被引量：7
3洪月华.传感器网络分布式数据流的频繁项集挖掘算法[J].计算机科学,2013,40(2):58-60. 被引量：4
4黄毅杰.一种基于Map Reduce的关联规则挖掘算法[J].兰州文理学院学报（自然科学版）,2014,28(5):48-51.
5何波.基于频繁模式树的分布式关联规则挖掘算法[J].控制与决策,2012,27(4):618-622. 被引量：11
6陈一心,杨磊,杨颖.基于分布式全局频繁项集挖掘算法的研究[J].计算机光盘软件与应用,2012,15(24):156-156.
7曾庆森,黄贤英.基于FP-tree的快速数据挖掘算法[J].重庆工学院学报（自然科学版）,2009,23(10):72-76. 被引量：3
8何波,王华秋,刘贞,王越.快速挖掘频繁项集的并行算法[J].计算机应用,2006,26(2):391-392. 被引量：5
9何中胜,刘宗田.一种无候选集产生的并行关联规则挖掘算法[J].计算机工程与应用,2004,40(24):163-165. 被引量：2
10张青.Apriori挖掘算法的优化研究[J].河南科技,2014,33(11X):14-15. 被引量：1

计算机应用

2008年第6期

浏览历史

内容加载中请稍等...

一种数据流中的频繁模式挖掘算法被引量：3

参考文献10

二级参考文献12

共引文献24

同被引文献22

引证文献3

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

一种数据流中的频繁模式挖掘算法 被引量：3

参考文献10

二级参考文献12

共引文献24

同被引文献22

引证文献3

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

一种数据流中的频繁模式挖掘算法被引量：3