密度网格参数自适应的数据流聚类算法被引量：2

Density Grid-Based Data Stream Clustering Algorithm with Parameter Automa-tization

下载PDF

导出

摘要针对传统密度网格算法在聚类中自动获取密度阈值不够精确的问题,提出了一种基于密度网格参数自适应的数据流聚类算法A-Stream。通过引入"双密度阈值",并以平均值作为密度阈值,对传统聚类算法进行了改进,解决了算法不能获取精确值的问题。实验结果表明,A-Stream算法不仅保留了传统密度网格算法的高效性,而且较大程度上提高了聚类精度。 For the problem that traditional density grid-based stream clustering algorithm cannot get accurate density value, this paper introduces a new density grid-based stream clustering algorithm with parameter automatization A-Stream. Through the introduction of the double density, the traditional density grid-based clustering algorithm for data stream is improved by taking the average as the grid density, resolving the problem that algorithm cannot get accurate value automatically. The experimental results show that not only the high efficiency of the grid-based algorithm is utilized, but also the clustering accuracy is raised significantly.

作者邢长征王飞王丽丽

机构地区辽宁工程技术大学电子与信息工程学院辽宁工业大学电子与信息工程学院

出处《计算机科学与探索》 CSCD 2011年第10期953-958,共6页 Journal of Frontiers of Computer Science and Technology

关键词聚类数据流网格参数自适应密度阈值 clustering data stream grid parameter adaptation density threshold

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献4

1屠莉,陈崚,邹凌君.数据流的网格密度聚类算法[J].小型微型计算机系统,2009,30(7):1376-1382. 被引量：6
2李子文,邢长征.滑动窗口内基于密度网格的数据流聚类算法[J].计算机应用,2010,30(4):1093-1095. 被引量：5
3常建龙,曹锋,周傲英+.基于滑动窗口的进化数据流聚类[J].软件学报,2007,18(4):905-918. 被引量：61
4戴东波,赵杠,孙圣力.基于概率数据流的有效聚类算法[J].软件学报,2009,20(5):1313-1328. 被引量：15

二级参考文献62

1Cormode G, Garofalakis M. Sketching probabilistic data streams. In: Chan CY, Ooi BC, Zhou A, eds. Proc. of the ACM SIGMOD Int'l Conf. on Management of Data. Beijing: ACM Press, 2007. 281-292.
2Jayram TS, McGregor A, Muthukrishan, Vee E. Estimating statistical aggregates on probabilistic data streams. In: Libkin L, ed. Proc. of the 26th ACM SIGMOD-SIGACT-SIGART Symp. Principles of Database Systems. Beijing: ACM Press, 2007. 243-252.
3Jayram TS, Kale S, Vee E. Efficient aggregation algorithms for probabilistic data. In: Bansal N, Pruhs K, Stein C, eds. Proc. of the 18th Annual ACM-SIAM Syrup. on Discrete Algorithms (SODA). New Orleans: SIAM, 2007. 346-355.
4Aggarwal CC, Han J, Yu PS. A framework for clustering evolving data streams. In: Freytag JC, Lockmann PC, Abiteboul S, Carey MJ, Seling PG, Heuer A, eds. Proc. of the Int'l Conf. on Very Large Data Bases. Berlin: Morgan Kaufmann Publishers, 2003. 81-92.
5Dalvi N, Suciu D. Efficient query evaluation on probabilistic databases. In: Nascimento MA, Ozsu MT, Kossmann D, Miller RJ, Blakeley JA, Schiefer KB, eds. Proe. of the VLDB. Toronto: Morgan Kaufmarm Publishers, 2004. 864-875.
6Burdick D, Deshpande PM, Jayram TS, Ramakrishnan R, Vaithyanathan S. OLAP over uncertain and imprecise data. In: Bohm K, Jensen CS, Haas LM, Kersten ML, Larson P, Ooi BC, eds. Proc. of the Int'l Conf. on Very Large Data Bases. Trondheim: ACM Press, 2005.970-981.
7Sarma AD, Benjelloum O, Halevy A, Widom J. Working models for uncertain data. In: Liu L, Reuter A, Whang KY, Zhang J, eds. Proc. of the 22nd Int'l Conf. on Data Engineering. Atlanta: IEEE Computer Society, 2006.
8Cheng R, Kalashnikov D, Prabhakar S. Querying imprecise data in moving object environments. IEEE Trans. on Knowledge and Data Engineering, 2004,16(9):1112-1127.
9Ngai WK, Kao B, Chui CK, Cheng R, Chau M, Yip KY. Efficient clustering of uncertain data. In: Cliton CW, Zhong M, Liu JM, Wah BW, Wu XD, eds. Proc. of the 6th IEEE Int'l Conf. on Data Mining. Hong Kong: IEEE Computer Society, 2006. 436-445.
10Guha S, Mishra N, Motwani R, Callaghan LO. Clustering data streams. In: Yong DC, ed. Proe. of the 41st Annual Symp. on Foundations of Computer Science. Redondo Beach: IEEE Computer Society, 2000. 359-366.

共引文献79

1黄孝.数据流聚类算法分析[J].池州学院学报,2007,21(5):11-13. 被引量：1
2胡彧,闫巧梅.滑动窗口模型下的优化数据流聚类算法[J].计算机应用,2008,28(6):1414-1416. 被引量：6
3胡彧,闫巧梅.基于滑动窗口的流数据聚类算法研究[J].计算机工程与设计,2008,29(21):5621-5623. 被引量：4
4张天成,岳德君,于戈,林树宽,谷峪.数据流挖掘研究及其进展[J].小型微型计算机系统,2008,29(12):2241-2246. 被引量：5
5刘波,杨路明,邓云龙.自适应的混沌粒子群算法优化XML文档聚类策略[J].系统仿真学报,2009,21(3):716-720. 被引量：3
6张驹,黄汉永,肖杰.一种基于Hash函数抽样的数据流聚类算法[J].计算机系统应用,2009,18(3):73-75. 被引量：3
7王述云,张成洪,郝秀兰,胡运发.基于免疫原理的数据流聚类算法[J].模式识别与人工智能,2009,22(2):246-255. 被引量：5
8张晓龙,曾伟.实时数据流聚类的研究新进展[J].计算机工程与设计,2009,30(9):2177-2181. 被引量：5
9叶奇明,梁根.量子遗传算法的模糊K-prototypes聚类[J].计算机工程与应用,2010,46(1):112-115. 被引量：1
10彭宇,罗清华,彭喜元.网络化测试体系中不确定性数据处理方法浅析[J].仪器仪表学报,2010,31(1):229-240. 被引量：18

同被引文献15

1刘青宝,戴超凡,邓苏,张维明.基于网格的数据流聚类算法[J].计算机科学,2007,34(3):159-161. 被引量：10
2Guha S, Mishra N, Motwani R, et al. Clustering Data Stream: Theory and Practice[J]. IEEE Transactions on Knowledge and Data Engineering, 2003, 15(3): 515-528.
3O'Callaghan L, Mishra N, Meyerson A, et al. Streaming Data Algorithms for High-quality Clustering[C]//Proc. of the 18th International Conference on Data Engineering. [S. 1.]: IEEE Press, 2002: 685-704.
4Aggarwal C C, Han Jiawei, Wang Jianyong, et al. A Frame- work for Clustering Envolving Data Streams[C]//Proc. of the 29th International Conference on Very Large Data Bases. [S. 1.]: ACM Press, 2003: 81-92.
5Zhang Tian, Ramakrishnan R, Livny M. BIRCH: An Efficient Data Clustering Method for Very Large Databases[C]//Proc. of ACM SIGMOD International Conference on Management of Data. New York, USA: ACM Press, 1996:103-114.
6Chen Yixin, Tu Li. Density-based Clustering for Real-time Stream Data[C]//Proc. of the 13th ACM SIGKDD Inter- national Conference on Knowledge Discovery and Data Mining. New York, USA: ACM Press, 2007: 133-142.
7Nasereddin H H O. Stream Data Mining[J]. Computer and Information Science, 2009, 1(8): 183-190.
8高永梅,黄亚楼.一种基于网格和密度的数据流聚类算法[J].计算机科学,2008,35(2):134-137. 被引量：6
9胡彧,闫巧梅.滑动窗口模型下的优化数据流聚类算法[J].计算机应用,2008,28(6):1414-1416. 被引量：6
10单世民,张宁,江贺,张宪超.基于网格和密度的簇边缘精度增强聚类算法[J].计算机工程与应用,2008,44(23):143-146. 被引量：4

引证文献2

1王治和,杨晏.基于双层网格和密度的数据流聚类算法[J].计算机工程,2014,40(4):146-150. 被引量：3
2李世明,张秉桢,杜军,朱海龙,付宝君.一种用于居住热区聚类的改进CLIQUE算法[J].小型微型计算机系统,2020,41(1):61-65. 被引量：2

二级引证文献5

1胡朝举,贾文瑞.数据流聚类算法在网络入侵检测中的应用研究[J].网络安全技术与应用,2016(7):56-57. 被引量：1
2杨慧,李振,霍纬纲.改进小波聚类算法在QAR数据中的应用[J].计算机工程,2017,43(9):29-33. 被引量：4
3韦洁华.基于自适应微簇的任意形状概念漂移数据流聚类[J].计算机应用与软件,2020,37(11):260-267. 被引量：1
4许立辉,陈敏,王池社.一种用于中医四诊分析的子空间聚类方法[J].计算机与现代化,2020(12):67-71.
5华琴,赵刚.基于自适应寻优控制和多目标学习参数模型的AI人工智能翻译研究[J].自动化与仪器仪表,2024(9):33-38.

1唐颖峰,陈世平.一种基于网格块的分布式数据流聚类算法[J].小型微型计算机系统,2016,37(3):488-493. 被引量：4
2李子文,邢长征.滑动窗口内基于密度网格的数据流聚类算法[J].计算机应用,2010,30(4):1093-1095. 被引量：5
3林秀丹,毛国君.基于密度网格的分布式数据流聚类算法[J].计算机工程,2012,38(16):70-73. 被引量：6
4米源,杨燕,李天瑞.基于密度网格的数据流聚类算法[J].计算机科学,2011,38(12):178-181. 被引量：11
5Qun-Sheng Peng,Hong Qin.Preface[J].Journal of Computer Science & Technology,2009,24(1):1-1. 被引量：3
6张洪涛,张坤,马培军.参数可调的自扩展聚类算法及其应用[J].哈尔滨工业大学学报,2007,39(11):1695-1698. 被引量：1
7李俊贤.PC新品速速报[J].大众科技,2002,0(6):16-18.
8张叶银（编译）.基于模型多视角的人体三维重建[J].科学新闻,2008(18):4-4.
9毛国君,王欣,竹翠.基于网格结构的数据流在线快速聚类算法[J].北京工业大学学报,2011,37(10):1575-1579. 被引量：1
10章登义,李想.一种基于密度网格索引的k-最近邻查询算法[J].电子学报,2017,45(2):376-383. 被引量：8

计算机科学与探索

2011年第10期

浏览历史

内容加载中请稍等...

密度网格参数自适应的数据流聚类算法被引量：2

参考文献4

二级参考文献62

共引文献79

同被引文献15

引证文献2

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

密度网格参数自适应的数据流聚类算法 被引量：2

参考文献4

二级参考文献62

共引文献79

同被引文献15

引证文献2

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

密度网格参数自适应的数据流聚类算法被引量：2