期刊文献+

基于可控聚类边缘计算算法的实时大数据流研究与分析 被引量:2

下载PDF
导出
摘要 针对传统聚类算法在处理大数据流时出现的效率低、性能差、响应慢、稳定性不足等问题,提出了一种实时流可控的聚类边缘计算算法(SCCEC)。首先,通过粗糙聚类方法对实时大数据元组进行预处理,确定聚类数量和中心点位置,并形成具有差异的宏聚类集合。其次,对获得的宏聚类集合进行采样处理,并以最大和最小距离进行K均值并行聚类,实现数据的精细聚类。最后,将完全聚类算法和边缘计算算法相结合,并在边缘计算框架下进行仿真实验。实验结果表明,该算法相比传统聚类算法运行效率更高、计算质量更好、稳定性更强,可有效提高大数据聚类性能,并降低实时数据流误分类率。
出处 《长江信息通信》 2023年第2期51-54,共4页 Changjiang Information & Communications
  • 相关文献

参考文献10

二级参考文献61

  • 1杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量:192
  • 2高宏宾,潘谷,黄义明.基于频繁项集特性的Apriori算法的改进[J].计算机工程与设计,2007,28(10):2273-2275. 被引量:25
  • 3曾志雄.一种有效的基于划分和层次的混合聚类算法[J].计算机应用,2007,27(7):1692-1694. 被引量:15
  • 4BABCOCK B, BABU S, DATAR M. Model and issues in data stream systems[ C]//Proc of the 21st ACM SIGMOD International Conference on Principles of Database Systems. New York: ACM Press, 2002 : 1-16.
  • 5QIN Shou-ke, QIAN Wei-ning, ZHOU Ao-ying. Approximately pro- cessing multi-granularity aggregate queries over a data stream [ C ]//Proc of the 22nd International Conference on Data Engineering. Washington DC : IEEE Computer Society ,2006:468-472.
  • 6MUTHUKRISHNAN S. Data streams: algorithms and applications [C]//Proe of the 14th Annual ACM-SIAM Symposium on Discrete Algorithms. 2003:413.
  • 7MARON M E, KUHNS J L. On relevance, probabilistic indexing and information retrieval [ J ]. Journal of the ACM, 1960,7 ( 3 ) : 216- 244.
  • 8MURTHY S K. Automatic construction of decision trees from data: a multi-disciplinary survey [ J ]. Data Mining and Knowledge Discovery, 1998,2 (4) : 345- 389.
  • 9CARUANA R,NICULESCU-MIZIL A. An empirical comparison of supervised learning algorithms [ C ]//Proc of the 23rd International Conference on Machine Learning. 2006 : 161-168.
  • 10DOMINGOS P, HULTEN G. Mining high-speed data streams[ C ]// Proc of Conference on Knowledge Discovery and Data Mining. New York : ACM Press,2000:71 - 80.

共引文献492

同被引文献13

引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部