期刊文献+

大数据近似分析方法综述

A review of big data approximate analytics
下载PDF
导出
摘要 大数据分析旨在从大量复杂的数据中获取价值。查询驱动的数据分析是大数据分析中最主要的部分。由于数据量的庞大,在大数据上获取准确的分析结果将带来极大的存储和计算代价。为解决这一困难,大数据近似分析方法应运而生。本文将主要针对大数据近似分析中的频率估计问题、近似查询处理问题、查询选择性估计问题近十年的解决方法进行总结和归纳。不同于以往以数据库为主视角的分析方法的总结,本文中将涵盖近几年应用或结合机器学习方法来处理上述问题的新方法。 Big data analytics aims to obtain value from a large amount of complex data.Query-driven data analytics is the most important part of big data analytics.Due to the huge amount of data,obtaining accurate analysis results on big data will bring great storage and calculation costs.To solve this problem,big data approximate analysis methods came into being.This article mainly summarizes the frequency estimation methods,approximate query processing methods,and query selectivity estimation methods in big data analytics in the past ten years.Different from the previous summary of analysis methods based on the database perspective only,this article will cover the new methods of applying or combining machine learning methods to deal with the above problems in recent years.
作者 张美范 王宏志 ZHANG Meifan;WANG Hongzhi(School of Computer Science and Technology,Harbin Institute of Technology,Harbin 150001,China)
出处 《智能计算机与应用》 2021年第3期61-65,69,共6页 Intelligent Computer and Applications
基金 国家重点研发计划(2018YFB1004700) 国家自然科学基金(U1866602,61602129,61772157)
关键词 大数据分析 频率估计 近似查询处理 查询选择性估计 big data analysis frequency estimation approximate query processing query selectivity estimation
  • 相关文献

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部