-
题名大数据并行计算框架
被引量:6
- 1
-
-
作者
陈国良
毛睿
陆克中
-
机构
深圳大学计算机与软件学院
广东省普及型高性能计算机重点实验室
深圳市服务计算与应用重点实验室
-
出处
《科学通报》
EI
CAS
CSCD
北大核心
2015年第5期566-569,共4页
-
基金
国家高技术研究发展计划(2012AA01A309)
国家自然科学基金委-广东联合基金(U1301252)
+5 种基金
国家自然科学基金(61170076
61471243)
广东省重点实验室建设项目(2012A061400024)
深圳市科技计划项目(JCYJ20120613155632545
SGLH20131010163759789
JCYJ2014 0418095735561)资助
-
文摘
大数据是当前IT信息技术研究和应用的热点,但目前的研究多集中在系统和应用层面,而理论基础研究方面相对较少.本文以计算复杂性理论为基础,针对大数据量大、快速和多样性等挑战,着重研究大数据的可计算性及其计算原理.首先将多种类型的大数据抽象到度量空间进行统一化表示以解决多样性问题,其次在度量空间中基于距离对大数据进行划分,最后运用NC类计算理论等并行计算理论和方法对大数据问题进行并行求解,以解决量大和快速等问题.本文从更广的视角,根据大数据的特性和大数据整个生命周期,提出处理大数据的策略和技术以及需要变革思维方法研究大数据.
-
关键词
nc类计算
度量空间
数据划分
可计算性
-
Keywords
nc-class computation, metric space, data partitioning, computability
-
分类号
O246
[理学—计算数学]
-