期刊文献+
共找到37篇文章
< 1 2 >
每页显示 20 50 100
超大规模数据处理中并行计算技术的应用研究
1
作者 杨多海 《科技创新与应用》 2024年第17期181-184,共4页
随着人工智能和大数据时代的到来,超大规模数据处理成了一个重要的研究领域。该文主要探讨并行计算技术在超大规模数据处理中的应用,首先详细阐述并行计算和超大规模数据处理的基本理论与概念,特别是并行计算的编程模型与工具,最后通过... 随着人工智能和大数据时代的到来,超大规模数据处理成了一个重要的研究领域。该文主要探讨并行计算技术在超大规模数据处理中的应用,首先详细阐述并行计算和超大规模数据处理的基本理论与概念,特别是并行计算的编程模型与工具,最后通过分析并行计算在搜索引擎、气象预报和金融分析等中的实际案例,阐述并行计算技术在超大规模数据处理中的实际应用。 展开更多
关键词 并行计算技术 大规模数据处理 编程模型与工具 实际案例 具体应用
下载PDF
基于量子计算的输变电系统大规模数据处理与智能决策研究
2
作者 朱锴杰 闵景业 施磊 《电气技术与经济》 2024年第9期328-330,共3页
随着电力系统发展,输变电系统的数据处理与决策日益复杂,传统方法难以满足需求。因此,本研究引入量子计算,利用其强大的并行计算能力和高效优化算法,应对大规模数据处理挑战。针对输变电特点,提出基于量子计算的智能决策方法。该方法能... 随着电力系统发展,输变电系统的数据处理与决策日益复杂,传统方法难以满足需求。因此,本研究引入量子计算,利用其强大的并行计算能力和高效优化算法,应对大规模数据处理挑战。针对输变电特点,提出基于量子计算的智能决策方法。该方法能高效处理海量数据,准确识别系统故,并提供优化决策方案。此外,文章还探讨了量子计算在电力系统负荷预测、电网规划等领域的应潜力。实验结果表明,量子计算在处理输变电大规模数据时优势明显,能提高数据处理的准确性和效率,为电力系统的稳定运行和智能化管理提供支持,为输变电大规模数据处理与智能决策提供新的解决方案,奠定了量子计算在电力系统中的应用基础。 展开更多
关键词 量子计算 输变电系统 大规模数据处理 智能决策 并行计算
下载PDF
基于云计算的大规模数据处理算法优化分析
3
作者 沈毅 《集成电路应用》 2024年第6期116-117,共2页
阐述提升数据算法运行速度的策略,介绍基于云计算技术的大规模数据处理算法,包括数据处理算法分类、大规模数据处理算法特点。针对云计算环境下数据处理挑战,提出算法优化方案。
关键词 云计算 大规模数据处理 算法优化 数据处理效率
下载PDF
面向边缘计算的高效大规模数据处理与存储方案研究
4
作者 曾昭健 谢彦南 《中国科技期刊数据库 工业A》 2023年第8期13-16,共4页
本文针对面向边缘计算的大规模数据处理与存储问题,提出了一种高效的架构设计方案。首先,分析了边缘计算环境下的数据处理需求,然后设计了满足这些需求的数据处理架构,并进行了优化。接着,研究了边缘存储技术与方案,包括特点、挑战以及... 本文针对面向边缘计算的大规模数据处理与存储问题,提出了一种高效的架构设计方案。首先,分析了边缘计算环境下的数据处理需求,然后设计了满足这些需求的数据处理架构,并进行了优化。接着,研究了边缘存储技术与方案,包括特点、挑战以及面向边缘计算的大规模数据存储方案。最后,提出了边缘计算数据处理与存储性能优化的方法。旨在探索面向边缘计算的高效大规模数据处理与存储方案,以解决在边缘计算环境下处理和存储大量数据所面临的挑战。 展开更多
关键词 边缘计算 大规模数据处理 存储
下载PDF
云计算环境下大规模数据处理技术的研究
5
作者 马玲玲 《移动信息》 2023年第6期253-255,258,共4页
随着技术的发展,云计算技术越来越多地被运用到了各个领域。在大规模数据处理技术中引入云计算技术,能够有效推进大规模计算平台的构建,并建立起具有动态变化、可扩展性和高性价比的系统,从而形成一个以云计算环境为基础的大规模数据处... 随着技术的发展,云计算技术越来越多地被运用到了各个领域。在大规模数据处理技术中引入云计算技术,能够有效推进大规模计算平台的构建,并建立起具有动态变化、可扩展性和高性价比的系统,从而形成一个以云计算环境为基础的大规模数据处理与分析系统的结构实体建模。文中论述了在这种情况下,如何进行大规模的数据处理,并建立了相应的计算机平台,最终验证了计算机体系结构的可行性。 展开更多
关键词 云计算环境 大规模数据处理技术 研究
下载PDF
云计算模型在铁路大规模数据处理中的应用 被引量:22
6
作者 刘真 刘峰 +2 位作者 张宝鹏 马飞 高石玉 《北京交通大学学报》 CAS CSCD 北大核心 2010年第5期14-19,共6页
对铁路行业的计算资源、数据处理进行了特征分析.探讨了云计算模型中的虚拟化技术在铁路计算资源整合及MapReduce编程模型在大规模数据处理中的应用模式.采用Hadoop开源平台和Intel的虚拟化管理平台Tashi,提出和实现了基于云计算技术的... 对铁路行业的计算资源、数据处理进行了特征分析.探讨了云计算模型中的虚拟化技术在铁路计算资源整合及MapReduce编程模型在大规模数据处理中的应用模式.采用Hadoop开源平台和Intel的虚拟化管理平台Tashi,提出和实现了基于云计算技术的铁路数据处理框架模型,并通过大规模的货票数据处理实例验证了框架模型的可扩展性和高效性. 展开更多
关键词 云计算 虚拟化 MAPREDUCE 大规模数据处理
下载PDF
国内外云计算大规模数据处理课程比较研究 被引量:1
7
作者 胡艳丽 赵翔 唐九阳 《科教文汇》 2014年第31期1-2,共2页
本文对国内外知名大学和研究机构开设的云计算/大规模数据处理课程进行比较研究,从授课内容、授课形式等方面深入分析了Google 101计划、华盛顿大学、斯坦福大学以及清华大学、北京大学等相关课程的建设情况,为探索如何培养学生的大数... 本文对国内外知名大学和研究机构开设的云计算/大规模数据处理课程进行比较研究,从授课内容、授课形式等方面深入分析了Google 101计划、华盛顿大学、斯坦福大学以及清华大学、北京大学等相关课程的建设情况,为探索如何培养学生的大数据并行处理和实践能力提供参考和借鉴。 展开更多
关键词 云计算 大规模数据处理 课程建设 比较研究
下载PDF
针对高速数据流的大规模数据实时处理方法 被引量:95
8
作者 亓开元 赵卓峰 +1 位作者 房俊 马强 《计算机学报》 EI CSCD 北大核心 2012年第3期477-490,共14页
以实时传感数据和历史感知数据为基础的各类计算需求逐渐成为当前物联网应用建设中的关键,如何实现基于高速数据流和大规模历史数据的实时计算成为数据处理领域的新挑战.现有批处理方式的MapReduce大规模数据处理技术难以满足此类计算... 以实时传感数据和历史感知数据为基础的各类计算需求逐渐成为当前物联网应用建设中的关键,如何实现基于高速数据流和大规模历史数据的实时计算成为数据处理领域的新挑战.现有批处理方式的MapReduce大规模数据处理技术难以满足此类计算的实时要求.文中结合城市车辆数据的实时采集与处理应用,在理论和实践分析的基础上,提出了一种针对高速数据流的大规模数据实时处理方法,并对方法中的本地阶段化流水线、中间结果缓存等关键技术瓶颈进行了改进.其中,根据系统参数控制阶段化流水线,使CPU得到了充分、有效利用;通过改造内外存数据结构、读写策略和替换算法,优化了本地中间结果的高并发读写性能.实验表明,上述方法可以显著提升大规模历史数据上数据流处理的实时性和可伸缩性. 展开更多
关键词 数据处理 大规模数据处理 MAPREDUCE 物联网 数据 云计算
下载PDF
面向大规模感知数据的实时数据流处理方法及关键技术 被引量:9
9
作者 亓开元 韩燕波 +1 位作者 赵卓峰 马强 《计算机集成制造系统》 EI CSCD 北大核心 2013年第3期641-653,共13页
为了在大规模历史感知数据基础上实现针对高速传感数据流的实时计算,提出一种面向大规模历史数据的数据流处理方法RTMR,通过中间结果缓存、流水化和本地化改进了MapReduce的数据流处理能力。在此基础上,为了适应性地构造RTMR集群,利用... 为了在大规模历史感知数据基础上实现针对高速传感数据流的实时计算,提出一种面向大规模历史数据的数据流处理方法RTMR,通过中间结果缓存、流水化和本地化改进了MapReduce的数据流处理能力。在此基础上,为了适应性地构造RTMR集群,利用模型分析方法根据应用特征和集群环境配置节点类型和拓扑结构。为实现集群的负载均衡,通过计算负载状态转换关系分组空闲节点和过载节点,将NP难的动态负载均衡问题快速分解为规模较小的子问题,并且综合执行时间和数据移动代价作为子问题的优化目标,提高应对负载倾斜的反应速度。实验表明,上述方法和技术能够保障大规模历史数据上数据流处理的可伸缩性。 展开更多
关键词 数据处理 大规模数据处理 MapReduce方法 适应性架构 负载均衡
下载PDF
云计算环境下的大规模图状数据处理任务调度算法 被引量:16
10
作者 李健 黄庆佳 +1 位作者 刘一阳 苏森 《西安交通大学学报》 EI CAS CSCD 北大核心 2012年第12期116-122,共7页
针对云计算环境下调度算法必须考虑资源租赁成本的问题,提出一种新的基于粒子群优化的大规模图状数据处理任务调度算法(LGPPSO).首先,该算法将图状数据处理任务调度方案编码为粒子群中粒子的位置,并利用任务的调度长度和资源租赁成本建... 针对云计算环境下调度算法必须考虑资源租赁成本的问题,提出一种新的基于粒子群优化的大规模图状数据处理任务调度算法(LGPPSO).首先,该算法将图状数据处理任务调度方案编码为粒子群中粒子的位置,并利用任务的调度长度和资源租赁成本建立适应度函数来评价当前粒子的优劣程度,然后重新定义粒子群的参数和相关操作,最后在算法的每一次迭代过程中,粒子不断更新自身的速度和位置,以获得任务调度的近似最优解.模拟实验结果表明:在仅以调度长度为目标时,LGPPSO算法的调度长度比异构最早完成时间任务调度算法(HEFT)平均降低约12.3%;在以调度长度和资源租赁成本为目标时,与成本感知任务调度算法(CCSH)相比,在资源租赁成本基本一致的情况下,LGPPSO算法的调度长度平均降低约9.97%. 展开更多
关键词 大规模图状数据处理 调度算法 粒子群优化 云计算
下载PDF
Apache Flink流式计算模型在数据处理中的应用与性能优化研究
11
作者 徐海霞 《电脑知识与技术》 2024年第7期71-73,共3页
文章旨在研究Apache Flink流式计算模型在数据处理中的应用与性能优化。先从可扩展性、容错性和数据并行处理能力三个方面对Apache Flink流式计算框架技术特点进行论述,再对Apache Flink流式计算框架核心思想与工作流程进行研究,并提出... 文章旨在研究Apache Flink流式计算模型在数据处理中的应用与性能优化。先从可扩展性、容错性和数据并行处理能力三个方面对Apache Flink流式计算框架技术特点进行论述,再对Apache Flink流式计算框架核心思想与工作流程进行研究,并提出一套执行数据处理任务的Java源码,再从并行计算、数据存储和传输、算法参数、系统配置、资源管理与调度、检查点和容错机制、编码和序列化等方面就如何进行Apache Flink性能优化进行分析,最后通过实验手段就优化性能进行分析。实验结果表明,优化后的平均响应时间显著减少,吞吐量相应增加,调整并行度和内存分配等参数可显著提升系统性能,但还需要考虑任务调度和资源分配等方面的综合因素,因此,Apache Flink流式计算框架调优策略具有一定的应用价值。 展开更多
关键词 流式计算 Apache Flink 大规模数据处理 性能优化 并行计算
下载PDF
面向大规模地震数据并行处理高速可扩展通信技术应用研究 被引量:1
12
作者 包红林 李敏 +1 位作者 邵志东 张代兰 《石油物探》 CSCD 北大核心 2022年第5期793-800,共8页
随着地震数据规模的不断增大,在进行数据并行处理时,并行计算通信框架因使用TCP(Transmission Control Protocol)协议存在网络吞吐量低、高时延等性能问题,以及主从并行模式下存在主节点网卡性能瓶颈问题,制约了数据并行处理效率的线性... 随着地震数据规模的不断增大,在进行数据并行处理时,并行计算通信框架因使用TCP(Transmission Control Protocol)协议存在网络吞吐量低、高时延等性能问题,以及主从并行模式下存在主节点网卡性能瓶颈问题,制约了数据并行处理效率的线性提升,集群节点规模扩展性下降明显。为此,提出采用RoCE(RDMA over Converged Ethernet)协议替换TCP协议、主节点配置高性能100 GE网卡的高效并行计算通信优化方案,解决了并行计算框架存在的数据网络传输性能问题及主节点同时收集多个计算节点计算结果数据的网络性能瓶颈问题,实现了高速可扩展技术的大规模地震数据处理通信应用方案,计算节点可快速完成数据通信,提升了大规模地震数据处理计算效率;另外采用UCX(Unified Communication X)技术还提升了应用系统的可移植性与使用的便捷性。逆时偏移处理数据的测试结果表明,对于本次大规模数据的处理,逆时偏移并行计算效率提升了32.8%,效果显著,可缩短大规模地震数据逆时偏移计算的时间,并减少计算能源消耗,因此具有很高的实用价值和经济效益。 展开更多
关键词 大规模地震数据处理 逆时偏移处理 并行计算 MPI 通信框架 计算效率 RoCE 100 GE网卡
下载PDF
云计算环境下的大数据存储与处理优化策略分析 被引量:1
13
作者 顾春山 《中国信息界》 2024年第2期60-62,共3页
引言.随着大数据时代的到来,大数据存储与处理已经成为众多企业和机构面临的重要挑战。在云计算环境下,大数据存储与处理优化策略变得尤为关键,因为云计算提供了弹性扩展、灵活性和高性能计算等优势,可以帮助用户更好地应对大规模数据... 引言.随着大数据时代的到来,大数据存储与处理已经成为众多企业和机构面临的重要挑战。在云计算环境下,大数据存储与处理优化策略变得尤为关键,因为云计算提供了弹性扩展、灵活性和高性能计算等优势,可以帮助用户更好地应对大规模数据处理的需求。本文将从数据备份与容灾、存储资源管理、数据处理流程优化、并行计算与任务调度以及数据压缩与加速处理等方面进行深入分析,探讨在云计算环境下优化大数据存储与处理的举措,提高工作效率和数据处理速度。 展开更多
关键词 数据存储 大规模数据处理 数据处理速度 高性能计算 数据压缩 任务调度 云计算 并行计算
下载PDF
人工智能助力化工高校数据的处理与分析
14
作者 王兆文 高浩 王继民 《塑料工业》 CAS CSCD 北大核心 2024年第7期206-206,共1页
化工数据通常涵盖实验数据、生产过程数据以及设备监控数据等,由于其庞大和复杂的特性,对数据存储和管理系统提出了更高的要求;有效地处理这些数据,不仅需要强大的技术支撑来应对大规模数据处理的挑战,还需要精确的数据清洗和预处理技... 化工数据通常涵盖实验数据、生产过程数据以及设备监控数据等,由于其庞大和复杂的特性,对数据存储和管理系统提出了更高的要求;有效地处理这些数据,不仅需要强大的技术支撑来应对大规模数据处理的挑战,还需要精确的数据清洗和预处理技术以消除错误、缺失值或数据不一致性,保障数据分析的准确性;同时,化工领域数据来源多样,包括实验室仪器、工业传感器及手工记录等,不同来源的数据格式和标准的不一致性,进一步增加了数据处理的复杂度。 展开更多
关键词 大规模数据处理 数据清洗 人工智能 手工记录 缺失值 管理系统 数据存储 数据格式
下载PDF
大规模网络数据存储系统的设计与实现
15
作者 李荣利 《现代电子技术》 北大核心 2017年第2期118-121,124,共5页
当前的网络数据存储系统在处理大规模数据时需要较长时间,增加了网络数据存储周期,存储性能较差。因此设计并实现一种大规模网络数据存储系统,该系统主要包括A/D高速采集模块、FLASH存储模块和FPGA数据接收模块。A/D高速采集模块采集大... 当前的网络数据存储系统在处理大规模数据时需要较长时间,增加了网络数据存储周期,存储性能较差。因此设计并实现一种大规模网络数据存储系统,该系统主要包括A/D高速采集模块、FLASH存储模块和FPGA数据接收模块。A/D高速采集模块采集大规模网络数据,采用FPGA数据接收模块对采集到的网络数据进行接收和处理,过滤其中的噪声因素,再将处理好的网络数据保存在FLASH存储模块中。依据三层架构模式设计大规模网络数据存储系统软件架构,并给出了业务逻辑层完成数据传递的关键代码。实验结果表明,所设计的大规模网络数据存储系统具有较高的数据存储和读取速度,能够实现网络数据的负载均衡存储。 展开更多
关键词 A/D高速采集 FPGA 网络数据存储 大规模数据处理
下载PDF
大规模核素扩散数据可视化方法研究与应用 被引量:2
16
作者 贾亚宁 郑晓磊 +2 位作者 陈春花 何桃 龙鹏程 《辐射研究与辐射工艺学报》 CAS CSCD 2018年第5期52-58,共7页
在核应急响应期间,利用可视化手段直观展示大规模核素扩散数据的空间分布,有助于应急指挥人员快速有效地进行科学决策与指挥。本文基于科学计算可视化技术,选用改进的八叉树模型对扩散数据建立空间索引,并根据操作干预水平提取数据水平... 在核应急响应期间,利用可视化手段直观展示大规模核素扩散数据的空间分布,有助于应急指挥人员快速有效地进行科学决策与指挥。本文基于科学计算可视化技术,选用改进的八叉树模型对扩散数据建立空间索引,并根据操作干预水平提取数据水平时空切片,完成了大规模核素扩散数据的可视化。以日本福岛核事故为例,对其大规模核素扩散数据进行分层可视化,直观显示了放射性核素在不同高度的空间分布状态,表明本文方法可为核应急快速响应与决策提供技术支持。 展开更多
关键词 大规模数据处理 核素扩散 可视化 核事故应急
下载PDF
基于MapReduce的SPDK大规模数据高效研究
17
作者 张学智 李维帅 +2 位作者 张宏志 田升 王海峰 《电脑编程技巧与维护》 2019年第10期78-79,90,共3页
在当今大数据时代,计算机处理数据的要求也随之增加。当待处理数据的容量大于计算机内存容量之时,常常需要内存与外存进行数据之间的置换过程。在数据置换过程中,涉及大量的I/O读写操作,数据处理算法的效率较低。Intel公司发行用于加速... 在当今大数据时代,计算机处理数据的要求也随之增加。当待处理数据的容量大于计算机内存容量之时,常常需要内存与外存进行数据之间的置换过程。在数据置换过程中,涉及大量的I/O读写操作,数据处理算法的效率较低。Intel公司发行用于加速SSD的应用软件加速库SPDK能够很大程度上减少NVMe I/O Command的延迟,从根本上提高I/O读写的性能。 展开更多
关键词 MapReduce技术 SPDK框架 大规模数据处理 I/O处理
下载PDF
5G+大数据南昌县武阳镇杜鹃花产业基地物联网水肥一体化项目
18
作者 《江西农业》 2024年第17期36-36,共1页
荣获第六届“绽放杯”5G应用征集大赛江西区域赛5G+智慧农业行业赛三等奖。●项目内容。该项目是基于智能传感器、无线传输技术、大规模数据处理与远程控制等物联网核心技术进行开发,面向农业大棚,满足水肥灌溉集约、高产、高效、生态... 荣获第六届“绽放杯”5G应用征集大赛江西区域赛5G+智慧农业行业赛三等奖。●项目内容。该项目是基于智能传感器、无线传输技术、大规模数据处理与远程控制等物联网核心技术进行开发,面向农业大棚,满足水肥灌溉集约、高产、高效、生态、安全的发展需求,集土壤及环境参数在线采集、远程控制、无线传输、数据处理、预警信息发布、决策支持、一体化控制等功能于一身的现代农业物联网系统。 展开更多
关键词 大规模数据处理 智能传感器 远程控制 数据 物联网 无线传输技术 水肥一体化 农业大棚
下载PDF
支持高并发数据流处理的MapReduce中间结果缓存 被引量:21
19
作者 亓开元 韩燕波 +1 位作者 赵卓峰 房俊 《计算机研究与发展》 EI CSCD 北大核心 2013年第1期111-121,共11页
针对面向大规模历史数据的高并发数据流处理需求,为改进MapReduce的实时处理能力,提出了一种内存Hash B树、外存SSTable文件的key/value中间结果缓存,该结构具有可划分性、可扩展性和高效性.在此基础上,利用B树的平衡性特征提出了一种... 针对面向大规模历史数据的高并发数据流处理需求,为改进MapReduce的实时处理能力,提出了一种内存Hash B树、外存SSTable文件的key/value中间结果缓存,该结构具有可划分性、可扩展性和高效性.在此基础上,利用B树的平衡性特征提出了一种基于概率的B树构造算法和多路查询算法,利用读写开销估算和缓冲区信息改造了外存文件读写策略和内外存替换算法,进一步优化了中间结果的高并发读写性能.算法分析和实验证明了该缓存的有效性. 展开更多
关键词 高并发 大规模数据处理 数据处理 MAPREDUCE 中间结果缓存
下载PDF
一种大规模空间数据流式并行处理方法研究 被引量:9
20
作者 刘纪平 吴立新 +2 位作者 董春 张福浩 亢晓琛 《测绘科学》 CSCD 北大核心 2016年第1期89-93,75,共6页
针对空间数据的读写(I/O)时间占比过高问题,文章提出一种流式并行化方法:通过将空间计算过程与数据I/O过程相重叠,使传统并行空间计算方法中的性能提升瓶颈得到显著缓解;并且,方法所采用的数据分片策略,能够使数据单次I/O所产生的高内... 针对空间数据的读写(I/O)时间占比过高问题,文章提出一种流式并行化方法:通过将空间计算过程与数据I/O过程相重叠,使传统并行空间计算方法中的性能提升瓶颈得到显著缓解;并且,方法所采用的数据分片策略,能够使数据单次I/O所产生的高内存使用率得到降低,进一步提高了具体地学算法的适用性。最后以地理国情普查基本统计分析中地表面积计算为例进行验证,结果表明:该算法的计算效率与内存使用率相对于直接并行方法均获得明显改善,且空间数据流式并行处理方法与具体地学算法耦合度低。该方法已成功应用于多个其他统计分析算法中。 展开更多
关键词 流式并行方法 大规模空间数据处理 空间计算 I/O过程 地表面积
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部