检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到9篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

一种Spark集群下的shuffle优化机制被引量：2: 1; 作者熊安萍夏玉冲杨方方《计算机工程与应用》 CSCD 北大核心 2018年第4期72-76,共5页; Spark是基于内存的分布式数据处理框架,其shuffle过程中大量数据需要通过网络传输,已成为Spark最主要的瓶颈之一。针对shuffle过程中存在的数据分布不均造成不同节点网络I/O负载不均的问题,设计了基于task本地性等级的重启策略,进一步... 展开更多; 关键词 spark集群 shuffle过程数据传输本地性调度策略; 下载PDF 职称材料

Spark集群实现统计文档单词频次实例被引量：1: 2; 作者郑海鹏《电脑知识与技术》 2020年第23期33-34,共2页; 随着计算机数据分析、数据处理技术的不断发展和完善,大数据技术在社会中的实际应用场景越来越广泛,我们的生活正处在大数据时代。例如,众多电商平台利用大数据技术实现了电商用户的数据画像。依据客户的需求导向,对客户的商品需求进行... 展开更多; 关键词大数据 spark集群分布式文件系统单词次数统计; 下载PDF 职称材料

Spark集群中还贷问题的逻辑回归模型研究: 3; 作者刘黎志彭贝《武汉工程大学学报》 CAS 2020年第1期113-118,共6页; 在Spark集群环境下,通过Sparklyr调用MLib中的并行逻辑回归算法对大规模抵押贷款数据的训练集进行监督学习,使用R语言建立一个预测客户是否会如期归还贷款的逻辑回归分类模型。为了研究该模型的可信性以及获取效率,本文补充了伪判定系... 展开更多; 关键词 spark集群逻辑回归 R语言大数据; 下载PDF 职称材料

Spark集群下基于关联规则的产品加工质量分析: 4; 作者李卓航荀亚玲 +1 位作者薛晓鹏李元庆《太原科技大学学报》 2021年第3期194-199,共6页; 工业大数据的有效应用成为支撑企业转型升级的强力引擎。利用关联规则可以从海量产品加工过程质量数据中发掘加工工序质量参数之间的隐含相关性,如果能对具有相关性的上游质量指标进行及时有效的监控和调整,将有效地减少质量指标之间的... 展开更多; 关键词关联规则质量控制工业大数据 spark集群; 下载PDF 职称材料

基于Docker搭建Spark大数据集群数据挖掘平台被引量：3: 5; 作者蔡全福《信息技术与信息化》 2022年第9期70-73,共4页; 搭建大数据集群采用虚拟机部署的传统方法存在效率低、搭建步骤繁琐、时间成本高等问题,无法满足应用需求。随着虚拟化技术的发展,Docker技术由于具有占用资源小、启动速度快、部署快捷等优势,Docker技术能有效解决传统方法存在的问题,... 展开更多; 关键词虚拟化技术 DOCKER spark大数据集群数据挖掘 Kubernetes; 下载PDF 职称材料

基于Spark的并行分布式过程挖掘算法被引量：7: 6; 作者胡小强吴翾 +1 位作者闻立杰王建民《计算机集成制造系统》 EI CSCD 北大核心 2019年第4期791-797,共7页; 针对传统的过程发现算法对大规模事件日志挖掘效率低的问题,提出一种利用Spark集群进行加速过程挖掘的方法。该方法主要针对基于日志活动关系的过程挖掘算法,对抽取活动关系阶段进行加速。通过并行分布式抽取活动关系,将事件日志转化为... 展开更多; 关键词过程挖掘算法 spark集群大数据并行分布式化; 下载PDF 职称材料

基于Spark的转录组大数据并行处理方法被引量：2: 7; 作者于建涛刘圣东 +7 位作者赖灵伟吕同轩王嘉浩高小雨惠毅翔侯君瑶殷童郭茂祖《计算机应用研究》 CSCD 北大核心 2020年第S02期176-180,共5页; 转录组大数据RNA-seq是考察基因表达、研究生命规律的重要来源。分析转录组的序列比对软件TopHat及统计分析软件Cufflinks常见于在单机上以串行方式运行,或者基于分布式计算框架MapReduce在Hadoop集群上以并行方式运行,尚未见其部署于Sp... 展开更多; 关键词 spark集群并行处理转录组序列比对差异表达; 下载PDF 职称材料

基于国产处理器增量式实时交通流预测算法及实现: 8; 作者季一木杨启凡 +4 位作者李奎尤帅邵思思刘强刘尚东《计算机应用研究》 CSCD 北大核心 2021年第5期1468-1471,共4页; 针对城市交通难以处理大量数据且实时性差等问题,提出了根据增量式城市交通流数据预测拥堵情况的一种基于国产处理器的L-BFGS(limited-memory BFGS)算法。该算法通过存储向量序列计算Hessian矩阵,改进Two-Loop算法求下降方向,在Spark集... 展开更多; 关键词国产处理器增量式城市交通流数据 spark集群 L-BFGS算法交通流预测; 下载PDF 职称材料

基于分布式计算的农机运营效率分析被引量：2: 9; 作者赵国发刘卉 +2 位作者肖敬陈竞平孟志军《农机化研究》北大核心 2020年第1期53-57,64,共6页; 为适应深松整地作业的监管需求,国家农业智能装备工程技术研究中心研制了农机深松作业监管服务系统。针对海量的农机运动轨迹数据,搭建了基于Spark技术的分布式集群轨迹处理试验平台,研究了基于分布式计算的农机运营数据分析方法。针对... 展开更多; 关键词农机运营效率 GNSS轨迹数据挖掘分布式计算 spark集群; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部