期刊文献+
共找到3,806篇文章
< 1 2 191 >
每页显示 20 50 100
基于Hadoop/Hive的乳制品溯源数据计算及性能优化 被引量:4
1
作者 朱淑鑫 李悦 +3 位作者 袁培森 徐焕良 王康 谢忠红 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2018年第4期99-108,共10页
为了提升传统乳制品溯源系统应对大规模企业生产数据的性能,本文分析了乳制品相关企业供应链业务流程、关键溯源单元和溯源信息,结合Hadoop/Hive大数据技术和分布式数据库技术,设计并构建了基于Hadoop/Hive的乳制品溯源框架.搭建模拟大... 为了提升传统乳制品溯源系统应对大规模企业生产数据的性能,本文分析了乳制品相关企业供应链业务流程、关键溯源单元和溯源信息,结合Hadoop/Hive大数据技术和分布式数据库技术,设计并构建了基于Hadoop/Hive的乳制品溯源框架.搭建模拟大数据环境并使用实际生产数据对系统性能进行测试,实验结果表明,引入Hadoop/Hive技术后,系统的平均数据存储速度、平均数据访问速度、平均数据交互速度分别提升了87.43%、27.10%、58.16%.改进后的乳制品溯源系统存储和处理大规模数据的能力明显优于传统的乳制品溯源系统. 展开更多
关键词 hadoop/hive 乳制品溯源 数据计算 性能优化
下载PDF
基于Hadoop/Hive的web日志分析系统的设计 被引量:24
2
作者 刘永增 张晓景 李先毅 《广西大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第A01期314-317,共4页
互联网技术的迅速发展,使得web承载的信息量呈现出爆炸式增长的趋势,因此web日志的数据量也越来愈大。如何存储、处理大规模数据就成了新的挑战。云计算技术的出现,为这类问题的解决提供了一种思路。云计算将数据通过网络分布到集群的... 互联网技术的迅速发展,使得web承载的信息量呈现出爆炸式增长的趋势,因此web日志的数据量也越来愈大。如何存储、处理大规模数据就成了新的挑战。云计算技术的出现,为这类问题的解决提供了一种思路。云计算将数据通过网络分布到集群的各个计算节点上,从而完成大规模数据的存储和运算。Hadoop是一个用于构建云计算平台的流行的开源框架,广泛应用于海量数据的处理。但利用Hadoop处理数据,用户必须自己开发Map/Reduce程序。这种程序处于比较低的层次,用户不容易掌握,而且难于维护。Hive是一个基于Hadoop的开源数据仓库工具,它能够将文件映射成数据表,并提供类SQL语句,简化了用户的开发。利用Hadoop、Hive设计了一个用于处理web日志分析的系统,既充分利用了Hadoop的海量数据处理的能力,又降低了开发的难度。通过与单机实验的对比,证明系统是有效的和有价值的。 展开更多
关键词 WEB日志 云计算 hadoop hive
下载PDF
基于Hadoop/Hive的气象数据分布式处理研究 被引量:7
3
作者 陈效杰 张金泉 《软件导刊》 2015年第8期11-13,共3页
分布全球的气象传感器每隔一段时间就会收集大量的气象数据,历史气象数据更为庞大,如何存储和处理这些数据已成为一个难题。Hadoop的出现给人们提供了存储和分析大数据的一个利器,它利用HDFS分布式文件系统进行大数据存储,用户通过编写M... 分布全球的气象传感器每隔一段时间就会收集大量的气象数据,历史气象数据更为庞大,如何存储和处理这些数据已成为一个难题。Hadoop的出现给人们提供了存储和分析大数据的一个利器,它利用HDFS分布式文件系统进行大数据存储,用户通过编写MapReduce程序完成大数据的分析处理。然而,对于很多用户而言,熟练掌握Java语言并编写MapReduce程序并不容易。鉴于此,利用Hive来存储和处理气象数据集。Hive是构建在Hadoop上的数据仓库框架,它支持SQL接口,可以让精通SQL技能的分析师对存放在HDFS中的大规模数据集进行查询分析。 展开更多
关键词 大数据 hadoop HDFS hive
下载PDF
模块化教学模式探析--以“Hadoop大数据处理”课程模块化教学设计为例 被引量:2
4
作者 李美 《牡丹江大学学报》 2024年第3期82-86,108,共6页
课程模块化教学是对课程内容的重组以及整合,利用教学平台,引入企业项目案例资源,把传统的教学模式转变为以学生为主体、教师为主导的模式。本文以高等职业院校“Hadoop大数据处理”课程为例,采用模块化教学模式以适应大数据专业的工作... 课程模块化教学是对课程内容的重组以及整合,利用教学平台,引入企业项目案例资源,把传统的教学模式转变为以学生为主体、教师为主导的模式。本文以高等职业院校“Hadoop大数据处理”课程为例,采用模块化教学模式以适应大数据专业的工作岗位,介绍了模块化教学模式的概念、国内外研究现状,进行了“Hadoop大数据处理”课程模块化设计,分别是教学主体转换、内容模块化设计、教师分工协作模块化设计、应用信息化教学平台。以“Hadoop大数据处理”课程中大数据计算分析模块中“微博精准广告营销”为例说明课程模块化教学设计的具体实施步骤和最终的教学效果。 展开更多
关键词 hadoop大数据处理” 课程模块化 模块化教学设计 模块化教学实施
下载PDF
基于Hadoop的高校教学质量评测系统构建与评估方法
5
作者 董明 牟云环 《微型电脑应用》 2024年第2期26-28,37,共4页
为了确保高校教学质量评估的客观性、系统性和全面性,提出利用大数据全面服务教育评估,并基于Hadoop构建评测系统,在Hadoop分布式架构基础上,提出利用分布式算法对高校教学质量各方面进行评估。评测系统主要从学校管理质量、教师教学过... 为了确保高校教学质量评估的客观性、系统性和全面性,提出利用大数据全面服务教育评估,并基于Hadoop构建评测系统,在Hadoop分布式架构基础上,提出利用分布式算法对高校教学质量各方面进行评估。评测系统主要从学校管理质量、教师教学过程、学生的学习行为以及学业质量等4个方面对高校教学质量进行评估,自下而上划分为数据访问层、业务逻辑层和表示层,各功能子系统均采用模块化设计;针对不同大数据的特点,提出利用主成分分析法对学校管理质量大数据进行评估,采用分布式算法对教师教学过程、学生学习行为和学业质量进行评估;当数据量较小时传统单机算法运行效率较高,当数据量较大(大数据样本)时分布式算法的运行时间明显少于单机算法,且随着数据量的增大,运行效率优势越明显。 展开更多
关键词 高校教学质量 评测系统 hadoop 大数据 分布式算法
下载PDF
基于Hadoop技术的教学数据存储研究
6
作者 李俊涛 《广州城市职业学院学报》 2024年第1期86-90,共5页
探讨了基于Hadoop技术的高校教学数据存储系统设计。该系统以Hadoop分布式文件系统(HDFS)和MapReduce框架为基础,实现了教学数据的高效存储、管理和分析。构建了“数据交互层”“核心处理层”和“数据存储层”三层结构。教学资源网结构... 探讨了基于Hadoop技术的高校教学数据存储系统设计。该系统以Hadoop分布式文件系统(HDFS)和MapReduce框架为基础,实现了教学数据的高效存储、管理和分析。构建了“数据交互层”“核心处理层”和“数据存储层”三层结构。教学资源网结构和数据库访问层支持多样化的数据类型和访问需求。同时,强调数据安全性与权限管理,以及实时处理与分析能力的重要性。通过这一设计,系统为高校提供了安全、高效、可靠的教学数据解决方案,支持教育的创新和发展。 展开更多
关键词 教学数据存储系统 hadoop技术 分布式存储 数据安全性
下载PDF
基于Hadoop的设施蔬菜产销大数据架构分析
7
作者 李敏 文燕 叶煜 《四川农业科技》 2024年第3期29-33,共5页
随着现代科技的发展,物联网、大数据的广泛普及与使用,百姓赖以生活与生存的设施蔬菜发展迅猛快速,从传统的“看天吃饭”到现代化的“四季不断”的转变,实现时不分冬夏、地不分南北的天时地利供应不断,提高了百姓的生活质量。在整个过程... 随着现代科技的发展,物联网、大数据的广泛普及与使用,百姓赖以生活与生存的设施蔬菜发展迅猛快速,从传统的“看天吃饭”到现代化的“四季不断”的转变,实现时不分冬夏、地不分南北的天时地利供应不断,提高了百姓的生活质量。在整个过程中,由于各环节产生数据量极大,种植销售分散,规模大小不一,分类也不统一,采集数据还不是很精准,有限数据利用率不高,造成统计数据还不够完善,数据分析存在偏差,甚至失误。文章主要从研究设施蔬菜的产销,利用传感器技术,从蔬菜分类、销售量等方面准确采集数据,并使用hadoop对数据进行分析。实现HDFS分布式存储、MapReduce实现数据处理过程到利用Hive数据仓库工具,对HDFS中存储的数据进行提取、查询、汇总,对设施蔬菜大数据产销进行架构分析,得到的结果反哺蔬菜种植源头,更好地指导种植生产销售,服务现代农业,服务万千百姓。 展开更多
关键词 设施蔬菜 hadoop 架构分析
下载PDF
基于Hadoop技术的加速器大数据安全存储与高效分析系统设计 被引量:2
8
作者 赵子晨 杨锋 +3 位作者 郭玉辉 陈又新 李钊扬 刘海涛 《现代电子技术》 北大核心 2024年第8期9-17,共9页
为了解决当前加速器控制系统在数据管理方面所面临的海量数据安全存储和高效分析处理的问题,在现有的基础上引入了Hadoop大数据框架,并结合大数据其他相关组件,构建一个分布式数据仓库系统。文章详细阐述了数据仓库的搭建过程,包括软硬... 为了解决当前加速器控制系统在数据管理方面所面临的海量数据安全存储和高效分析处理的问题,在现有的基础上引入了Hadoop大数据框架,并结合大数据其他相关组件,构建一个分布式数据仓库系统。文章详细阐述了数据仓库的搭建过程,包括软硬件架构以及将数据从现有数据库抽取、转换和加载到数据仓库的方案。特别是针对系统归档数据的存储和分析需求,根据实际应用场景设计一个基于HBase的存储解决方案。在系统部署完成后,进行了吞吐量测试,并与当前使用的传统数据库进行性能对比。测试结果显示,基于Hadoop的数据仓库系统在海量数据存储、高性能查询以及数据分析处理方面都表现出明显的优势。这一改进为加速器控制系统提供了更强大的数据管理和处理能力,有望为加速器在未来的发展提供更多可能性。 展开更多
关键词 数据仓库 hadoop技术 加速器 大数据 安全存储 HBASE ETL
下载PDF
基于Hadoop的智慧工作岗位分析大数据平台的设计与实现
9
作者 张书贵 《信息与电脑》 2024年第5期112-114,118,共4页
随着互联网的发展,网上招聘方式日益普及。但当求职者面对海量招聘信息,对不同维度的信息进行综合分析时会变得异常繁杂。鉴于此,文章设计了基于Hadoop的智慧工作岗位分析大数据平台,为用户提供岗位数据整合、归档、检索、浏览和分析挖... 随着互联网的发展,网上招聘方式日益普及。但当求职者面对海量招聘信息,对不同维度的信息进行综合分析时会变得异常繁杂。鉴于此,文章设计了基于Hadoop的智慧工作岗位分析大数据平台,为用户提供岗位数据整合、归档、检索、浏览和分析挖掘服务。该平台以大数据分析技术为核心,利用Python编程爬取Web页面数据,利用Flume对数据进行聚合和日志采集,采用Kafka对数据进行缓冲,使用Spark对实时数据进行计算,利用MapReduce对清洗后的数据进行运算,最后利用数据大屏对数据进行可视化展示。 展开更多
关键词 智慧 工作岗位 大数据 hadoop
下载PDF
基于Hadoop的离线电商数据分析系统的设计与实现 被引量:1
10
作者 潘杰恒 蔡群英 《现代计算机》 2024年第3期112-116,共5页
随着互联网的普及和人们不断增长的消费需求,电子商务平台已成为人们生活不可或缺的一部分,由此产生大量数据。基于Hadoop,设计并实现一个离线电商数据分析系统,从系统架构、数据采集、传输、存储、分析处理和可视化等方面作了介绍,系... 随着互联网的普及和人们不断增长的消费需求,电子商务平台已成为人们生活不可或缺的一部分,由此产生大量数据。基于Hadoop,设计并实现一个离线电商数据分析系统,从系统架构、数据采集、传输、存储、分析处理和可视化等方面作了介绍,系统具有一定的数据分析能力,能将原本无用的数据进行整理利用,发挥数据本身的价值。 展开更多
关键词 电商 离线 分析系统 大数据 hadoop hive FLUME Kafka
下载PDF
基于Hadoop的电商数据挖掘技术分析
11
作者 李梅 刘铭 黄彬彬 《中国新技术新产品》 2024年第6期126-129,共4页
本文对Hadoop的电商数据挖掘技术的研究过程、理论依据进行了探讨,并对其应用结果进行验证。分析结果表明,基于Hadoop的电商数据挖掘技术具有较大的优势,可以对数据进行高效处理和有效筛选,不仅能提高数据资源的有效利用率,还能提高工... 本文对Hadoop的电商数据挖掘技术的研究过程、理论依据进行了探讨,并对其应用结果进行验证。分析结果表明,基于Hadoop的电商数据挖掘技术具有较大的优势,可以对数据进行高效处理和有效筛选,不仅能提高数据资源的有效利用率,还能提高工作效率和工作质量,因此值得推广和应用。 展开更多
关键词 hadoop 电商数据 数据挖掘技术
下载PDF
Hadoop-based secure storage solution for big data in cloud computing environment 被引量:1
12
作者 Shaopeng Guan Conghui Zhang +1 位作者 Yilin Wang Wenqing Liu 《Digital Communications and Networks》 SCIE CSCD 2024年第1期227-236,共10页
In order to address the problems of the single encryption algorithm,such as low encryption efficiency and unreliable metadata for static data storage of big data platforms in the cloud computing environment,we propose... In order to address the problems of the single encryption algorithm,such as low encryption efficiency and unreliable metadata for static data storage of big data platforms in the cloud computing environment,we propose a Hadoop based big data secure storage scheme.Firstly,in order to disperse the NameNode service from a single server to multiple servers,we combine HDFS federation and HDFS high-availability mechanisms,and use the Zookeeper distributed coordination mechanism to coordinate each node to achieve dual-channel storage.Then,we improve the ECC encryption algorithm for the encryption of ordinary data,and adopt a homomorphic encryption algorithm to encrypt data that needs to be calculated.To accelerate the encryption,we adopt the dualthread encryption mode.Finally,the HDFS control module is designed to combine the encryption algorithm with the storage model.Experimental results show that the proposed solution solves the problem of a single point of failure of metadata,performs well in terms of metadata reliability,and can realize the fault tolerance of the server.The improved encryption algorithm integrates the dual-channel storage mode,and the encryption storage efficiency improves by 27.6% on average. 展开更多
关键词 Big data security Data encryption hadoop Parallel encrypted storage Zookeeper
下载PDF
Hive数据库在电商销售大数据分析中的应用研究
13
作者 林昕 张艳丽 +1 位作者 康彦 刘闰豪 《电脑编程技巧与维护》 2024年第10期99-101,共3页
随着电商行业的蓬勃发展,电商平台积累了海量的销售数据,如何有效地利用这些数据进行销售分析和业务决策成为电商企业亟待解决的问题之一。研究以大数据Hive数据库为工具,探讨了其在电商销售大数据分析中的应用。研究详细描述了Hive在... 随着电商行业的蓬勃发展,电商平台积累了海量的销售数据,如何有效地利用这些数据进行销售分析和业务决策成为电商企业亟待解决的问题之一。研究以大数据Hive数据库为工具,探讨了其在电商销售大数据分析中的应用。研究详细描述了Hive在电商销售大数据分析中的应用场景和方法,结合实际案例,展示了Hive在电商销售大数据分析中的应用,并提出了未来的研究方向和发展趋势。 展开更多
关键词 hive数据库 hadoop平台 电商销售 大数据分析
下载PDF
基于Hadoop平台的灾害大数据处理及可视化
14
作者 汤笛 吴长梦涛 +3 位作者 张欣悦 尹茂鹏 张子涵 陈新房 《电脑与电信》 2024年第4期80-84,共5页
随着监测技术的进步,地震数据量不断增加,增长速度日渐加快。数据处理过程中原始数据可能存在缺失、异常值和格式问题,需要进行细致处理。HBase是一个适合存储和处理大规模数据的分布式数据库,通过使用MapReduce的Bulk-Load方法,可以更... 随着监测技术的进步,地震数据量不断增加,增长速度日渐加快。数据处理过程中原始数据可能存在缺失、异常值和格式问题,需要进行细致处理。HBase是一个适合存储和处理大规模数据的分布式数据库,通过使用MapReduce的Bulk-Load方法,可以更高效地将海量数据导入到HBase中。这样结合Hadoop平台分布式的优势,可以提高运算分析的速度,便于对数据进行研究。通过可视化展示,可以更好地利用数据进行研究分析,为灾害应对提供有力支持。 展开更多
关键词 灾害大数据处理 hadoop平台 HBase数据库 可视化
下载PDF
基于Hadoop架构的设施农业智能监测系统大数据平台的设计与实现
15
作者 王丹 姚竟发 石彦芳 《计算机应用文摘》 2024年第5期25-27,共3页
文章设计并实现了一个基于Hadoop架构的设施农业智能监测系统大数据平台。首先,介绍了设施农业智能监测系统的需求和挑战;其次,阐述了基于Hadoop的大数据平台的架构设计,包括数据采集、数据存储、数据处理、数据分析等模块的设计思路和... 文章设计并实现了一个基于Hadoop架构的设施农业智能监测系统大数据平台。首先,介绍了设施农业智能监测系统的需求和挑战;其次,阐述了基于Hadoop的大数据平台的架构设计,包括数据采集、数据存储、数据处理、数据分析等模块的设计思路和实现方式。在数据采集方面,采用传感器网络和无线通信技术实时采集农业设施的环境数据。在数据存储方面,利用Hadoop分布式文件系统(HDFS)进行数据的存储和管理。在数据处理和分析方面,使用Hadoop的MapReduce计算模型进行数据的处理和分析。 展开更多
关键词 hadoop架构 设施农业 智能监测系统 大数据平台 数据存储
下载PDF
基于Hadoop和MPP数据库混合架构的大数据集成平台
16
作者 张艳姣 任晓阳 《信息工程大学学报》 2024年第4期435-440,共6页
面对海量离散、多源异构的健康医疗大数据,传统集成平台架构存在处理数据量级小、效率低、灵活性差、对非结构化数据的存储分析困难等问题,构建基于Hadoop和MPP数据库混合架构的健康医疗大数据集成平台。综合运用两种架构的技术优势,利... 面对海量离散、多源异构的健康医疗大数据,传统集成平台架构存在处理数据量级小、效率低、灵活性差、对非结构化数据的存储分析困难等问题,构建基于Hadoop和MPP数据库混合架构的健康医疗大数据集成平台。综合运用两种架构的技术优势,利用MPP关系型架构执行处理结构化数据的复杂查询、多表关联、自助分析等逻辑加工场景,利用Hadoop分布式架构完成大规模非结构化数据的并行计算。该集成平台采用逻辑分层和物理分区的建设策略,实现了健康医疗大数据的集中采集、分类存储、有效整合,保证数据的治理质量和处理效率,为临床和科研工作提供高效的数据支撑平台。 展开更多
关键词 健康医疗大数据 hadoop架构 MPP数据库 混合架构 集成平台
下载PDF
“双创”背景下高职电子信息类课程教学改革研究——以Hadoop开发基础为例
17
作者 贾瑞民 李华洲 李良良 《电脑知识与技术》 2024年第11期140-142,共3页
在“大众创业,万众创新”的背景下,高职教育对于电子信息类专业人才的培养提出了新的要求。文章以Hadoop开发基础课程为例,探讨在“双创”背景下高职电子信息类课程的建设策略,旨在增强学生的专业素养、实践能力和创新精神,以契合社会... 在“大众创业,万众创新”的背景下,高职教育对于电子信息类专业人才的培养提出了新的要求。文章以Hadoop开发基础课程为例,探讨在“双创”背景下高职电子信息类课程的建设策略,旨在增强学生的专业素养、实践能力和创新精神,以契合社会对电子信息类人才的需求。 展开更多
关键词 “双创” 高职教育 电子信息类课程 hadoop开发基础
下载PDF
1+X证书制度下高职Hadoop课程教学改革探究——以河南应用技术职业学院为例
18
作者 周少珂 张振平 郭璇 《船舶职业教育》 2024年第3期22-24,共3页
Hadoop课程是高职院校大数据技术专业核心课程,在整个大数据技术体系中占有重要地位。1+X证书制度是新职教政策下国家颁布的证书制度,将1+X证书制度融入Hadoop课程教学过程中,以课程为核心,开展课程教学改革探究,为其他高职院校相关专业... Hadoop课程是高职院校大数据技术专业核心课程,在整个大数据技术体系中占有重要地位。1+X证书制度是新职教政策下国家颁布的证书制度,将1+X证书制度融入Hadoop课程教学过程中,以课程为核心,开展课程教学改革探究,为其他高职院校相关专业的Hadoop课程建设和发展提供借鉴。 展开更多
关键词 大数据 1+X证书 hadoop 教学改革
下载PDF
基于Hadoop的配电网需求数据存储控制技术优化
19
作者 赵建立 汤卓凡 姚孟阳 《粘接》 CAS 2024年第2期182-185,共4页
为确保不同配电网需求数据存储效率,提出基于Hadoop的配电网需求数据存储安全控制方法。采用稀疏字典稀疏分解配电网需求数据,利用字典原子代替数据字节,将压缩数据输入Hadoop分布式平台中,通过客户端专用通道生成公钥和私钥,以密钥流... 为确保不同配电网需求数据存储效率,提出基于Hadoop的配电网需求数据存储安全控制方法。采用稀疏字典稀疏分解配电网需求数据,利用字典原子代替数据字节,将压缩数据输入Hadoop分布式平台中,通过客户端专用通道生成公钥和私钥,以密钥流的形式存入Hadoop节点,双密钥加密需求数据,制定数据密文存储规则,控制需求数据放置位置,实现配电网需求数据安全存储。结果表明,提出的方法在面临恶意攻击时,文件处理速度较快,有效提高了数据存储效率。 展开更多
关键词 hadoop节点 需求数据 稀疏分解 双密钥加密 安全存储
下载PDF
大数据Hadoop集群下Sqoop数据传输技术研究
20
作者 周少珂 郭璇 +1 位作者 张振平 付媛冰 《河南科技》 2024年第6期25-28,共4页
【目的】Hadoop系统是大数据分布式集群系统,其开源的生态圈中有众多功能组件,通过在大数据Hadoop集群系统上部署Sqoop组件,将本地关系型Mysql数据库中的数据和Hive数据仓库中存储的数据进行快速导入导出,进一步研究数据传输性能。【方... 【目的】Hadoop系统是大数据分布式集群系统,其开源的生态圈中有众多功能组件,通过在大数据Hadoop集群系统上部署Sqoop组件,将本地关系型Mysql数据库中的数据和Hive数据仓库中存储的数据进行快速导入导出,进一步研究数据传输性能。【方法】首先在企业服务器上部署配置Hadoop分布式集群系统,其次在该集群上部署Sqoop组件并测试与Mysql数据库和Hive数据仓库的连通性,最后使用Sqoop技术测试本地Mysql数据库和Hive数据仓库之间的导入和导出。【结果】通过Sqoop技术能够更加便捷快速地从本地Mysql数据库上传到Hadoop集群系统,与传统方式下先将本地Mysql数据库中数据导出TXT文档格式后再使用Hive数据仓库的Load数据批量加载功能相比,在时间和效率方面大为提升。【结论】验证了Sqoop组件在Hadoop集群中部署运行的正确性,为大数据技术学习者提供一定程度的参考借鉴。 展开更多
关键词 大数据 hadoop 分布式集群 Sqoop
下载PDF
上一页 1 2 191 下一页 到第
使用帮助 返回顶部