期刊文献+
共找到3,574篇文章
< 1 2 179 >
每页显示 20 50 100
模块化教学模式探析--以“Hadoop大数据处理”课程模块化教学设计为例 被引量:3
1
作者 李美 《牡丹江大学学报》 2024年第3期82-86,108,共6页
课程模块化教学是对课程内容的重组以及整合,利用教学平台,引入企业项目案例资源,把传统的教学模式转变为以学生为主体、教师为主导的模式。本文以高等职业院校“Hadoop大数据处理”课程为例,采用模块化教学模式以适应大数据专业的工作... 课程模块化教学是对课程内容的重组以及整合,利用教学平台,引入企业项目案例资源,把传统的教学模式转变为以学生为主体、教师为主导的模式。本文以高等职业院校“Hadoop大数据处理”课程为例,采用模块化教学模式以适应大数据专业的工作岗位,介绍了模块化教学模式的概念、国内外研究现状,进行了“Hadoop大数据处理”课程模块化设计,分别是教学主体转换、内容模块化设计、教师分工协作模块化设计、应用信息化教学平台。以“Hadoop大数据处理”课程中大数据计算分析模块中“微博精准广告营销”为例说明课程模块化教学设计的具体实施步骤和最终的教学效果。 展开更多
关键词 hadoop大数据处理” 课程模块化 模块化教学设计 模块化教学实施
下载PDF
基于Hadoop的设施蔬菜产销大数据架构分析
2
作者 李敏 文燕 叶煜 《四川农业科技》 2024年第3期29-33,共5页
随着现代科技的发展,物联网、大数据的广泛普及与使用,百姓赖以生活与生存的设施蔬菜发展迅猛快速,从传统的“看天吃饭”到现代化的“四季不断”的转变,实现时不分冬夏、地不分南北的天时地利供应不断,提高了百姓的生活质量。在整个过程... 随着现代科技的发展,物联网、大数据的广泛普及与使用,百姓赖以生活与生存的设施蔬菜发展迅猛快速,从传统的“看天吃饭”到现代化的“四季不断”的转变,实现时不分冬夏、地不分南北的天时地利供应不断,提高了百姓的生活质量。在整个过程中,由于各环节产生数据量极大,种植销售分散,规模大小不一,分类也不统一,采集数据还不是很精准,有限数据利用率不高,造成统计数据还不够完善,数据分析存在偏差,甚至失误。文章主要从研究设施蔬菜的产销,利用传感器技术,从蔬菜分类、销售量等方面准确采集数据,并使用hadoop对数据进行分析。实现HDFS分布式存储、MapReduce实现数据处理过程到利用Hive数据仓库工具,对HDFS中存储的数据进行提取、查询、汇总,对设施蔬菜大数据产销进行架构分析,得到的结果反哺蔬菜种植源头,更好地指导种植生产销售,服务现代农业,服务万千百姓。 展开更多
关键词 设施蔬菜 hadoop 架构分析
下载PDF
基于Hadoop的高校教学质量评测系统构建与评估方法
3
作者 董明 牟云环 《微型电脑应用》 2024年第2期26-28,37,共4页
为了确保高校教学质量评估的客观性、系统性和全面性,提出利用大数据全面服务教育评估,并基于Hadoop构建评测系统,在Hadoop分布式架构基础上,提出利用分布式算法对高校教学质量各方面进行评估。评测系统主要从学校管理质量、教师教学过... 为了确保高校教学质量评估的客观性、系统性和全面性,提出利用大数据全面服务教育评估,并基于Hadoop构建评测系统,在Hadoop分布式架构基础上,提出利用分布式算法对高校教学质量各方面进行评估。评测系统主要从学校管理质量、教师教学过程、学生的学习行为以及学业质量等4个方面对高校教学质量进行评估,自下而上划分为数据访问层、业务逻辑层和表示层,各功能子系统均采用模块化设计;针对不同大数据的特点,提出利用主成分分析法对学校管理质量大数据进行评估,采用分布式算法对教师教学过程、学生学习行为和学业质量进行评估;当数据量较小时传统单机算法运行效率较高,当数据量较大(大数据样本)时分布式算法的运行时间明显少于单机算法,且随着数据量的增大,运行效率优势越明显。 展开更多
关键词 高校教学质量 评测系统 hadoop 大数据 分布式算法
下载PDF
基于Hadoop技术的教学数据存储研究
4
作者 李俊涛 《广州城市职业学院学报》 2024年第1期86-90,共5页
探讨了基于Hadoop技术的高校教学数据存储系统设计。该系统以Hadoop分布式文件系统(HDFS)和MapReduce框架为基础,实现了教学数据的高效存储、管理和分析。构建了“数据交互层”“核心处理层”和“数据存储层”三层结构。教学资源网结构... 探讨了基于Hadoop技术的高校教学数据存储系统设计。该系统以Hadoop分布式文件系统(HDFS)和MapReduce框架为基础,实现了教学数据的高效存储、管理和分析。构建了“数据交互层”“核心处理层”和“数据存储层”三层结构。教学资源网结构和数据库访问层支持多样化的数据类型和访问需求。同时,强调数据安全性与权限管理,以及实时处理与分析能力的重要性。通过这一设计,系统为高校提供了安全、高效、可靠的教学数据解决方案,支持教育的创新和发展。 展开更多
关键词 教学数据存储系统 hadoop技术 分布式存储 数据安全性
下载PDF
基于Hadoop技术的加速器大数据安全存储与高效分析系统设计 被引量:2
5
作者 赵子晨 杨锋 +3 位作者 郭玉辉 陈又新 李钊扬 刘海涛 《现代电子技术》 北大核心 2024年第8期9-17,共9页
为了解决当前加速器控制系统在数据管理方面所面临的海量数据安全存储和高效分析处理的问题,在现有的基础上引入了Hadoop大数据框架,并结合大数据其他相关组件,构建一个分布式数据仓库系统。文章详细阐述了数据仓库的搭建过程,包括软硬... 为了解决当前加速器控制系统在数据管理方面所面临的海量数据安全存储和高效分析处理的问题,在现有的基础上引入了Hadoop大数据框架,并结合大数据其他相关组件,构建一个分布式数据仓库系统。文章详细阐述了数据仓库的搭建过程,包括软硬件架构以及将数据从现有数据库抽取、转换和加载到数据仓库的方案。特别是针对系统归档数据的存储和分析需求,根据实际应用场景设计一个基于HBase的存储解决方案。在系统部署完成后,进行了吞吐量测试,并与当前使用的传统数据库进行性能对比。测试结果显示,基于Hadoop的数据仓库系统在海量数据存储、高性能查询以及数据分析处理方面都表现出明显的优势。这一改进为加速器控制系统提供了更强大的数据管理和处理能力,有望为加速器在未来的发展提供更多可能性。 展开更多
关键词 数据仓库 hadoop技术 加速器 大数据 安全存储 HBASE ETL
下载PDF
基于Hadoop的智慧工作岗位分析大数据平台的设计与实现
6
作者 张书贵 《信息与电脑》 2024年第5期112-114,118,共4页
随着互联网的发展,网上招聘方式日益普及。但当求职者面对海量招聘信息,对不同维度的信息进行综合分析时会变得异常繁杂。鉴于此,文章设计了基于Hadoop的智慧工作岗位分析大数据平台,为用户提供岗位数据整合、归档、检索、浏览和分析挖... 随着互联网的发展,网上招聘方式日益普及。但当求职者面对海量招聘信息,对不同维度的信息进行综合分析时会变得异常繁杂。鉴于此,文章设计了基于Hadoop的智慧工作岗位分析大数据平台,为用户提供岗位数据整合、归档、检索、浏览和分析挖掘服务。该平台以大数据分析技术为核心,利用Python编程爬取Web页面数据,利用Flume对数据进行聚合和日志采集,采用Kafka对数据进行缓冲,使用Spark对实时数据进行计算,利用MapReduce对清洗后的数据进行运算,最后利用数据大屏对数据进行可视化展示。 展开更多
关键词 智慧 工作岗位 大数据 hadoop
下载PDF
Design and Implementation of Log Data Analysis Management System Based on Hadoop 被引量:2
7
作者 Dunhong Yao Yu Chen 《Journal of Information Hiding and Privacy Protection》 2020年第2期59-65,共7页
With the rapid development of the Internet,many enterprises have launched their network platforms.When users browse,search,and click the products of these platforms,most platforms will keep records of these network be... With the rapid development of the Internet,many enterprises have launched their network platforms.When users browse,search,and click the products of these platforms,most platforms will keep records of these network behaviors,these records are often heterogeneous,and it is called log data.To effectively to analyze and manage these heterogeneous log data,so that enterprises can grasp the behavior characteristics of their platform users in time,to realize targeted recommendation of users,increase the sales volume of enterprises’products,and accelerate the development of enterprises.Firstly,we follow the process of big data collection,storage,analysis,and visualization to design the system,then,we adopt HDFS storage technology,Yarn resource management technology,and gink load balancing technology to build a Hadoop cluster to process the log data,and adopt MapReduce processing technology and data warehouse hive technology analyze the log data to obtain the results.Finally,the obtained results are displayed visually,and a log data analysis system is successfully constructed.It has been proved by practice that the system effectively realizes the collection,analysis and visualization of log data,and can accurately realize the recommendation of products by enterprises.The system is stable and effective. 展开更多
关键词 Log data hadoop data analysis data visualization
下载PDF
Apache Hadoop Architecture,Applications,and Hadoop Distributed File System 被引量:1
8
作者 Pratit Raj Giri Gajendra Sharma 《Semiconductor Science and Information Devices》 2022年第1期14-20,共7页
The data and internet are highly growing which causes problems in management of the big-data.For these kinds of problems,there are many software frameworks used to increase the performance of the distributed system.Th... The data and internet are highly growing which causes problems in management of the big-data.For these kinds of problems,there are many software frameworks used to increase the performance of the distributed system.This software is used for the availability of large data storage.One of the most beneficial software frameworks used to utilize data in distributed systems is Hadoop.This paper introduces Apache Hadoop architecture,components of Hadoop,their significance in managing vast volumes of data in a distributed system.Hadoop Distributed File System enables the storage of enormous chunks of data over a distributed network.Hadoop Framework maintains fsImage and edits files,which supports the availability and integrity of data.This paper includes cases of Hadoop implementation,such as monitoring weather,processing bioinformatics. 展开更多
关键词 hadoop FsImage HDFS Apache hadoop MAPREDUCE
下载PDF
基于Hadoop的电商数据挖掘技术分析
9
作者 李梅 刘铭 黄彬彬 《中国新技术新产品》 2024年第6期126-129,共4页
本文对Hadoop的电商数据挖掘技术的研究过程、理论依据进行了探讨,并对其应用结果进行验证。分析结果表明,基于Hadoop的电商数据挖掘技术具有较大的优势,可以对数据进行高效处理和有效筛选,不仅能提高数据资源的有效利用率,还能提高工... 本文对Hadoop的电商数据挖掘技术的研究过程、理论依据进行了探讨,并对其应用结果进行验证。分析结果表明,基于Hadoop的电商数据挖掘技术具有较大的优势,可以对数据进行高效处理和有效筛选,不仅能提高数据资源的有效利用率,还能提高工作效率和工作质量,因此值得推广和应用。 展开更多
关键词 hadoop 电商数据 数据挖掘技术
下载PDF
Hadoop-based secure storage solution for big data in cloud computing environment 被引量:1
10
作者 Shaopeng Guan Conghui Zhang +1 位作者 Yilin Wang Wenqing Liu 《Digital Communications and Networks》 SCIE CSCD 2024年第1期227-236,共10页
In order to address the problems of the single encryption algorithm,such as low encryption efficiency and unreliable metadata for static data storage of big data platforms in the cloud computing environment,we propose... In order to address the problems of the single encryption algorithm,such as low encryption efficiency and unreliable metadata for static data storage of big data platforms in the cloud computing environment,we propose a Hadoop based big data secure storage scheme.Firstly,in order to disperse the NameNode service from a single server to multiple servers,we combine HDFS federation and HDFS high-availability mechanisms,and use the Zookeeper distributed coordination mechanism to coordinate each node to achieve dual-channel storage.Then,we improve the ECC encryption algorithm for the encryption of ordinary data,and adopt a homomorphic encryption algorithm to encrypt data that needs to be calculated.To accelerate the encryption,we adopt the dualthread encryption mode.Finally,the HDFS control module is designed to combine the encryption algorithm with the storage model.Experimental results show that the proposed solution solves the problem of a single point of failure of metadata,performs well in terms of metadata reliability,and can realize the fault tolerance of the server.The improved encryption algorithm integrates the dual-channel storage mode,and the encryption storage efficiency improves by 27.6% on average. 展开更多
关键词 Big data security Data encryption hadoop Parallel encrypted storage Zookeeper
下载PDF
Hadoop Distributed File System Security Challenges and Examination of Unauthorized Access Issue 被引量:1
11
作者 Wahid Rajeh 《Journal of Information Security》 2022年第2期23-42,共20页
Hadoop technology is followed by some security issues. At its beginnings, developers paid attention to the development of basic functionalities mostly, and proposal of security components was not of prime interest. Be... Hadoop technology is followed by some security issues. At its beginnings, developers paid attention to the development of basic functionalities mostly, and proposal of security components was not of prime interest. Because of that, the technology remained vulnerable to malicious activities of unauthorized users whose purpose is to endanger system functionalities or to compromise private user data. Researchers and developers are continuously trying to solve these issues by upgrading Hadoop’s security mechanisms and preventing undesirable malicious activities. In this paper, the most common HDFS security problems and a review of unauthorized access issues are presented. First, Hadoop mechanism and its main components are described as the introduction part of the leading research problem. Then, HDFS architecture is given, and all including components and functionalities are introduced. Further, all possible types of users are listed with an accent on unauthorized users, which are of great importance for the paper. One part of the research is dedicated to the consideration of Hadoop security levels, environment and user assessments. The review also includes an explanation of Log Monitoring and Audit features, and detail consideration of authorization and authentication issues. Possible consequences of unauthorized access to a system are covered, and a few recommendations for solving problems of unauthorized access are offered. Honeypot nodes, security mechanisms for collecting valuable information about malicious parties, are presented in the last part of the paper. Finally, the idea for developing a new type of Intrusion Detector, which will be based on using an artificial neural network, is presented. The detector will be an integral part of a new kind of virtual honeypot mechanism and represents the initial base for future scientific work of authors. 展开更多
关键词 hadoop Security Issue Unauthorized Access Honeypot Node Intrusion Detector
下载PDF
“双创”背景下高职电子信息类课程教学改革研究——以Hadoop开发基础为例
12
作者 贾瑞民 李华洲 李良良 《电脑知识与技术》 2024年第11期140-142,共3页
在“大众创业,万众创新”的背景下,高职教育对于电子信息类专业人才的培养提出了新的要求。文章以Hadoop开发基础课程为例,探讨在“双创”背景下高职电子信息类课程的建设策略,旨在增强学生的专业素养、实践能力和创新精神,以契合社会... 在“大众创业,万众创新”的背景下,高职教育对于电子信息类专业人才的培养提出了新的要求。文章以Hadoop开发基础课程为例,探讨在“双创”背景下高职电子信息类课程的建设策略,旨在增强学生的专业素养、实践能力和创新精神,以契合社会对电子信息类人才的需求。 展开更多
关键词 “双创” 高职教育 电子信息类课程 hadoop开发基础
下载PDF
基于Hadoop的离线电商数据分析系统的设计与实现 被引量:1
13
作者 潘杰恒 蔡群英 《现代计算机》 2024年第3期112-116,共5页
随着互联网的普及和人们不断增长的消费需求,电子商务平台已成为人们生活不可或缺的一部分,由此产生大量数据。基于Hadoop,设计并实现一个离线电商数据分析系统,从系统架构、数据采集、传输、存储、分析处理和可视化等方面作了介绍,系... 随着互联网的普及和人们不断增长的消费需求,电子商务平台已成为人们生活不可或缺的一部分,由此产生大量数据。基于Hadoop,设计并实现一个离线电商数据分析系统,从系统架构、数据采集、传输、存储、分析处理和可视化等方面作了介绍,系统具有一定的数据分析能力,能将原本无用的数据进行整理利用,发挥数据本身的价值。 展开更多
关键词 电商 离线 分析系统 大数据 hadoop Hive FLUME Kafka
下载PDF
基于Hadoop架构的设施农业智能监测系统大数据平台的设计与实现
14
作者 王丹 姚竟发 石彦芳 《计算机应用文摘》 2024年第5期25-27,共3页
文章设计并实现了一个基于Hadoop架构的设施农业智能监测系统大数据平台。首先,介绍了设施农业智能监测系统的需求和挑战;其次,阐述了基于Hadoop的大数据平台的架构设计,包括数据采集、数据存储、数据处理、数据分析等模块的设计思路和... 文章设计并实现了一个基于Hadoop架构的设施农业智能监测系统大数据平台。首先,介绍了设施农业智能监测系统的需求和挑战;其次,阐述了基于Hadoop的大数据平台的架构设计,包括数据采集、数据存储、数据处理、数据分析等模块的设计思路和实现方式。在数据采集方面,采用传感器网络和无线通信技术实时采集农业设施的环境数据。在数据存储方面,利用Hadoop分布式文件系统(HDFS)进行数据的存储和管理。在数据处理和分析方面,使用Hadoop的MapReduce计算模型进行数据的处理和分析。 展开更多
关键词 hadoop架构 设施农业 智能监测系统 大数据平台 数据存储
下载PDF
基于Hadoop的海量工程数据处理技术研究
15
作者 郭雅婷 龚道文 李茜 《移动信息》 2024年第10期282-284,共3页
随着信息技术的快速发展,工程领域中产生的数据量也在爆炸性增长。这些海量数据的有效处理和分析对工程决策、优化和创新至关重要。作为一种开源的分布式存储和计算框架,Hadoop以其高可靠性、高扩展性和高效性,成为处理大规模数据的首... 随着信息技术的快速发展,工程领域中产生的数据量也在爆炸性增长。这些海量数据的有效处理和分析对工程决策、优化和创新至关重要。作为一种开源的分布式存储和计算框架,Hadoop以其高可靠性、高扩展性和高效性,成为处理大规模数据的首选技术。文中探讨了基于Hadoop的海量工程数据处理技术,分析了其在工程数据处理中的应用优势和面临的挑战,并提出了相应的优化策略,揭示了Hadoop在处理工程数据中的潜力和局限,为工程领域的数据处理提供了新的视角和方法。 展开更多
关键词 hadoop 海量数据 工程数据处理 分布式计算 数据分析
下载PDF
基于Hadoop和MPP数据库混合架构的大数据集成平台
16
作者 张艳姣 任晓阳 《信息工程大学学报》 2024年第4期435-440,共6页
面对海量离散、多源异构的健康医疗大数据,传统集成平台架构存在处理数据量级小、效率低、灵活性差、对非结构化数据的存储分析困难等问题,构建基于Hadoop和MPP数据库混合架构的健康医疗大数据集成平台。综合运用两种架构的技术优势,利... 面对海量离散、多源异构的健康医疗大数据,传统集成平台架构存在处理数据量级小、效率低、灵活性差、对非结构化数据的存储分析困难等问题,构建基于Hadoop和MPP数据库混合架构的健康医疗大数据集成平台。综合运用两种架构的技术优势,利用MPP关系型架构执行处理结构化数据的复杂查询、多表关联、自助分析等逻辑加工场景,利用Hadoop分布式架构完成大规模非结构化数据的并行计算。该集成平台采用逻辑分层和物理分区的建设策略,实现了健康医疗大数据的集中采集、分类存储、有效整合,保证数据的治理质量和处理效率,为临床和科研工作提供高效的数据支撑平台。 展开更多
关键词 健康医疗大数据 hadoop架构 MPP数据库 混合架构 集成平台
下载PDF
Hadoop + Spark Platform Based on Big Data System Design of Agricultural Product Price Analysis and Prediction by HoltWinters
17
作者 Yun Deng Yan Zhu +1 位作者 Qingjun Zhang Xiaohui Cheng 《国际计算机前沿大会会议论文集》 2019年第1期121-123,共3页
In the market of agricultural products, the price of agricultural products is affected by production cost, market supply and other factors. In order to obtain the market information of agricultural products, the price... In the market of agricultural products, the price of agricultural products is affected by production cost, market supply and other factors. In order to obtain the market information of agricultural products, the price fluctuation can be analyzed and predicted. A distributed big data software platform based on Hadoop, Hive and Spark is proposed to analyze and forecast agricultural price data. Firstly, Hadoop, Hive and Spark big data frameworks were built to store the data information of agricultural products crawled into MYSQL. Secondly, the information of agricultural products crawled from MYSQL was exported to a text file, uploaded to HDFS, and mapped to spark SQL database. The data was cleaned and improved by Holt-Winters (three times exponential smoothing method) model to predict the price of agricultural products in the future. The data cleaned by spark SQL was imported and predicted by improved Holt-Winters into MYSQL database. The technologies of pringMVC, Ajax and Echarts were used to visualize the data. 展开更多
关键词 hadoop SPARK BIG data Analysis and FORECAST of AGRICULTURAL product PRICES Holt-Winters
下载PDF
基于Hadoop平台的灾害大数据处理及可视化
18
作者 汤笛 吴长梦涛 +3 位作者 张欣悦 尹茂鹏 张子涵 陈新房 《电脑与电信》 2024年第4期80-84,共5页
随着监测技术的进步,地震数据量不断增加,增长速度日渐加快。数据处理过程中原始数据可能存在缺失、异常值和格式问题,需要进行细致处理。HBase是一个适合存储和处理大规模数据的分布式数据库,通过使用MapReduce的Bulk-Load方法,可以更... 随着监测技术的进步,地震数据量不断增加,增长速度日渐加快。数据处理过程中原始数据可能存在缺失、异常值和格式问题,需要进行细致处理。HBase是一个适合存储和处理大规模数据的分布式数据库,通过使用MapReduce的Bulk-Load方法,可以更高效地将海量数据导入到HBase中。这样结合Hadoop平台分布式的优势,可以提高运算分析的速度,便于对数据进行研究。通过可视化展示,可以更好地利用数据进行研究分析,为灾害应对提供有力支持。 展开更多
关键词 灾害大数据处理 hadoop平台 HBase数据库 可视化
下载PDF
Efficient File Accessing Techniques on Hadoop Distributed File Systems
19
作者 Wei Qu Siyao Cheng Hongzhi Wang 《国际计算机前沿大会会议论文集》 2016年第1期88-90,共3页
Hadoop framework emerged at the right moment when traditional tools were powerless in terms of handling big data. Hadoop Distributed File System (HDFS) which serves as a highly fault-tolerance distributed file system ... Hadoop framework emerged at the right moment when traditional tools were powerless in terms of handling big data. Hadoop Distributed File System (HDFS) which serves as a highly fault-tolerance distributed file system in Hadoop, can improve the throughput of data access effectively. It is very suitable for the application of handling large amounts of datasets. However, Hadoop has the disadvantage that the memory usage rate in NameNode is so high when processing large amounts of small files that it has become the limit of the whole system. In this paper, we propose an approach to optimize the performance of HDFS with small files. The basic idea is to merge small files into a large one whose size is suitable for a block. Furthermore, indexes are built to meet the requirements for fast access to all files in HDFS. Preliminary experiment results show that our approach achieves better performance. 展开更多
关键词 HDFS hadoop INDEX SMALL FILES
下载PDF
Personalized Recommendation System on Hadoop and HBase
20
作者 Shufen Zhang Yanyan Dong +1 位作者 Xuebin Chen Shi Wang 《国际计算机前沿大会会议论文集》 2015年第B12期10-11,共2页
In view of the existing recommendation system in the Big Data have two insufficiencies:poor scalability of the data storage and poor expansibility of the recommendation algorithm,research and analysis the IBCF algorit... In view of the existing recommendation system in the Big Data have two insufficiencies:poor scalability of the data storage and poor expansibility of the recommendation algorithm,research and analysis the IBCF algorithm and the working principle of Hadoop and HBase platform,a scheme for optimizing the design of personalized recommendation system based on Hadoop and HBase platform is proposed.The experimental results show that,using the HBase database can effectively solve the problem of mass data storage,using the MapReduce programming model of Hadoop platform parallel processing recommendation problem,can significantly improve the efficiency of the algorithm,so as to further improve the performance of personalized recommendation system. 展开更多
关键词 hadoop·HBase·MapReduce·Personalized RECOMMENDATION
下载PDF
上一页 1 2 179 下一页 到第
使用帮助 返回顶部