期刊文献+
共找到114篇文章
< 1 2 6 >
每页显示 20 50 100
Apache Flink流式计算模型在数据处理中的应用与性能优化研究
1
作者 徐海霞 《电脑知识与技术》 2024年第7期71-73,共3页
文章旨在研究Apache Flink流式计算模型在数据处理中的应用与性能优化。先从可扩展性、容错性和数据并行处理能力三个方面对Apache Flink流式计算框架技术特点进行论述,再对Apache Flink流式计算框架核心思想与工作流程进行研究,并提出... 文章旨在研究Apache Flink流式计算模型在数据处理中的应用与性能优化。先从可扩展性、容错性和数据并行处理能力三个方面对Apache Flink流式计算框架技术特点进行论述,再对Apache Flink流式计算框架核心思想与工作流程进行研究,并提出一套执行数据处理任务的Java源码,再从并行计算、数据存储和传输、算法参数、系统配置、资源管理与调度、检查点和容错机制、编码和序列化等方面就如何进行Apache Flink性能优化进行分析,最后通过实验手段就优化性能进行分析。实验结果表明,优化后的平均响应时间显著减少,吞吐量相应增加,调整并行度和内存分配等参数可显著提升系统性能,但还需要考虑任务调度和资源分配等方面的综合因素,因此,Apache Flink流式计算框架调优策略具有一定的应用价值。 展开更多
关键词 流式计算 Apache flink 大规模数据处理 性能优化 并行计算
下载PDF
Apache Flink复杂事件处理语言的形式语义
2
作者 傅宣登 吴志林 《软件学报》 EI CSCD 北大核心 2024年第10期4510-4532,共23页
Apache Flink是目前最流行的流式计算平台之一,已经在工业界得到了广泛应用.复杂事件处理是流式计算的一种重要使用场景,Apache Flink平台定义并实现了一种复杂事件处理语言(简称FlinkCEP).FlinkCEP语法特性丰富,不仅包括常见的过滤、... Apache Flink是目前最流行的流式计算平台之一,已经在工业界得到了广泛应用.复杂事件处理是流式计算的一种重要使用场景,Apache Flink平台定义并实现了一种复杂事件处理语言(简称FlinkCEP).FlinkCEP语法特性丰富,不仅包括常见的过滤、连接、循环等操作,还包括迭代条件、匹配筛选策略等高级特性.FlinkCEP语义复杂,尚缺乏语言规范对其语义进行准确描述,只能通过实现细节来理解,因此对其语义进行形式描述对于开发人员准确理解其语义非常必要.针对FlinkCEP提出一种数据流转换器的自动机模型,该模型包括用于刻画迭代条件的数据变量、存储输出结果的数据流变量、用于刻画匹配筛选策略的迁移优先级等特性.使用数据流转换器对FlinkCEP的语义进行形式建模,并且根据形式语义设计FlinkCEP的查询求值算法,实现原型系统.进一步,生成能够较为全面覆盖FlinkCEP语法特性的测试用例集,利用这些测试用例与FlinkCEP在Flink平台上的实际运行结果进行对比实验.实验结果表明所提出的形式语义与FlinkCEP在Flink平台上的实际语义基本是一致的.而且,对实验结果不一致的情况进行分析,指出FlinkCEP在Flink平台上的实现对于组模式的处理可能存在错误. 展开更多
关键词 流式计算 flink 复杂事件处理 形式语义 数据流转换器 查询求值
下载PDF
基于Flink的鲸鱼优化K-Means算法 被引量:2
3
作者 于志良 《互联网周刊》 2023年第4期83-85,共3页
针对K-Means聚类算法依赖于初始聚类中心选择的问题,利用鲸鱼优化算法易于获取全局最优解及快速收敛性的优势,结合分布式框架的并行优势,提出了一种基于Flink的鲸鱼优化K-Means聚类算法。通过鲸鱼优化算法对领头鲸迭代更新、优化位置,... 针对K-Means聚类算法依赖于初始聚类中心选择的问题,利用鲸鱼优化算法易于获取全局最优解及快速收敛性的优势,结合分布式框架的并行优势,提出了一种基于Flink的鲸鱼优化K-Means聚类算法。通过鲸鱼优化算法对领头鲸迭代更新、优化位置,用算法的最优解作为聚类中心替代K-Means算法的随机聚类中心,改进后的算法聚类效果较好、收敛速度快,有效结合了智能算法及分布式框架的优势。 展开更多
关键词 聚类算法 K-MEANS 鲸鱼优化 flink
下载PDF
基于Flink复杂事件处理的空间站实验柜排废气安全监测 被引量:1
4
作者 施建明 王伟 王功 《载人航天》 CSCD 北大核心 2023年第1期102-109,共8页
空间站实验柜密封箱体在通过抽真空、充氮气进行排废气时一旦失控,将产生箱体失压或过压的风险,对排废气过程进行安全监控和故障识别,将面临多参数耦合以及时序逻辑等复杂事件处理问题。将大数据流处理技术Flink及其复杂事件处理(CEP)... 空间站实验柜密封箱体在通过抽真空、充氮气进行排废气时一旦失控,将产生箱体失压或过压的风险,对排废气过程进行安全监控和故障识别,将面临多参数耦合以及时序逻辑等复杂事件处理问题。将大数据流处理技术Flink及其复杂事件处理(CEP)库应用在排废气安全监测上,设计出相应异常模式序列对排废气过程监测的数据流进行匹配,从数据流中实时检测出复杂事件序列。在仿真测试条件下,基于Flink CEP的监测程序故障检测率和隔离率均达100%,能有效剔除传感器瞬态异常导致的虚警。 展开更多
关键词 排废气 复杂事件处理 flink 安全监测 模式序列
下载PDF
基于Flink框架的K-means算法优化及并行计算策略 被引量:1
5
作者 李召鑫 孟祥印 +2 位作者 肖世德 胡锴沣 赖焕杰 《计算机与数字工程》 2023年第10期2231-2235,共5页
K-means算法因其原理简单和聚类效果尚佳的优点在机器学习和数据挖掘领域得到广泛使用,但其仍存在一些缺点:K-means算法需指定分类类别数K;K-means算法对于初始聚类中心的选取策略是随机选择,这可能会影响到最终聚类结果的准确率及计算... K-means算法因其原理简单和聚类效果尚佳的优点在机器学习和数据挖掘领域得到广泛使用,但其仍存在一些缺点:K-means算法需指定分类类别数K;K-means算法对于初始聚类中心的选取策略是随机选择,这可能会影响到最终聚类结果的准确率及计算速度。以上缺点都限制了K-means算法的计算效率的进一步提升。论文针对以上问题,提出了一种基于Flink并行化的K-means优化算法,该算法在传统K-means算法的基础上引入Canopy算法来完成初始聚类,得到类别数K,然后采用最大距离算法来计算初始聚类中心,并利用Flink框架的并行计算能力,对多个数据集进行聚类实验。实验结果表明,论文算法可以减少聚类过程迭代次数,并且在聚类准确率方面也有一定的提高,在大规模数据集环境下同样具有良好的计算效率。 展开更多
关键词 flink K-MEANS算法 Canopy算法 并行化
下载PDF
Flink平台下的分布式平衡级联支持向量机
6
作者 刘屹成 刘晓燕 严馨 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第5期999-1006,共8页
支持向量机(Support Vector Machines,SVM)在分类和回归领域都是非常强大的工具,但在大数据环境下,其面临资源占用过高和寻优速度慢等问题.目前利用大数据框架实现的SVM,虽然优化了寻优速度慢的问题,但其预测精度与直接训练方式相比存... 支持向量机(Support Vector Machines,SVM)在分类和回归领域都是非常强大的工具,但在大数据环境下,其面临资源占用过高和寻优速度慢等问题.目前利用大数据框架实现的SVM,虽然优化了寻优速度慢的问题,但其预测精度与直接训练方式相比存在一定的差距,此外其并没有对训练节点的资源进行合理配置.故提出一种Flink平台下的分布式平衡级联向量机,该方式在之前的基础上将数据集分成含有相同比例样本的平衡子集,并对子集的训练参数进行放缩;同时,结合Flink下迭代作业的动态资源分配策略,将各节点资源最小化为刚好满足训练需求.对该方法的有效性进行阐述,对比多个数据集在不同训练方式下的资源占用和模型精度,实验结果表明,采用所提出的训练方式能合理灵活地对资源进行配置,同时将模型预测精度误差降低到0.1%以内. 展开更多
关键词 Apache flink 支持向量机 分布式计算 细粒度资源管理 平衡子集
下载PDF
基于Flink的分布式在线集成学习框架研究 被引量:1
7
作者 曹张宇 钟原 周静 《计算机应用研究》 CSCD 北大核心 2023年第6期1784-1788,共5页
在大数据环境背景下,传统机器学习算法多采用单机离线训练的方式,显然已经无法适应持续增长的大规模流式数据的变化。针对该问题,提出一种基于Flink平台的分布式在线集成学习算法。该方法基于Flink分布式计算框架,首先通过数据并行的方... 在大数据环境背景下,传统机器学习算法多采用单机离线训练的方式,显然已经无法适应持续增长的大规模流式数据的变化。针对该问题,提出一种基于Flink平台的分布式在线集成学习算法。该方法基于Flink分布式计算框架,首先通过数据并行的方式对在线学习算法进行分布式在线训练;然后将训练出的多个子模型通过随机梯度下降算法进行模型的动态权重分配,实现对多个子模型的结果聚合;与此同时,对于训练效果不好的模型利用其样本进行在线更新;最后通过单机与集群环境在不同数据集上做实验对比分析。实验结果表明,在线学习算法结合Flink框架的分布式集成训练,能达到集中训练方式下的性能,同时大大提高了训练的时间效率。 展开更多
关键词 分布式流计算 在线学习 集成学习 flink
下载PDF
基于Flink的k-支配skyline体并行求解算法 被引量:1
8
作者 孙国璋 黄山 +2 位作者 艾力卡木·再比布拉 徐浩桐 段晓东 《计算机工程与科学》 CSCD 北大核心 2023年第1期17-27,共11页
k-支配skyline算法弱化了数据点之间的支配关系,更适合高维数据。k-支配skyline体适应于多名用户使用k-支配skyline算法查询,而现有的求解算法在时间效率和代码扩展性方面都有待提高。因此,提出了面向多用户的k-支配skyline体求解优化算... k-支配skyline算法弱化了数据点之间的支配关系,更适合高维数据。k-支配skyline体适应于多名用户使用k-支配skyline算法查询,而现有的求解算法在时间效率和代码扩展性方面都有待提高。因此,提出了面向多用户的k-支配skyline体求解优化算法MKSSOA,该算法对每名用户的候选集和中间集分别进行存储,同时在k-支配检查过程中利用2集合中数据点出现的先后次序将候选集中的非k-支配skyline点存储到对应用户的中间集中,以便下一名用户筛选使用,这样可以减少数据点之间的比较次数,避免重复计算,从而提升查询效率。同时,提出了面向多用户的k-支配skyline体并行求解算法MKSPSA,通过Apache Flink并行处理框架有效减少了数据点的比较时间。理论研究和实验结果显示,提出的算法具有较高的效率,能很好地处理多用户k-支配skyline问题。 展开更多
关键词 k-支配 SKYLINE查询 多用户 Apache flink 并行查询
下载PDF
基于深度学习的容器化Flink上下游负载均衡策略研究 被引量:1
9
作者 艾力卡木·再比布拉 甄妞 +1 位作者 黄山 段晓东 《大连民族大学学报》 2023年第1期47-52,共6页
容器化部署Flink时,存在上下游算子的容器内存分配不均衡问题。提出基于深度学习的容器化Flink上下游负载均衡框架,使用CEEMDAN分解方法和BiLSTM相结合的预测方法预测Flink下游容器所需内存,并依据预测结果调整容器内存分配。实验证明:... 容器化部署Flink时,存在上下游算子的容器内存分配不均衡问题。提出基于深度学习的容器化Flink上下游负载均衡框架,使用CEEMDAN分解方法和BiLSTM相结合的预测方法预测Flink下游容器所需内存,并依据预测结果调整容器内存分配。实验证明:提出的上下游负载均衡策略可有效减少上游容器的等待时间,缓解下游容器的资源,计算效率提高约20%。 展开更多
关键词 flink 容器负载预测 容器伸缩 深度学习
下载PDF
基于Flink的个人信用评估集成方法
10
作者 牛家冰 陈志雨 《长春工业大学学报》 CAS 2023年第6期569-576,共8页
针对个人信用数据集的类别不均衡和传统的集成学习方式训练时间长、鲁棒性差的问题,提出一种基于Flink分布式系统的加权Stacking模型融合的集成学习算法,该方法基于Alink算法库采用XGBOOST、GBDT与随机森林和逻辑回归做Stacking模型融... 针对个人信用数据集的类别不均衡和传统的集成学习方式训练时间长、鲁棒性差的问题,提出一种基于Flink分布式系统的加权Stacking模型融合的集成学习算法,该方法基于Alink算法库采用XGBOOST、GBDT与随机森林和逻辑回归做Stacking模型融合。在Flink平台下引入多种算法进行对比试验,结果表明,该方法在AUC值、F1值方面和耗时性能具备一定优势,并且分布式的加权Stacking模型融合方法随着工作节点的增加,算法的耗时逐渐降低。 展开更多
关键词 flink STACKING 并行 个人信用评估
下载PDF
基于flink的在线教学学生聚类分析系统的开发
11
作者 罗影 张靓 《成都航空职业技术学院学报》 2023年第4期52-55,60,共5页
在线学习中产生的学习行为数据经过处理后,可更好地支持教师选择个性化的教学策略,达到更佳教学效果。利用网络教学平台的学习行为历史数据形成前期学生标签信息,同时构建以Flink框架为核心的学生画像后台,获取学生在网络教学平台中的... 在线学习中产生的学习行为数据经过处理后,可更好地支持教师选择个性化的教学策略,达到更佳教学效果。利用网络教学平台的学习行为历史数据形成前期学生标签信息,同时构建以Flink框架为核心的学生画像后台,获取学生在网络教学平台中的实时操作数据,不断补充和更新学生数据,完善学生在线学习的行为画像。将学生画像结果应用于教学策略选择,让教师快速识别学习效果不理想的学生,督促其养成良好的学习习惯,制定个性化的帮扶措施,改进教学设计。 展开更多
关键词 flink 在线学习 聚类分析 个性化教学
下载PDF
基于Flink的电子疾病档案数据处理模型设计与实现
12
作者 刘潇 季英凯 《无线互联科技》 2023年第16期52-56,66,共6页
“十四五”期间,疾控面临着汇集各业务条线的数据以形成动态实时的电子疾病档案的任务。针对现阶段疾控信息化工作的现状,文章基于Flink构建了一个电子疾病档案的实时数据处理模型,使用消息中间件实现各个业务条线数据的发布与订阅。数... “十四五”期间,疾控面临着汇集各业务条线的数据以形成动态实时的电子疾病档案的任务。针对现阶段疾控信息化工作的现状,文章基于Flink构建了一个电子疾病档案的实时数据处理模型,使用消息中间件实现各个业务条线数据的发布与订阅。数据在Flink集群中实现了按主题目录的分流,检查与转换等操作,最终持久化写入HBase数据库,形成以个人信息为基础的各类业务数据的关联。实验与应用结果表明,该模型具有良好的数据处理能力,有效而可靠的实现了电子疾病档案的数据汇集。 展开更多
关键词 电子疾病档案 数据汇集 消息中间件 flink
下载PDF
基于Flink实时预警功能的实现 被引量:3
13
作者 韦统边 吴江波 +2 位作者 苏德 张亮 韦通明 《汽车电器》 2023年第8期49-50,53,共3页
随着各行业业务系统的复杂化和大数据时代的来临,企业对数据实时性的要求也越来越高。本文着重分析数据实时的重要性,不同实时预警功能系统的技术对比,结合企业业务确认架构设计和实现方式,主要对采取基于Flink流处理框架对实时预警功... 随着各行业业务系统的复杂化和大数据时代的来临,企业对数据实时性的要求也越来越高。本文着重分析数据实时的重要性,不同实时预警功能系统的技术对比,结合企业业务确认架构设计和实现方式,主要对采取基于Flink流处理框架对实时预警功能系统的实现展开叙述和总结。 展开更多
关键词 大数据 架构 实时 flink 预警
下载PDF
基于Flume和Flink的轨道交通智能运维数据接收解析系统 被引量:1
14
作者 王诗航 张明昊 +1 位作者 赵运哲 周钰琳 《技术与市场》 2023年第4期86-90,共5页
随着轨道交通智能运维技术的不断发展,越来越多的车载设备将数据通过车载无线通信设备下发至地面服务器进行存储、分析以及可视化显示。通过研究相关大数据技术,提出一种基于日志收集框架Flume和流数据处理引擎Flink的智能运维数据接收... 随着轨道交通智能运维技术的不断发展,越来越多的车载设备将数据通过车载无线通信设备下发至地面服务器进行存储、分析以及可视化显示。通过研究相关大数据技术,提出一种基于日志收集框架Flume和流数据处理引擎Flink的智能运维数据接收解析系统,可在高吞吐量的基础上保证稳定性与实时性。 展开更多
关键词 轨道交通 智能运维 数据接收解析 FLUME flink
下载PDF
基于Flink的分布式并行逻辑回归算法的研究 被引量:1
15
作者 安超广 《长江信息通信》 2023年第4期65-67,共3页
逻辑回归算法作为机器学习领域的经典算法可用于二分类预测、多分类预测。然而在如今的大数据时代,数据规模指数型增长,传统的逻辑回归算法已无法适应大规模数据集的训练,因此需要将逻辑回归算法与大数据计算框架相结合以适应大规模数... 逻辑回归算法作为机器学习领域的经典算法可用于二分类预测、多分类预测。然而在如今的大数据时代,数据规模指数型增长,传统的逻辑回归算法已无法适应大规模数据集的训练,因此需要将逻辑回归算法与大数据计算框架相结合以适应大规模数据集模型训练。针对传统的逻辑回归算法收敛慢、无法处理大规模数据等问题,文章提出了一种基于Flink的分布式并行逻辑回归算法。首先,该算法需将基于随机梯度下降的逻辑回归算法与Flink平台相结合,实现Flink单节点下的逻辑回归算法;其次,通过深入研究分布式随机梯度下降算法(SimuParallelSGD)的数据切分、模型融合、模型训练方式,采用该算法的思想实现了与Flink结合的逻辑回归算法。实验结果表明,结合Flink的逻辑回归算法的并行化,能在对训练精度影响较小的情况下提高训练效率,对比单节点训练时间,多节点平均训练时间减少约82.5%的模型训练时间。 展开更多
关键词 机器学习 并行计算 flink 逻辑回归 大数据
下载PDF
基于Flink的康复策略推荐系统的设计与实现
16
作者 张辽 郭帅 《工业控制计算机》 2023年第8期94-96,共3页
基于Flink框架搭建了肢体障碍患者康复训练处方的推荐系统。通过Flink处理用户信息、康复训练数据和医师制定的康复训练处方等数据,作为推荐系统的原始数据。在Flink平台基于ALS(交替最小二乘)算法训练推荐算法模型,最后在患者每次训练... 基于Flink框架搭建了肢体障碍患者康复训练处方的推荐系统。通过Flink处理用户信息、康复训练数据和医师制定的康复训练处方等数据,作为推荐系统的原始数据。在Flink平台基于ALS(交替最小二乘)算法训练推荐算法模型,最后在患者每次训练结束时为患者推荐个性化训练处方。结果显示,该模型RMSE和MAE分别为0.2861和0.1962,与传统基于用户和基于项目的协同过滤算法相比值更小、准确度较高,推荐效果较好。 展开更多
关键词 矩阵分解 交替最小二乘 flink 协同过滤
下载PDF
Flink水位线动态调整策略
17
作者 吕鹤轩 黄山 +2 位作者 艾力卡木·再比布拉 吴思衡 段晓东 《计算机工程与科学》 CSCD 北大核心 2023年第2期237-245,共9页
衡量大数据的数据挖掘性能有2个最重要的任务指标:一是实时性,二是准确性。流数据从数据产生到消息队列再通过数据源流入Flink进行计算,这个过程中因为网络传输速度不同,不同节点的计算性能不同等原因,流数据进入计算框架的先后顺序和... 衡量大数据的数据挖掘性能有2个最重要的任务指标:一是实时性,二是准确性。流数据从数据产生到消息队列再通过数据源流入Flink进行计算,这个过程中因为网络传输速度不同,不同节点的计算性能不同等原因,流数据进入计算框架的先后顺序和数据产生的事件时间顺序会有局部乱序的现象。面对窗口作业的传统水位线机制在不确定乱序程度的流数据情况下无法同时兼顾作业结果的实时性和准确性。针对这个问题,建立了流数据微簇模型。通过局部乱序度算法,根据流数据微簇的流数据事件时间局部乱序程度计算出可以代表当前时刻流数据的乱序度。设计了水位线动态调整策略,使水位线根据流数据的乱序程度动态调整大小。最后,在Apache Flink框架中对基于事件时间窗口的水位线动态调整策略进行了实现。实验结果表明,弹性或不确定乱序流数据条件下,基于事件时间窗口的水位线动态调整策略可以有效地同时兼顾窗口作业的准确性和实时性。 展开更多
关键词 Apache flink 水位线 乱序流数据 事件时间
下载PDF
基于Flink盒子的远程监测系统的研究
18
作者 王汉文 赵卫 +1 位作者 刘玉健 周松 《工业控制计算机》 2023年第3期84-85,共2页
随着工业自动化技术的发展,起重机的应用领域越来越广泛。轨道式集装箱门式起重机(RMG)在运行过程中存在元器件故障、通讯异常和整机故障等问题,对此提出了一种RMG起重机的运行状态远程监测系统设计方案,采用现场设备端数据采集技术、Fl... 随着工业自动化技术的发展,起重机的应用领域越来越广泛。轨道式集装箱门式起重机(RMG)在运行过程中存在元器件故障、通讯异常和整机故障等问题,对此提出了一种RMG起重机的运行状态远程监测系统设计方案,采用现场设备端数据采集技术、Flink盒子、4G网络和PC端远程监测软件构成远程监测系统,实现对RMG起重机的运行参数和健康状态的远程监测和集中管理,故障实时报警。从而降低了现场工作人员的工作强度,提高了设备的安全管理水平。 展开更多
关键词 RMG 通讯异常 flink盒子 远程监测软件
下载PDF
基于Flink与Kafka的信贷逾期预测系统的设计与实现
19
作者 韦海兰 黄杰 《电脑知识与技术》 2023年第21期49-51,共3页
当前大数据技术方兴未艾,金融业正经历“大数据+金融”的应用架构转型阶段。文章分析了经典机器学习算法在大数据背景下信贷逾期预测应用场景的不足,提出使用Flink实时流计算引擎和kafka实时消息系统进行大数据机器学习的方法,并将CatBo... 当前大数据技术方兴未艾,金融业正经历“大数据+金融”的应用架构转型阶段。文章分析了经典机器学习算法在大数据背景下信贷逾期预测应用场景的不足,提出使用Flink实时流计算引擎和kafka实时消息系统进行大数据机器学习的方法,并将CatBoost算法应用在信贷逾期预测系统中,取得良好效果。 展开更多
关键词 大数据 flink Kafka CatBoost算法
下载PDF
基于Flink和Hadoop的卡口数据分析
20
作者 许森 《交通科技与管理》 2023年第9期4-6,共3页
文章针对传统方式存储与处理大数据的局限性,提出了基于Flink和Hadoop的卡口数据分析方法,通过Flink对原始卡口数据流进行高效的初步处理和异常数据过滤,得到高质量原始卡口数据,采用HBase读写海量卡口数据,利用MapReduce计算指定时间... 文章针对传统方式存储与处理大数据的局限性,提出了基于Flink和Hadoop的卡口数据分析方法,通过Flink对原始卡口数据流进行高效的初步处理和异常数据过滤,得到高质量原始卡口数据,采用HBase读写海量卡口数据,利用MapReduce计算指定时间内所有车辆的路段旅行时间,并利用Mahout中的K-Means进行聚类分析获取有效且符合实际的结果值,通过实验验证,证明方法的有效性和合理性。 展开更多
关键词 大数据 卡口分析 flink HADOOP 分布式框架
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部