期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于flink的在线教学学生聚类分析系统的开发
1
作者 罗影 张靓 《成都航空职业技术学院学报》 2023年第4期52-55,60,共5页
在线学习中产生的学习行为数据经过处理后,可更好地支持教师选择个性化的教学策略,达到更佳教学效果。利用网络教学平台的学习行为历史数据形成前期学生标签信息,同时构建以Flink框架为核心的学生画像后台,获取学生在网络教学平台中的... 在线学习中产生的学习行为数据经过处理后,可更好地支持教师选择个性化的教学策略,达到更佳教学效果。利用网络教学平台的学习行为历史数据形成前期学生标签信息,同时构建以Flink框架为核心的学生画像后台,获取学生在网络教学平台中的实时操作数据,不断补充和更新学生数据,完善学生在线学习的行为画像。将学生画像结果应用于教学策略选择,让教师快速识别学习效果不理想的学生,督促其养成良好的学习习惯,制定个性化的帮扶措施,改进教学设计。 展开更多
关键词 flink 在线学习 聚类分析 个性化教学
下载PDF
基于流网络的Flink平台弹性资源调度策略 被引量:15
2
作者 李梓杨 于炯 +4 位作者 卞琛 张译天 蒲勇霖 王跃飞 鲁亮 《通信学报》 EI CSCD 北大核心 2019年第8期85-101,共17页
为了解决大数据流式计算平台中存在计算负载波动上升,但集群无法有效应对负载变化的问题,提出了基于流网络的Flink平台弹性资源调度策略(FAR-Flink)。该策略首先建立流网络模型并通过构建算法计算每条边的容量值,其次通过弹性资源调度... 为了解决大数据流式计算平台中存在计算负载波动上升,但集群无法有效应对负载变化的问题,提出了基于流网络的Flink平台弹性资源调度策略(FAR-Flink)。该策略首先建立流网络模型并通过构建算法计算每条边的容量值,其次通过弹性资源调度算法确定集群性能瓶颈并制定动态资源调度计划,最后通过基于数据分簇和分桶管理的状态数据迁移算法,实施调度计划并完成节点间的高效数据迁移。实验结果表明,该策略在状态数据复杂的应用场景中有较好的优化效果,在满足计算时延约束的前提下提高了集群的吞吐量,缩短了状态数据迁移的时间。由此可见,FAR-Flink策略有效提升了集群对负载波动的响应能力。 展开更多
关键词 流式计算 资源调度 弹性集群 负载迁移 flink
下载PDF
基于异构Flink集群的节点优先级调度策略 被引量:4
3
作者 汪文豪 史雪荣 《计算机工程》 CAS CSCD 北大核心 2022年第3期197-203,共7页
Flink流处理系统默认的任务调度策略在一定程度上忽略了集群异构和节点可用资源,导致集群整体负载不均衡。研究分布式节点的实时性能和集群作业环境,根据实际作业环境的异构分布情况,设计结合异构Flink集群的节点优先级调整方法,以基于G... Flink流处理系统默认的任务调度策略在一定程度上忽略了集群异构和节点可用资源,导致集群整体负载不均衡。研究分布式节点的实时性能和集群作业环境,根据实际作业环境的异构分布情况,设计结合异构Flink集群的节点优先级调整方法,以基于Ganglia可扩展分布式集群资源监控系统的集群信息为依据,动态调整适应当前作业环境的节点优先级指数。基于此提出Flink节点动态自适应调度策略,通过实时监测节点的异构状况,并在任务执行过程中根据实时作业环境更新节点优先级指数,为系统任务找到最佳的执行节点完成任务分配。实验结果表明,相比于Flink默认的任务调度策略,基于节点优先级调整方法的自适应调度策略在WorldCount基准测试中的运行时间约平均减少6%,可使异构Flink集群在保持集群低延迟的同时,节点资源利用率和任务执行效率更高。 展开更多
关键词 flink集群 异构集群 负载不均衡 节点优先级 自适应调度
下载PDF
基于Flink平台的K-Means算法 被引量:1
4
作者 蔡鲲鹏 李澄非 田果 《信息技术》 2019年第3期75-78,共4页
对于K-Means算法在数据聚类时存在的K值敏感问题,基于密度分布的特性,采用核密度并针对大数据处理的需求,基于Flink平台对算法进行并行化处理。通过对比查准率、误差平方和,以及在串行和集群化处理中的加速比、任务执行时间等,并结合Fl... 对于K-Means算法在数据聚类时存在的K值敏感问题,基于密度分布的特性,采用核密度并针对大数据处理的需求,基于Flink平台对算法进行并行化处理。通过对比查准率、误差平方和,以及在串行和集群化处理中的加速比、任务执行时间等,并结合Flink平台的并行化计算优势,结果表明,算法在处理海量数据时具有较好的稳定性和高效性。 展开更多
关键词 K-MEANS 聚类 核密度 flink
下载PDF
分布式环境中的多作业执行调度策略与优化 被引量:6
5
作者 季航旭 姜苏 +2 位作者 赵宇海 吴刚 王国仁 《计算机工程与科学》 CSCD 北大核心 2021年第6期951-961,共11页
分布式大数据计算引擎是科研机构、互联网企业和政府部门处理大规模数据必不可少的工具,它们的使用和推广促进了各个领域的快速发展,为社会进步做出了巨大贡献。但是,在多作业处理的情况下,目前主流的大数据计算引擎在资源分配和作业调... 分布式大数据计算引擎是科研机构、互联网企业和政府部门处理大规模数据必不可少的工具,它们的使用和推广促进了各个领域的快速发展,为社会进步做出了巨大贡献。但是,在多作业处理的情况下,目前主流的大数据计算引擎在资源分配和作业调度方面仍有许多不足之处,它们通常对多作业平均划分内存资源并以先进先出FIFO的方式调度作业,这样简单的资源划分方式和作业调度机制并不能充分利用系统性能。针对此问题,从计算引擎的作业层面做出了改进:在资源划分方面,通过提取作业特征对作业的任务量进行预估,判断作业任务量和作业预分配资源间的差异,合并对集群资源浪费较高的作业,充分利用计算资源;在作业调度方面,对作业池中的作业进行特征提取,使用多路K-means算法对作业进行聚类分析,然后基于分析的结果,使用自平衡轮询调度算法对作业进行调度,达到负载均衡的目的。为了验证所提算法的有效性,使用大规模文本数据集在分布式集群环境中进行对比实验,实验结果表明,提出的作业合并算法和多作业调度算法可以减少5%~23%的作业运行时间,提高了7.5%~29%的系统吞吐量,在最好情况下可减少40%的线程启动数。 展开更多
关键词 分布式 作业合并 聚类 轮询调度 flink
下载PDF
基于流处理改进的SK-means策略 被引量:1
6
作者 姜晓艳 张伟 +1 位作者 王佳慧 马利民 《北京信息科技大学学报(自然科学版)》 2021年第5期51-56,共6页
针对大规模数据场景下K-means聚类算法存在总体速度较慢的问题,提出了一种基于大数据流计算框架Apache Flink,并结合流处理思想的SK-means策略。从算法优化方面,采用流处理的思想在数据读入的过程中确定聚类的初始聚类中心;从实现方案上... 针对大规模数据场景下K-means聚类算法存在总体速度较慢的问题,提出了一种基于大数据流计算框架Apache Flink,并结合流处理思想的SK-means策略。从算法优化方面,采用流处理的思想在数据读入的过程中确定聚类的初始聚类中心;从实现方案上,选用Apache Flink框架设计了一种基于SK-means策略的优化方案,分析该策略对聚类效果和耗时的影响。实验结果表明:该策略在数据量较大的场景中有较好的优化效果,不需要预先假设出聚类数量和初始聚类中心的具体值,有效地降低了聚类迭代次数,降低了整体计算耗时。 展开更多
关键词 聚类算法 K-MEANS 流处理 大数据 Apache flink
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部