-
题名基于flink的在线教学学生聚类分析系统的开发
- 1
-
-
作者
罗影
张靓
-
机构
成都航空职业技术学院
-
出处
《成都航空职业技术学院学报》
2023年第4期52-55,60,共5页
-
基金
成都航空职业技术学院自然科研项目“基于flink的学生画像系统的开发与应用研究”(06221034)。
-
文摘
在线学习中产生的学习行为数据经过处理后,可更好地支持教师选择个性化的教学策略,达到更佳教学效果。利用网络教学平台的学习行为历史数据形成前期学生标签信息,同时构建以Flink框架为核心的学生画像后台,获取学生在网络教学平台中的实时操作数据,不断补充和更新学生数据,完善学生在线学习的行为画像。将学生画像结果应用于教学策略选择,让教师快速识别学习效果不理想的学生,督促其养成良好的学习习惯,制定个性化的帮扶措施,改进教学设计。
-
关键词
flink
在线学习
聚类分析
个性化教学
-
Keywords
flink
online learning
cluster analysis
personalized teaching strategies
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于流网络的Flink平台弹性资源调度策略
被引量:15
- 2
-
-
作者
李梓杨
于炯
卞琛
张译天
蒲勇霖
王跃飞
鲁亮
-
机构
新疆大学信息科学与工程学院
新疆大学软件学院
广东金融学院互联网金融与信息工程学院
中国民航大学计算机科学与技术学院
-
出处
《通信学报》
EI
CSCD
北大核心
2019年第8期85-101,共17页
-
基金
国家自然科学基金资助项目(No.61862060,No.61462079,No.61562086,No.61562078)
国家科技部科技支撑基金资助项目(No.2015BAH02F01)
+1 种基金
新疆维吾尔自治区自然科学基金资助项目(No.2017D01A20)
新疆维吾尔自治区高校科研计划基金资助项目(No.XJEDU2016S106)
-
文摘
为了解决大数据流式计算平台中存在计算负载波动上升,但集群无法有效应对负载变化的问题,提出了基于流网络的Flink平台弹性资源调度策略(FAR-Flink)。该策略首先建立流网络模型并通过构建算法计算每条边的容量值,其次通过弹性资源调度算法确定集群性能瓶颈并制定动态资源调度计划,最后通过基于数据分簇和分桶管理的状态数据迁移算法,实施调度计划并完成节点间的高效数据迁移。实验结果表明,该策略在状态数据复杂的应用场景中有较好的优化效果,在满足计算时延约束的前提下提高了集群的吞吐量,缩短了状态数据迁移的时间。由此可见,FAR-Flink策略有效提升了集群对负载波动的响应能力。
-
关键词
流式计算
资源调度
弹性集群
负载迁移
flink
-
Keywords
stream computing
resource scheduling
elastic cluster
load migration
flink
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于异构Flink集群的节点优先级调度策略
被引量:4
- 3
-
-
作者
汪文豪
史雪荣
-
机构
南京工业大学计算机科学与技术学院
盐城师范学院数学与统计学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2022年第3期197-203,共7页
-
基金
国家自然科学基金(11872327)
江苏省高等学校自然科学研究项目(20KJA190001)。
-
文摘
Flink流处理系统默认的任务调度策略在一定程度上忽略了集群异构和节点可用资源,导致集群整体负载不均衡。研究分布式节点的实时性能和集群作业环境,根据实际作业环境的异构分布情况,设计结合异构Flink集群的节点优先级调整方法,以基于Ganglia可扩展分布式集群资源监控系统的集群信息为依据,动态调整适应当前作业环境的节点优先级指数。基于此提出Flink节点动态自适应调度策略,通过实时监测节点的异构状况,并在任务执行过程中根据实时作业环境更新节点优先级指数,为系统任务找到最佳的执行节点完成任务分配。实验结果表明,相比于Flink默认的任务调度策略,基于节点优先级调整方法的自适应调度策略在WorldCount基准测试中的运行时间约平均减少6%,可使异构Flink集群在保持集群低延迟的同时,节点资源利用率和任务执行效率更高。
-
关键词
flink集群
异构集群
负载不均衡
节点优先级
自适应调度
-
Keywords
flink cluster
heterogeneous cluster
load unbalancing
node priority
adaptive scheduling
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于Flink平台的K-Means算法
被引量:1
- 4
-
-
作者
蔡鲲鹏
李澄非
田果
-
机构
五邑大学信息工程学院
-
出处
《信息技术》
2019年第3期75-78,共4页
-
文摘
对于K-Means算法在数据聚类时存在的K值敏感问题,基于密度分布的特性,采用核密度并针对大数据处理的需求,基于Flink平台对算法进行并行化处理。通过对比查准率、误差平方和,以及在串行和集群化处理中的加速比、任务执行时间等,并结合Flink平台的并行化计算优势,结果表明,算法在处理海量数据时具有较好的稳定性和高效性。
-
关键词
K-MEANS
聚类
核密度
flink
-
Keywords
K-Means
clustering
kernel density
flink platform
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名分布式环境中的多作业执行调度策略与优化
被引量:6
- 5
-
-
作者
季航旭
姜苏
赵宇海
吴刚
王国仁
-
机构
东北大学计算机科学与工程学院
北京理工大学计算机学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2021年第6期951-961,共11页
-
基金
科技部重点研发项目(2018YFB1004402)。
-
文摘
分布式大数据计算引擎是科研机构、互联网企业和政府部门处理大规模数据必不可少的工具,它们的使用和推广促进了各个领域的快速发展,为社会进步做出了巨大贡献。但是,在多作业处理的情况下,目前主流的大数据计算引擎在资源分配和作业调度方面仍有许多不足之处,它们通常对多作业平均划分内存资源并以先进先出FIFO的方式调度作业,这样简单的资源划分方式和作业调度机制并不能充分利用系统性能。针对此问题,从计算引擎的作业层面做出了改进:在资源划分方面,通过提取作业特征对作业的任务量进行预估,判断作业任务量和作业预分配资源间的差异,合并对集群资源浪费较高的作业,充分利用计算资源;在作业调度方面,对作业池中的作业进行特征提取,使用多路K-means算法对作业进行聚类分析,然后基于分析的结果,使用自平衡轮询调度算法对作业进行调度,达到负载均衡的目的。为了验证所提算法的有效性,使用大规模文本数据集在分布式集群环境中进行对比实验,实验结果表明,提出的作业合并算法和多作业调度算法可以减少5%~23%的作业运行时间,提高了7.5%~29%的系统吞吐量,在最好情况下可减少40%的线程启动数。
-
关键词
分布式
作业合并
聚类
轮询调度
flink
-
Keywords
distributed
job merging
cluster
polling scheduling
flink
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于流处理改进的SK-means策略
被引量:1
- 6
-
-
作者
姜晓艳
张伟
王佳慧
马利民
-
机构
北京信息科技大学计算机学院
北京信息科技大学北京材料基因工程高精尖创新中心
国家信息中心
-
出处
《北京信息科技大学学报(自然科学版)》
2021年第5期51-56,共6页
-
基金
北京材料基因工程高精尖创新中心项目(KYJJ2016005)。
-
文摘
针对大规模数据场景下K-means聚类算法存在总体速度较慢的问题,提出了一种基于大数据流计算框架Apache Flink,并结合流处理思想的SK-means策略。从算法优化方面,采用流处理的思想在数据读入的过程中确定聚类的初始聚类中心;从实现方案上,选用Apache Flink框架设计了一种基于SK-means策略的优化方案,分析该策略对聚类效果和耗时的影响。实验结果表明:该策略在数据量较大的场景中有较好的优化效果,不需要预先假设出聚类数量和初始聚类中心的具体值,有效地降低了聚类迭代次数,降低了整体计算耗时。
-
关键词
聚类算法
K-MEANS
流处理
大数据
Apache
flink
-
Keywords
clustering algorithm
K-means
stream processing
big data
Apache flink
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-