期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
编码技术改进大规模分布式机器学习性能综述 被引量:5
1
作者 王艳 李念爽 +1 位作者 王希龄 钟凤艳 《计算机研究与发展》 EI CSCD 北大核心 2020年第3期542-561,共20页
由于分布式计算系统能为大数据分析提供大规模的计算能力,近年来受到了人们的广泛关注.在分布式计算系统中,存在某些计算节点由于各种因素的影响,计算速度会以某种随机的方式变慢,从而使运行在集群上的机器学习算法执行时间增加,这种节... 由于分布式计算系统能为大数据分析提供大规模的计算能力,近年来受到了人们的广泛关注.在分布式计算系统中,存在某些计算节点由于各种因素的影响,计算速度会以某种随机的方式变慢,从而使运行在集群上的机器学习算法执行时间增加,这种节点叫作掉队节点(straggler).介绍了基于编码技术解决这些问题和改进大规模机器学习集群性能的研究进展.首先介绍编码技术和大规模机器学习集群的相关背景;其次将相关研究按照应用场景分成了应用于矩阵乘法、梯度计算、数据洗牌和一些其他应用,并分别进行了介绍分析;最后总结讨论了相关编码技术存在的困难并对未来的研究趋势进行了展望. 展开更多
关键词 编码技术 机器学习 分布式计算 掉队节点容忍 性能优化
下载PDF
面向大规模矩阵乘法的编码计算性能研究
2
作者 王艳 王希龄 +1 位作者 赖宏达 李念爽 《华东交通大学学报》 2021年第3期41-51,共11页
为了更好地使用编码计算提高分布式机器学习算法运行效率,需要对大规模矩阵乘法的编码计算方案性能开销进行充分的研究。该文考察了面向大规模矩阵乘法的编码计算方案的任务完成时间,同时也考虑了所有参与分布式计算的节点总的计算开销... 为了更好地使用编码计算提高分布式机器学习算法运行效率,需要对大规模矩阵乘法的编码计算方案性能开销进行充分的研究。该文考察了面向大规模矩阵乘法的编码计算方案的任务完成时间,同时也考虑了所有参与分布式计算的节点总的计算开销,给出了各个工作节点完成计算任务的时间,均匀分布场景下总的任务完成时间和集群机器总的计算时间的表达式,对比分析了3种编码方案的性能,并通过实验对比了不同情况对任务完成时间与计算节点总计算开销影响,提出了一个启发式算法,提供了不同编码计算方案的选择依据。 展开更多
关键词 编码计算 分布式机器学习 矩阵乘法 掉队节点 性能研究
下载PDF
异构分布式存储系统再生码数据修复的节点选择方案 被引量:9
3
作者 钟凤艳 王艳 李念爽 《计算机科学》 CSCD 北大核心 2019年第8期35-41,共7页
近年来,海量数据的增长给现有的存储系统带来了严峻的挑战,包括存储成本和数据可靠性要求等。纠删码由于在相同的存储开销下可以提供更高的数据可靠性,得到了学术界和工业界的广泛关注。但由于纠删码的编码特性,让使用纠删码的存储系统... 近年来,海量数据的增长给现有的存储系统带来了严峻的挑战,包括存储成本和数据可靠性要求等。纠删码由于在相同的存储开销下可以提供更高的数据可靠性,得到了学术界和工业界的广泛关注。但由于纠删码的编码特性,让使用纠删码的存储系统在数据修复过程中增加了许多其他方面的额外开销,如计算、调度、传输、磁盘读写等。近年来对纠删码数据修复的研究都基于这样一个假定:分布式存储系统中各个节点是无差别的。然而,实际情况是,在大规模的数据中心中,设备替换、硬件故障等原因不仅会导致数据丢失,还会导致数据中心的各个存储节点的存储成本不同,从而使每个存储节点上所存储的数据量并不总是相等,这种现象被称为存储容量异构。存储容量异构场景下的修复过程面临供应节点的选择问题,需要设计一个节点选择策略来降低修复开销,提高存储系统的可靠性和可用性。鉴于实际数据修复过程中参与修复的节点对数据的传输成本不同,提出节点选择策略——树形拓扑修复算法,以降低整个修复过程中的修复成本。仿真结果表明,相对IFR码的固定节点选择策略,文中提出的树形选择策略在平均情况下可以进一步降低数据修复成本。 展开更多
关键词 分布式存储系统 节点异构 再生码 数据修复
下载PDF
异构环境下纠删码的数据修复方法综述 被引量:6
4
作者 钟凤艳 王艳 李念爽 《计算机应用研究》 CSCD 北大核心 2019年第8期2241-2249,2255,共10页
在大规模云存储系统中,由于磁盘或网络故障造成的存储节点失效事件频发,系统需要数据冗余技术以保证数据的可靠性和可用性。目前针对纠删码的冗余数据修复研究大多是无差别地对待每个存储节点,然而在实际分布式存储系统中,节点通常在带... 在大规模云存储系统中,由于磁盘或网络故障造成的存储节点失效事件频发,系统需要数据冗余技术以保证数据的可靠性和可用性。目前针对纠删码的冗余数据修复研究大多是无差别地对待每个存储节点,然而在实际分布式存储系统中,节点通常在带宽资源、计算资源、存储容量资源等方面存在差异性,这些资源的异构性对冗余数据修复性能影响很大。指出了影响修复性能的关键因素,选取带宽开销、磁盘访问开销、修复时间、参与修复的节点数量和修复代价作为修复性能的评价标准;分析了现有研究方法如何降低这五种开销,重点讨论了这些方法的优缺点;阐述了当前异构分布式存储系统中纠删码修复技术的研究现状,并指出了纠删码数据修复技术中尚未解决的一些难题和未来纠删码修复技术可能的发展方向。 展开更多
关键词 存储系统 纠删码 异构 数据修复 性能优化
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部