-
题名Spark协同过滤算法扩展性测试与分析
被引量:2
- 1
-
-
作者
沈雯婷
刘财政
孙磊
李慧
许利杰
王伟
-
机构
中国科学院软件研究所软件工程技术研究开发中心
中国科学院大学计算机与控制学院
中国科学院软件研究所计算机科学国家重点实验室
天津神舟通用数据技术有限公司天津市海量数据处理技术实验室
-
出处
《计算机工程与设计》
北大核心
2019年第6期1574-1579,共6页
-
基金
国家自然科学基金项目(61572480)
北京市重大基金项目(D171100003417002)
-
文摘
机器学习算法的线性扩展性要求算法的计算性能随节点数增加保持接近线性增长。针对当前ALS算法扩展性测试的不足,提出一种多维度扩展性测试方法,通过横向测试进行扩展性测试,使用纵向测试确定扩展性瓶颈。结合真实数据集在Spark MLlib上进行测试,实验结果表明,该算法对节点敏感,会出现任务聚集到某个节点上的问题,同时随着任务并行度增加,算法执行时间增加,效率降低。
-
关键词
分布式机器学习算法
交替最小二乘法
扩展性
多维度测试
测试发现
-
Keywords
distributed machine learning algorithm
ALS
scalability
multi-dimensional testing
testing-findings
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-