-
题名一种基于4Bit编码的深度学习梯度压缩算法
被引量:1
- 1
-
-
作者
蒋文斌
符智
彭晶
祝简
-
机构
华中科技大学计算机科学与技术学院大数据技术与系统国家工程研究中心
-
出处
《计算机科学》
CSCD
北大核心
2020年第7期220-226,共7页
-
基金
国家自然科学基金(61672250)。
-
文摘
对梯度数据进行压缩,是一种减少多机间通信开销的有效方法,如MXNet系统中的2Bit方法等。但这类方法存在一个突出的问题,即过高的压缩比会导致精度及收敛速度下降,尤其是对规模较大的深度神经网络模型。针对上述问题,提出了一种新的4Bit梯度压缩策略。该方法采用4个比特位表示一个具体的梯度值(通常为32位的浮点数)。相对于2Bit,该方法能够对梯度值进行更细粒度的近似,从而提高训练结果的准确率和收敛性。进一步地,根据网络模型每一层梯度特性的不同,选择不同的近似阈值,使得压缩后的数值更合理,从而进一步加快模型的收敛速度并提高最终准确率;具体地,兼顾操作的方便性和分布的合理性,根据每层梯度特性的不同,设置3组不同的阈值,以满足不同层梯度差异化特性的需求。实验结果表明,使用多组阈值的4Bit梯度压缩策略虽然在加速方面略逊于2Bit方法,但其准确率更高,实用性更强,能够在保持模型更高精度的前提下减少分布式深度学习系统的通信开销,这对于在资源受限环境下实现性能更好的深度学习模型非常有意义。
-
关键词
深度学习
梯度压缩策略
分布式训练
-
Keywords
Deep learning
Gradient compression strategy
Distributed training
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-