-
题名基于寄存器的SM4软件优化实现方法
- 1
-
-
作者
陈晨
郭华
刘源灏
龚子睿
张宇轩
-
机构
复杂关键软件环境全国重点实验室
北京航空航天大学网络空间安全学院
-
出处
《密码学报(中英文)》
CSCD
北大核心
2024年第2期427-440,共14页
-
基金
北京市自然科学基金(4202022)
复杂关键软件环境全国重点实验室自主课题(CCSE-2024ZX-06)
校级大学生创新创业训练计划(X202210006242)。
-
文摘
SM4算法的实现效率是密码算法国产化进程中亟需解决的关键问题,许多学者致力于研究如何提升SM4算法的实现速度.比特切片是目前SM4算法软件实现方法中公认速度较高的一种实现方法,它通过在一次加密运算中并行加密多组明文数据的方式,在处理大批量数据时显著提高了SM4算法的实现速度.使用该方法时,每次加密运算前需一次性将多组数据的相同位加载到CPU的寄存器中,由此会带来CPU寄存器与内存之间数据传输的时间开销.为了减小寄存器一次性加载数据的规模,本文对于比特切片方法中的数据编排方式进行了改进,使得每次CPU执行运算时只加载必要的运算数据,从而减少了内存与寄存器之间的交互操作,进一步提高了用比特切片方法实现SM4时的整体加密效率.采用改进后的比特切片方法实现了SM4算法的64组数据并行加解密,该方法的理论加解密速度可达4.1 cycles/byte,经测试在AMD Ryzen75800H平台上加密速率达到了11162Mb/s.该方法对基于比特切片方法设计的对称加密算法软件优化实现方法具有重要参考价值.
-
关键词
SM4算法
比特切片
内存读取
数据编排
-
Keywords
SM4 algorithm
bit-slicing
memory read operations
data arrangement
-
分类号
TP309.7
[自动化与计算机技术—计算机系统结构]
-
-
题名一种基于复合域的国密SM4算法快速软件实现方法
被引量:4
- 2
-
-
作者
陈晨
郭华
王闯
刘源灏
刘建伟
-
机构
北京航空航天大学
密码科学技术国家重点实验室
国防科技大学计算机学院
-
出处
《密码学报》
CSCD
2023年第2期289-305,共17页
-
基金
北京市自然科学基金(4202037)
国家自然科学基金(61972018)。
-
文摘
成为ISO/IEC国际标准算法后,SM4的性能受到更多关注.目前针对SM4算法实现效率提升的方法主要集中在缩短S盒的运算时间,其中采用复合域实现的方法大都基于AES算法实现的复合域,而在GF((2^(4))^(2))上鲜有针对SM4算法软件实现的复合域被提出.本文首次在GF((2^(4))^(2))上找到了一个针对SM4算法S盒软件实现的复合域,给出一种基于复合域的SM4算法快速软件实现方法,使用穷举搜索和数学分析优化了算法S盒的复合域数学构造,构建了同构映射矩阵及其最小化目标函数,仅使用175个门函数就完成了S盒运算,平均每个输出比特占用22个门函数.基于比特切片技术,利用扩展指令集AVX2实现了SM4算法256组消息的并行化加密.每字节加解密平均耗时仅6.5个时钟周期.对硬件依赖程度低,经测试在Intel i5、Intel i7和AMD R7环境下均能显著提升SM4算法的计算效率,对有相似S盒结构的密码算法快速软件实现具有重要的参考价值.
-
关键词
SM4算法
S盒
复合域
比特切片
AVX2扩展指令集
-
Keywords
SM4 algorithm
S-box
composite field
bit slicing
AVX2 extend instructions
-
分类号
TP309.7
[自动化与计算机技术—计算机系统结构]
-