zk-SNARK中数论变换的硬件加速方法研究被引量：2

Hardware Acceleration of Number Theoretic Transform in zk-SNARK

下载PDF

导出

摘要简洁非交互式零知识证明能够生成长度固定的证明并快速进行验证,极大地推动了零知识证明在数字签名、区块链及分布式存储等领域的应用。但其证明的生成过程极其耗时且需要被频繁调用,其中数论变换是证明生成过程的主要运算之一。然而现有的通用数论变换硬件加速方法难以满足其在简洁非交互式零知识证明中大规模、高位宽的要求。针对该问题,提出一种数论变换多级流水硬件计算架构。针对高位宽计算需求对高位模运算进行优化,设计了低时延蒙哥马利模乘单元;为了加速大规模计算,通过二维子任务划分将大规模数论变换任务划分为小规模独立子任务,并通过消除数据依赖实现了子任务间计算流水;在子任务多轮蝶形运算之间采用数据重排机制,有效缓解了访存需求并实现了不同步长蝶形运算间的计算流水。所提出的数论变换计算架构可以根据现场可编程门阵列(FPGA)片上资源灵活扩展,方便部署在不同规模的FPGA上以获得最大加速效果。所提出的硬件架构使用高层次综合(HLS)开发并基于OpenCL框架在AMD Xilinx Alveo U50实现了整套异构加速系统。实验结果表明,相比于PipeZK中的数论变换加速模块,该方法获得了1.95倍的加速比;在运行当前主流的简洁非交互式零知识证明开源项目bellman时,相比于AMD Ryzen 95900X单核及12核分别获得了27.98倍和1.74倍的加速比,并分别获得了6.9倍、6倍的能效提升。 The proof in zk-SNARK has a fixed length and can be verified quickly,promoting the application of zero-knowledge proof in areas such as digital signature,blockchain,distributed storage,and outsourced computing.How-ever,the generation of proofs is time-consuming and frequently used.As a result,NTT(number theoretic trans-form),one of the most time-consuming parts in proof-generation,needs to be accelerated significantly.However,the existing general NTT hardware acceleration methods cannot meet the requirements of large-bitwidth and large-scale in zk-SNARK.To address this issue,this paper proposes a highly pipelined architecture for NTT.First of all,large-bitwidth modular arithmetic is optimized and low-latency Montgomery modular multiplication hardware unit is de-signed.And then,the large-scale NTT tasks are divided into smaller sub-tasks through two-dimensional partitioning,which improves the parallelism of NTT computation and eliminates the data dependence among sub-tasks,thus reali-zing the pipeline among sub-tasks.Finally,the“data reordering”technique is introduced among multiple rounds of butterfly operations in a sub-task,which effectively alleviates the memory access requirements,thus realizing the bottom-level pipeline in each sub-task,among butterfly operations with different step sizes.This architecture can be flexibly scaled to different scales of FPGAs.The accelerator is prototyped on the AMD-Xilinx Alveo U50 card(UltraScale+XCU50 FPGA).To balance computing efficiency and flexibility,the OpenCL equipped with high-level synthesis(HLS)is used to implement the system.The evaluation results show that the NTT module performs 1.95 times faster than the one in PipeZK and the accelerator achieves 27.98 and 1.74 times speedup,6.9 and 6 times ener-gy efficiency improvement than AMD Ryzen 95900X respectively,when it is integrated into the well-known ZKP open-source project,bellman.

作者赵海旭柴志雷花鹏程王锋丁冬 ZHAO Haixu;CHAI Zhilei;HUA Pengcheng;WANG Feng;DING Dong(School of Artificial Intelligence and Computer Science,Jiangnan University,Wuxi,Jiangsu 214122,China;School of Internet of Things Engineering,Jiangnan University,Wuxi,Jiangsu 214122,China;Jiangsu Provincial Engineering Laboratory of Pattern Recognition and Computational Intelligence,Wuxi,Jiangsu 214122,China)

机构地区江南大学人工智能与计算机学院江南大学物联网工程学院江苏省模式识别与计算智能工程实验室

出处《计算机科学与探索》 CSCD 北大核心 2024年第2期538-552,共15页 Journal of Frontiers of Computer Science and Technology

基金国家自然科学基金(61972180) 江苏省模式识别与计算智能工程实验室项目。

关键词现场可编程门阵列(FPGA) 简洁非交互式零知识证明(zk-SNARK) 模乘数论变换硬件加速 field programmable gate array(FPGA) zero-knowledge succinct non-interactive arguments of knowl-edge(zk-SNARK) modular multiplication number theoretic transform hardware acceleration

分类号 TP309.7 [自动化与计算机技术—计算机系统结构] TP338 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献7

1李威翰,张宗洋,周子博,邓燚.简洁非交互零知识证明综述[J].密码学报,2022,9(3):379-447. 被引量：15
2单进勇,高胜.区块链理论研究进展[J].密码学报,2018,5(5):484-500. 被引量：31
3黄平,梁伟洁.一种基于QAP问题的ZK-SNARK新协议[J].华南理工大学学报（自然科学版）,2021,49(1):1-9. 被引量：2
4周慧凯,华蓓.同态加密的硬件卸载及其在隐私保护计算中的应用[J].小型微型计算机系统,2021,42(3):595-600. 被引量：9
5沈耀坡,梁煜,张为.一种高性能快速傅里叶变换的硬件设计[J].西安电子科技大学学报,2018,45(3):63-67. 被引量：8
6谢星,黄新明,孙玲,韩赛飞.大整数乘法器的FPGA设计与实现[J].电子与信息学报,2019,41(8):1855-1860. 被引量：11
7崔西宁,杨经纬,叶宏,戴小氐.椭圆曲线密码的优化设计方法[J].西安电子科技大学学报,2015,42(1):69-74. 被引量：3

二级参考文献21

1Koblitz N. A Course in Number Theory and Cryptography[M]. Heidelberg: Springer-Verlag, 1994.
2Miller V. Uses of Elliptic Curves in Cryptography[C]//Advances in Cryptology CRYPTO'85, Lecture Notes in Computer Science. Heidelberg: Springer, 1986: 417-426.
3Namal S, Georgantas K, Gurtov A. Lightweight Authentication and Key Management on 802.11 with Elliptic Curve Cryptography[C]//IEEE Wireless Communications and Networking Conference. Piscataway: IEEE, 2013: 1830-1835.
4Kodali R K, Budwal H S. High Performance Scalar Multiplication for ECC[C]//International Conference on Computer Communication and Informatics. Piscataway: IEEE, 2013: 1-4.
5Lopez J, Dahab R. Improved Algorithms for Elliptic Curve Arithmetic in GF(2<sup>n</sup>)[C]//Lecture Notes In Computer Science: 1556. Heidelberg: Springer, 1988: 201-212.
6Lu C Y, Jen S M, Laih C S. A General Framework of Side-Channel Atomicity for Elliptic Curve Scalar Multiplication[J]. IEEE Transactions on Computers, 2013, 62(3): 428-438.
7Lopez J, Dahab R. Fast Multiplication on Elliptic Curves over GF (2m) without Pre Computation[C]//Workshop on Cryptographic Hardware and Embedded Systems. Heidelberg: Springer, 1999: 316-327.
8Certicom Research. Standards for Efficient Cryptography[S]. SEC 2: Recommended Elliptic Curve Domain Parameters, 2000.
9丁勇.一种用椭圆曲线密码构建的传感网络密钥管理方案[J].西安电子科技大学学报,2008,35(4):739-742. 被引量：5
10吴金红,曹建,赵岩.基于FPGA的OFDM改进调制解调器设计[J].计算机测量与控制,2010,18(12):2815-2817. 被引量：2

共引文献71

1袁文婧.区块链技术在供应链金融的创新应用研究[J].经济研究导刊,2020(3):85-85. 被引量：3
2李杺恬,郭翔宇,宁黄江,李世斌.区块链技术在工业互联网中的应用及网络安全风险分析[J].工业技术创新,2021,8(2):37-42. 被引量：10
3毛保磊,慕德俊,胡伟,张慧翔,邰瑜,张璐.RSA时间信道滑动窗口攻击方法及量化分析[J].西安电子科技大学学报,2017,44(5):114-120. 被引量：9
4李志宏,邱亭谕,李可欣.基于区块链技术的学分银行系统研究[J].现代教育技术,2019,29(7):120-126. 被引量：31
5张锦涛,雷杰,吴凌云,黄碧莹,李云松.一种改进的高光谱端元提取算法及其FPGA实现[J].西安电子科技大学学报,2019,46(4):22-27. 被引量：1
6李燕,马海英,王占君.区块链关键技术的研究进展[J].计算机工程与应用,2019,55(20):13-23. 被引量：59
7林谊东,陈乃金.二维网格型粗粒度可重构系统乘法器和全加器设计与验证[J].绵阳师范学院学报,2020,39(2):86-92. 被引量：1
8刘如意,李金保,李旭东.区块链在农产品流通中的应用模式与实施[J].中国流通经济,2020,34(3):43-54. 被引量：81
9马超群,孔晓琳,林子君,李登佳,匡先华,周中定,李平,吴刚.区块链技术背景下的金融创新和风险管理[J].中国科学基金,2020,34(1):38-45. 被引量：20
10沈艺琳.基于环签名的数字货币隐私保护技术研究[J].经济视野,2020,0(4):156-157.

同被引文献8

1柳欣,徐秋亮.改进的支持暂停匿名用户服务的电子现金系统[J].计算机应用研究,2016,33(10):3099-3104. 被引量：1
2张峰,翟季冬,陈政,林甲灶,杜小勇.面向异构融合处理器的性能分析、优化及应用综述[J].软件学报,2020,31(8):2603-2624. 被引量：10
3李龚亮,贺东博,郭兵,路松峰.基于零知识证明的区块链隐私保护算法[J].华中科技大学学报（自然科学版）,2020,48(7):112-116. 被引量：18
4周慧凯,华蓓.同态加密的硬件卸载及其在隐私保护计算中的应用[J].小型微型计算机系统,2021,42(3):595-600. 被引量：9
5王后珍,郭岩,张焕国.基于矩阵填充问题的高效零知识身份认证方案[J].武汉大学学报（理学版）,2021,67(2):111-117. 被引量：2
6刘红,张靖宇,雷梦婷,肖云鹏.基于区块链的公平和可验证电子投票智能合约[J].应用科学学报,2023,41(4):541-562. 被引量：2
7景旭,杨少坤.面向联盟链转账隐私保护的^(+)HomElG零知识证明协议[J].工程科学与技术,2023,55(5):272-282. 被引量：1
8吴昊天,李一凡,崔鸿雁,董琳.基于零知识证明和区块链的联邦学习激励方案[J].信息网络安全,2024(1):1-13. 被引量：2

引证文献2

1王锋,柴志雷,花鹏程,丁冬,王宁.基于GPU的zk-SNARK中多标量乘法的并行计算方法[J].计算机应用研究,2024,41(6):1735-1742.
2丁冬,李正权,柴志雷.PreNTT:面向zk-SNARK的数论变换计算并行加速方法[J].计算机应用研究,2024,41(10):3059-3067.

1赵二虎,吴济文,肖思莹,晋振杰,徐勇军.嵌入式异构智能计算系统并行多流水线设计[J].电子学报,2023,51(11):3354-3364.
2蔡委哲,杨东华,邱晗,潘奇.基于分布式架构的显控技术研究与实现[J].计算机测量与控制,2024,32(1):79-84.
3张祺,薛峰.OpenHarmony与泛动画元素的融合探究——动画专业微课程建设思考[J].电影评介,2023(21):53-57.
4党博,党宁军.基于5G网络的智能电网保护系统设计[J].无线互联科技,2023,20(24):42-44. 被引量：1
5韩绪仓,陈波涛,曹伟琼,陈华,李昊远.基于线性判别分析的模幂掩码模板攻击方法[J].电子学报,2023,51(11):3024-3032.
6杨龙飞,卢仕,彭旷.基于流水线的RSA加密算法硬件实现[J].电子技术应用,2024,50(1):66-70. 被引量：1
7无.室中隔的血液供应[J].解剖学报,1966(2):147-153.
8清华学者合作开发超高速光电计算芯片[J].大众科学,2023(11):18-19.
9孙道远,李涛.基于全息RIS的太赫兹MIMO信道估计研究[J].长春工程学院学报（自然科学版）,2023,24(4):25-31.
10曾文坦,叶龙建,翟雄飞,韩国军.基于单调排序与并行选择的连续删除堆栈译码器的硬件实现[J].广东工业大学学报,2024,41(1):101-109.

计算机科学与探索

2024年第2期

浏览历史

内容加载中请稍等...

zk-SNARK中数论变换的硬件加速方法研究被引量：2

参考文献7

二级参考文献21

共引文献71

同被引文献8

引证文献2

相关作者

相关机构

相关主题

浏览历史

zk-SNARK中数论变换的硬件加速方法研究 被引量：2

参考文献7

二级参考文献21

共引文献71

同被引文献8

引证文献2

相关作者

相关机构

相关主题

浏览历史

zk-SNARK中数论变换的硬件加速方法研究被引量：2