看过本文的还看了

相关文献

该作者的其他文献

文献详情 >zk-SNARK中数论变换的硬件加速方法研究 收藏
zk-SNARK中数论变换的硬件加速方法研究

zk-SNARK中数论变换的硬件加速方法研究

作     者:赵海旭 柴志雷 花鹏程 王锋 丁冬 ZHAO Haixu;CHAI Zhilei;HUA Pengcheng;WANG Feng;DING Dong

作者机构:江南大学人工智能与计算机学院江苏无锡214122 江南大学物联网工程学院江苏无锡214122 江苏省模式识别与计算智能工程实验室江苏无锡214122 

基  金:国家自然科学基金(61972180) 江苏省模式识别与计算智能工程实验室项目 

出 版 物:《计算机科学与探索》 (Journal of Frontiers of Computer Science and Technology)

年 卷 期:2024年第18卷第2期

页      码:538-552页

摘      要:简洁非交互式零知识证明能够生成长度固定的证明并快速进行验证,极大地推动了零知识证明在数字签名、区块链及分布式存储等领域的应用。但其证明的生成过程极其耗时且需要被频繁调用,其中数论变换是证明生成过程的主要运算之一。然而现有的通用数论变换硬件加速方法难以满足其在简洁非交互式零知识证明中大规模、高位宽的要求。针对该问题,提出一种数论变换多级流水硬件计算架构。针对高位宽计算需求对高位模运算进行优化,设计了低时延蒙哥马利模乘单元;为了加速大规模计算,通过二维子任务划分将大规模数论变换任务划分为小规模独立子任务,并通过消除数据依赖实现了子任务间计算流水;在子任务多轮蝶形运算之间采用数据重排机制,有效缓解了访存需求并实现了不同步长蝶形运算间的计算流水。所提出的数论变换计算架构可以根据现场可编程门阵列(FPGA)片上资源灵活扩展,方便部署在不同规模的FPGA上以获得最大加速效果。所提出的硬件架构使用高层次综合(HLS)开发并基于OpenCL框架在AMD Xilinx Alveo U50实现了整套异构加速系统。实验结果表明,相比于PipeZK中的数论变换加速模块,该方法获得了1.95倍的加速比;在运行当前主流的简洁非交互式零知识证明开源项目bellman时,相比于AMD Ryzen 95900X单核及12核分别获得了27.98倍和1.74倍的加速比,并分别获得了6.9倍、6倍的能效提升。

主 题 词:现场可编程门阵列(FPGA) 简洁非交互式零知识证明(zk-SNARK) 模乘 数论变换 硬件加速 

学科分类:0839[0839] 08[工学] 081201[081201] 0812[工学-测绘类] 

核心收录:

D O I:10.3778/j.issn.1673-9418.2211075

馆 藏 号:203125803...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分