期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
RISC-V向量指令集的Yolov3移植优化 被引量:1
1
作者 王宇木 潘志铭 +4 位作者 吴鹏飞 付维 田乐兰 李桂润 孙轶群 《单片机与嵌入式系统应用》 2021年第12期20-25,30,共7页
为研究SIMD在嵌入式领域中对处理器性能的提升效果,选择一种并行化程度较高的图像处理算法Yolov3进行SIMD向量化移植。根据开源指令集RISC-V扩展指令集中的V(Vector)指令集修改Yolov3算法的代码,将其部署到优矽科技自研的WH64处理器的VP... 为研究SIMD在嵌入式领域中对处理器性能的提升效果,选择一种并行化程度较高的图像处理算法Yolov3进行SIMD向量化移植。根据开源指令集RISC-V扩展指令集中的V(Vector)指令集修改Yolov3算法的代码,将其部署到优矽科技自研的WH64处理器的VPU(Vector Processor Unit)中验证;结合Amdahl定律和Yolov3自测程序评估SIMD算法提升的性能。实验结果表明,在Xilinx的Kintex7板上以50 MHz主频运行,在向量化算法占比90%以上时,SIMD处理过后的代码程序达到了标量计算2.25x的加速比。 展开更多
关键词 SIMD优化 Yolov3算法移植 RISC-V向量指令集 AMDAHL定律 WH64处理器
下载PDF
RISC-V向量指令集的Compute Library函数库移植 被引量:4
2
作者 叶锡聪 庄灿锋 +4 位作者 王宇木 吴鹏飞 潘志铭 廖力灵 孙轶群 《单片机与嵌入式系统应用》 2021年第1期8-13,共6页
ARM Compute Library是一类针对ARM Cortex-A系列CPU处理器和ARM Mali系列GPU特定优化的软件算法函数库,内部实现了卷积滤波器、卷积神经网络等算法,并且使用Cortex-A CPU NEON、Mali GPU的SIMD技术加速算法运行。RISC-V指令集作为一种... ARM Compute Library是一类针对ARM Cortex-A系列CPU处理器和ARM Mali系列GPU特定优化的软件算法函数库,内部实现了卷积滤波器、卷积神经网络等算法,并且使用Cortex-A CPU NEON、Mali GPU的SIMD技术加速算法运行。RISC-V指令集作为一种开源的指令集,目前发布了相对稳定的SIMD指令集版本,并且C-SKY开源了支持v0.7.1 intrinsics的GCC和QEMU。在这些基础上,本文尝试将ARM Compute Library函数库移植至支持RISC V向量指令集,其中函数移植的核心思想是在不修改源文件的前提下,通过编写一个头文件,用宏定义把ARM NEON向量类型接口逐一替换成RISC-V intrinsics中定义的向量类型和向量函数接口。 展开更多
关键词 Compute Library RISC-V 向量指令集 函数库移植 QEMU ARM
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部