期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
RISC-V向量指令集的Yolov3移植优化
被引量:
1
1
作者
王宇木
潘志铭
+4 位作者
吴鹏飞
付维
田乐兰
李桂润
孙轶群
《单片机与嵌入式系统应用》
2021年第12期20-25,30,共7页
为研究SIMD在嵌入式领域中对处理器性能的提升效果,选择一种并行化程度较高的图像处理算法Yolov3进行SIMD向量化移植。根据开源指令集RISC-V扩展指令集中的V(Vector)指令集修改Yolov3算法的代码,将其部署到优矽科技自研的WH64处理器的VP...
为研究SIMD在嵌入式领域中对处理器性能的提升效果,选择一种并行化程度较高的图像处理算法Yolov3进行SIMD向量化移植。根据开源指令集RISC-V扩展指令集中的V(Vector)指令集修改Yolov3算法的代码,将其部署到优矽科技自研的WH64处理器的VPU(Vector Processor Unit)中验证;结合Amdahl定律和Yolov3自测程序评估SIMD算法提升的性能。实验结果表明,在Xilinx的Kintex7板上以50 MHz主频运行,在向量化算法占比90%以上时,SIMD处理过后的代码程序达到了标量计算2.25x的加速比。
展开更多
关键词
SIMD优化
Yolov3算法移植
RISC-V向量指令集
AMDAHL定律
WH64处理器
下载PDF
职称材料
RISC-V向量指令集的Compute Library函数库移植
被引量:
4
2
作者
叶锡聪
庄灿锋
+4 位作者
王宇木
吴鹏飞
潘志铭
廖力灵
孙轶群
《单片机与嵌入式系统应用》
2021年第1期8-13,共6页
ARM Compute Library是一类针对ARM Cortex-A系列CPU处理器和ARM Mali系列GPU特定优化的软件算法函数库,内部实现了卷积滤波器、卷积神经网络等算法,并且使用Cortex-A CPU NEON、Mali GPU的SIMD技术加速算法运行。RISC-V指令集作为一种...
ARM Compute Library是一类针对ARM Cortex-A系列CPU处理器和ARM Mali系列GPU特定优化的软件算法函数库,内部实现了卷积滤波器、卷积神经网络等算法,并且使用Cortex-A CPU NEON、Mali GPU的SIMD技术加速算法运行。RISC-V指令集作为一种开源的指令集,目前发布了相对稳定的SIMD指令集版本,并且C-SKY开源了支持v0.7.1 intrinsics的GCC和QEMU。在这些基础上,本文尝试将ARM Compute Library函数库移植至支持RISC V向量指令集,其中函数移植的核心思想是在不修改源文件的前提下,通过编写一个头文件,用宏定义把ARM NEON向量类型接口逐一替换成RISC-V intrinsics中定义的向量类型和向量函数接口。
展开更多
关键词
Compute
Library
RISC-V
向量指令集
函数库移植
QEMU
ARM
下载PDF
职称材料
题名
RISC-V向量指令集的Yolov3移植优化
被引量:
1
1
作者
王宇木
潘志铭
吴鹏飞
付维
田乐兰
李桂润
孙轶群
机构
深圳
大学电子与信息工程学院
深圳优矽科技有限公司
出处
《单片机与嵌入式系统应用》
2021年第12期20-25,30,共7页
文摘
为研究SIMD在嵌入式领域中对处理器性能的提升效果,选择一种并行化程度较高的图像处理算法Yolov3进行SIMD向量化移植。根据开源指令集RISC-V扩展指令集中的V(Vector)指令集修改Yolov3算法的代码,将其部署到优矽科技自研的WH64处理器的VPU(Vector Processor Unit)中验证;结合Amdahl定律和Yolov3自测程序评估SIMD算法提升的性能。实验结果表明,在Xilinx的Kintex7板上以50 MHz主频运行,在向量化算法占比90%以上时,SIMD处理过后的代码程序达到了标量计算2.25x的加速比。
关键词
SIMD优化
Yolov3算法移植
RISC-V向量指令集
AMDAHL定律
WH64处理器
Keywords
SIMD optimization
porting of Yolov3
RISC-V vector instruction set
Amdahl's law
WH64 processor
分类号
TP312 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
RISC-V向量指令集的Compute Library函数库移植
被引量:
4
2
作者
叶锡聪
庄灿锋
王宇木
吴鹏飞
潘志铭
廖力灵
孙轶群
机构
深圳优矽科技有限公司
深圳
大学
出处
《单片机与嵌入式系统应用》
2021年第1期8-13,共6页
文摘
ARM Compute Library是一类针对ARM Cortex-A系列CPU处理器和ARM Mali系列GPU特定优化的软件算法函数库,内部实现了卷积滤波器、卷积神经网络等算法,并且使用Cortex-A CPU NEON、Mali GPU的SIMD技术加速算法运行。RISC-V指令集作为一种开源的指令集,目前发布了相对稳定的SIMD指令集版本,并且C-SKY开源了支持v0.7.1 intrinsics的GCC和QEMU。在这些基础上,本文尝试将ARM Compute Library函数库移植至支持RISC V向量指令集,其中函数移植的核心思想是在不修改源文件的前提下,通过编写一个头文件,用宏定义把ARM NEON向量类型接口逐一替换成RISC-V intrinsics中定义的向量类型和向量函数接口。
关键词
Compute
Library
RISC-V
向量指令集
函数库移植
QEMU
ARM
Keywords
Compute Library
RISC-V
vector instruction set
function library imgration
QEMU
ARM
分类号
TP31 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
RISC-V向量指令集的Yolov3移植优化
王宇木
潘志铭
吴鹏飞
付维
田乐兰
李桂润
孙轶群
《单片机与嵌入式系统应用》
2021
1
下载PDF
职称材料
2
RISC-V向量指令集的Compute Library函数库移植
叶锡聪
庄灿锋
王宇木
吴鹏飞
潘志铭
廖力灵
孙轶群
《单片机与嵌入式系统应用》
2021
4
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部