[转载] RISC-V 向量指令集的 Yolov3 移植优化

为研究SIMD在嵌入式领域中对处理器性能的提升效果,选择一种并行化程度较高的图像处理算法Yolov3进行SIMD向量化移植。根据开源指令集RISC-V扩展指令集中的V(Vector)指令集修改Yolov3算法的代码,将其部署到优矽科技自研的WH64处理器的VPU(Vector Processor Unit)中验证;结合Amdahl定律和Yolov3自测程序评估SIMD算法提升的性能。实验结果表明,在Xilinx的Kintex7板上以50 MHz主频运行,在向量化算法占比90%以上时,SIMD 处理过后的代码程序达到了标量计算2.25x的加速比。

https://mp.weixin.qq.com/s/eEPJBTi-KfUJdZp9vJ6pTA

4 个赞