介绍一款基于FPGA的CNN硬件加速器IP
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
介绍一款基于FPGA的CNN硬件加速器IP
随着人工智能(AI)的不断发展,它已经从早期的人工特征工程进化到现在
可以从海量数据中学习,机器视觉、语音识别以及自然语言处理等领域都取得
了重大突破。
CNN(Convolutional Neural Network,卷积神经网络)在人工智能领域受到越来越多的青睐,它是深度学习技术中极具代表性的网络结构之一,尤其在图像处
理领域取得了很大的成功。随着网络变得越来越大、越来越复杂,我们需要大
量的计算资源来对其进行训练,因此人们纷纷将注意力转向FPGA(Field Programmable Gate Array,现场可编程门阵列)器件,FPGA 不仅具有软件的可编程性和灵活性,同时又有ASIC 高吞吐和低延迟的特性,而且由于具有丰富
的I/O 接口,FPGA 还非常适合用作协议和接口转换的芯片。
近日KORTIQ 公司推出了一款Xilinx FPGA 的CNN 加速器IP——AIScale,
它能够利用实现训练好的CNN 网络,比如行业标准的ResNet、AlexNet、Tiny Yolo 和VGG-16 等,并将它们进行压缩输出二进制描述文件,可以部署到
Xilinx 全系列可编程逻辑器件上。Zynq SoC 和Zynq UltraScale+ MPSoC 器件PS 可以提供数据给AIScale CNN 加速器(PL),经过分类处理将输出数据给PS。压缩后的CNN 网络占用资源相对小很多,可以部署在片上存储器中,可
以更快更灵活的切换CNN 网络。
图1:AIScale 在计算机视觉应用案例示意图
AIScale 加速器的核心是AIScale RCC(Re-configurable Compute Core),用户根据需求可以灵活自定义AIScale RCC 模块的数量,AIScale RCC 支持卷积预处理、池化/采样、加权和全连接层等处理。资源更丰富的Zynq SoC 和UltraScale+ MPSoC 可以集成更多的AIScale RCC 模块,这会给AIScale 加速器