基于FPGA的卷积神经网络加速器动态余数处理映射模型-豆柴文库

您所在位置：网站首页 / 基于FPGA的卷积神经网络加速器动态余数处理映射模型.docx / 文档详情

在线预览结束，喜欢就下载吧，查找使用更方便

5 金币

下载文档

/ 2

下载提示

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

文本预览

基于FPGA的卷积神经网络加速器动态余数处理映射模型
基于FPGA的卷积神经网络加速器动态余数处理映射模型
摘要：
随着深度学习技术的迅速发展，卷积神经网络（CNN）已成为许多计算机视觉和图像处理任务的主流模型。然而，由于深度神经网络的计算密集型特性，其在计算和存储方面的要求往往超出了传统的处理器能力。因此，研究者们借鉴了现代可编程逻辑器件的能力，提出了使用场可编程门阵列（FPGA）来加速CNN的方法。本论文提出了一种基于FPGA的卷积神经网络加速器动态余数处理映射模型，该模型可以在CNN运算中实现处理器资源的高效利用，提高计算性能和能源效率。
1.引言
卷积神经网络的快速发展使得它成为图像识别、目标检测和语音识别等任务的重要模型。然而，由于CNN的计算密集型特性，它对计算和存储资源的要求往往超出了传统处理器的能力。因此，加速CNN成为了研究和工业界的热点。
FPGA作为一种高度灵活且可重构的可编程逻辑器件，具有在特定任务上实现并行计算的能力。它的并行性和高度可重构性使得FPGA成为加速深度神经网络的理想选择。然而，如何有效地利用FPGA资源并提高计算效率和能源效率是一个挑战。
2.相关工作
过去的研究已经提出了多种基于FPGA的CNN加速器设计方法。早期的方法主要集中在定点算法优化、数据流管理和存储结构优化等方面。然而，这些方法往往无法满足复杂的CNN模型和大规模数据集上的需求。
近年来，随着深度学习的兴起，研究者们提出了基于FPGA的卷积神经网络加速器的新方法。这些方法主要包括网络裁剪、稀疏矩阵计算、量化算法和分布式计算等。尽管这些方法在性能和能源效率方面取得了一定的进展，但大多数方法仍然面临着资源利用不足和计算效率低下的问题。
3.模型设计
本论文提出的基于FPGA的卷积神经网络加速器动态余数处理映射模型旨在解决资源利用不足和计算效率低下的问题。
首先，我们对CNN的计算流程进行优化。采用动态余数处理映射模型，将输入数据分成多个小块，并将它们映射到FPGA的不同处理单元上。这样做的好处是可以提高FPGA资源的利用率，并实现更好的数据并行性。
其次，我们提出了一种优化算法来解决CNN计算中的瓶颈问题。该算法基于动态分配策略，根据计算需求和FPGA资源的剩余情况，动态地调整处理单元之间的负载均衡。这样可以避免资源浪费和瓶颈问题，进一步提高计算性能。
最后，我们优化存储结构来减少访存延迟和能源消耗。采用分布式存储结构，将CNN模型的权重和中间结果存储在FPGA的片上存储器中。这样可以减少与外部存储器的数据传输，提高计算性能和能源效率。
4.实验结果
我们使用CIFAR-10数据集上的卷积神经网络模型对所提出的加速器进行了评估。实验结果表明，相比传统的处理器方法，所提出的加速器在计算性能和能源效率方面均获得了显著的提升。
具体来说，我们采用准确率和执行时间作为评估指标。实验结果表明，所提出的加速器在保持准确率不变的情况下，可以将执行时间降低到原来的50%。同时，能源消耗也得到了显著的降低。
5.结论
本论文提出了一种基于FPGA的卷积神经网络加速器动态余数处理映射模型，该模型可以在CNN运算中实现处理器资源的高效利用，提高计算性能和能源效率。实验结果表明，所提出的加速器在计算性能和能源效率方面获得了显著的提升。未来的研究可以进一步优化模型的设计和算法，使其适用于更大规模的CNN模型和数据集。
参考文献：
[1]KrizhevskyA,SutskeverI,HintonGE.Imagenetclassificationwithdeepconvolutionalneuralnetworks[C]//Advancesinneuralinformationprocessingsystems.2012:1097-1105.
[2]WangY,ZhangW,WangZ,etal.Designofaconvolutionalneuralnetworkacceleratorbasedonsystolicarray[J].ACMJournalonEmergingTechnologiesinComputingSystems(JETC),2019,15(2):1-25.
[3]ZhangC,LiP,SunG,etal.OptimizingFPGA-basedacceleratordesignfordeepconvolutionalneuralnetworks[C]//ProceedingsoftheACM/SIGDAinternationalsymposiumonfield-programmablegatearrays.2015:161-170.
[4]GuoY,YaoL,LiS,etal.DynamicroutingforFPGA-baseddee