基于异构计算平台的卷积神经网络部署文献综述

 2022-11-26 16:25:29

摘要

随着计算机视觉的快速发展,深度学习在图像、语音、文本等领域获得了巨大的成功。卷积神经网络更是结合了深度学习技术、人工神经网络和图像局部关联性等特性,能有效提取图像特征,特别适用于计算机视觉任务,在图像分类、物体检测、目标跟踪等任务中取得了显著的成绩。虽然DNN在许多AI任务上提供了最先进的精度,但它以高计算复杂度为代价。 因此,在不牺牲应用程序精度或增加硬件成本的情况下,能够有效处理DNN以提高能效和吞吐量的技术对于在AI系统中广泛部署DNN至关重要。卷积神经网络算法是由大量独立的乘法和加法运算构成,而计算机视觉任务需要高性能计算处理能力,实现卷积神经网络算法的并行运算,对提高算法性能意义重大。FPGA具有很强的并行计算能力,以FPGA为代表的异构计算系统是一种很好的并行运算方案。这种开发方式可以充分发挥卷积神经网络中的并行计算特性,实现卷积神经网络的高性能计算。

在本次毕业设计当中,我希望可以从以下方面入手:理解DNN的关键设计考虑;能够用基准和比较度量来评估不同的DNN硬件实现;在理解各种硬件架构和平台的基础之上加以权衡;能够评估各种DNN设计技术在高效处理方面的应用;并了解最近的今年的发展趋势和形势。

关键词:卷积神经网络;异构计算平台;深度学习;卷积神经网络;机器学习;FGPA

  1. 引言

目前,随着云计算、大数据和人工智能技术的兴起和应用,单靠CPU已经无法满足各行各业的算力需求。海量数据分析、机器学习和边缘计算等场景需要计算架构多样化,需要不同的处理器架构和CPU、NPU和FPGA等异构场景计算技术协同,满足特定领域的算法和专用计算需求。GPU 借助深度学习,走上了历史的舞台,并且正如火如荼的跑者各种各样的业务,从 training 到 inference 都有它的身影。FPGA 也借着这股浪潮,慢慢地走向数据中心,发挥着它的优势。

卷积神经网络是深度学习算法的一种模型,是人工神经网络的一种,对于大型图像处理有出色表现,已经成为了图像识别和语音识别等领域的重点研究方向。该神经网络中的权值共享更加类似于生物的神经网络,这使得网络复杂度变得更低,网络中的权值变得更少。卷积神经网络在处理多维图像时可以直接将图像作为网络的输入,这可以避免传统识别算法中复杂的特征提取和数据重建过程。卷积神经网络层内的很多运算是可以并行进行的,各个层之间也是流水结构,这就可以充分发挥FGPA的优势。同时利用FPGA运算的并行性,可以加快运行速度,降低功率消耗。

2. 研究背景及意义

FGPA是一个处理单元阵列,其中可重构逻辑的功能和内部连线都是可编程的,传统的FPGA使用较小的查找表来实现各种功能,查找表通过可编程的内部连线连接在一起,占到FPGA大部分的面积;近期一些FPGA使用6输入甚至更高输入的查找表组成可编程逻辑。FGPA作为可编程逻辑的一种,不但提供了软件设计的灵活性,而且在性能上也比较接近ASIC。

生物神经网络[1]通常是指由生物的细胞、触点和生物的大脑神经元等组成的神经网络系统,该系统能够产生生物自身意识,进而帮助生物思考和行动。生物神经网络处理信息的过程具有并行和分布的特点,信息被保存在连接之中,大部分信息被存储在神经元突触的髓鞘质层,大量的神经元在分布的网络中并行处理这些信息。人工神经网络或称类神经网络是一种受到生物神经网络的结构和功能启发而来的计算模型,它是一种对生物神经网络完成特定任务和功能的方法进行建模的信息处理系统。从连接的角度来看,人工神经网络是一种由简单非线性处理单元在多层网络之间相互连接的并行和分布式系统,该系统通过学习能够完成特定的任务,比如模式识别或者数据分类等。并行性、模块性和动态适应性是人工神经网络三种典型的计算特征。

虽然大多数神经网络是用软件在通用处理器上实现的,但是通用处理器由于其自身的计算特点导致无法充分挖掘神经网络内在的并行性。目前已有很多硬件实现的神经网络被提出,工业界和学术界进行了大量的体系结构和工艺方面的探索,包括模拟、数字、模拟数字混合、光以及FGPA的实现。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版