文献综述(或调研报告):
本毕业设计主要涉及对TensorFlow框架的使用,AlexNet卷积神经网络的搭建和应用,以及CNN和其他图像处理算法的对比。本部分将介绍国内外先前对TensorFlow,AlexNet以及各图像处理算法的研究,以及卷积神经网络发展的现状。
3.1 TensorFlow
TensorFlow是2015年11月9日谷歌推出的开源机器学习框架。TensorFlow使用数据流图将计算表示为独立的指令之间的依赖关系。这可生成低级别的编程模型,在该模型中,首先定义数据流图,然后创建TensorFlow会话,就可以在在一组本地和远程设备上运行图的各个部分[1]。相当多的用户已经转向TensorFlow。这些用户依靠TensorFlow进行研究和生产,其任务多种多样,例如在手机上运行计算机视觉模型的推理,以及使用数百个示例记录对数千亿个参数进行深层神经网络的大规模训练[2]。尤其是基于梯度的机器学习算法大大受益于TensorFlow自动求微分的能力。作为TensorFlow用户,只需要定义预测模型的结构,将这个结构和目标函数结合在一起,并添加数据,TensorFlow将自动计算相关的微分导数[3]。因此,TensorFlow已经成为世界上最受欢迎的开源机器学习框架,它支持的语言有C 、Python,它具有快速、灵活并适合产品级大规模应用等特点,同时TensorFlow也支持多系统,主要的支持系统有Linux、MACOSX、Windows等,TensorFlow让每个开发者和研究者都能方便地使用人工智能来解决多样化的挑战[4]。
3.2 卷积神经网络
3.2.1 发展现状
卷积神经网络是神经网络的一种,目前已成为当前语音分析和图像识别领域的研究热点。它的权值共享网络结构使之更类似于生物神经网络,降低了网络模型的复杂度,减少了权值的数量。该优点在网络的输入是多维图像时表现的更为明显,使图像可以直接作为网络的输入,避免了传统识别算法中复杂的特征提取和数据重建过程[5]。而且卷积网络对于物体形状特征的提取和分析不易受到物体翻转、倾斜和位移的影响,因此被广泛运用于包括二维和三维图像识别[6-8]。21世纪开始,卷积神经网络就被成功的大量用于检测、分割和物体识别等计算机视觉的各个领域。这些应用都是使用了大量的有标签的数据,比如人脸识别[9]、全图像分类[10]和物体检测识别[11]等。所有的这些应用都是基于深度卷积神经网络在特征提取方面的有效性,和其他算法相比具有明显的优越性。
3.2.2 AlexNet
