- 文献综述(或调研报告):
车辆检测识别,作为智能交通系统(ITS)的一大关键领域,也是近年来备受重视的一个研究领域。目前应用于车辆检测识别的方法大致可分为两大类。一类是基于传感器检测的汽车检测识别方法,如磁阻传感器检测[1]等。这种方法能获得的信息十分有限,受环境干扰的影响较大,维护比较困难。另一类是基于图像识别的汽车检测识别方法,是一种对图像进行分析,再应用机器视觉技术识别出图像中的车辆并获取其数据的方法,是目标检测技术的一个方向。也是目前智能化浪潮下主流的研究和应用方向。
传统的识别方法是基于特征描述进行识别,比如轮廓匹配[2],Gabor SURF[3],多特征金字塔[4]等,这种方法存在识别车辆不同角度的图像或者被部分遮挡的图像时表现较差,并且时间复杂度较高等问题。但在深度学习技术尤其是卷积神经网络技术的飞速发展之下,传统的基于特征描述的检测识别逐渐被基于神经网络的检测识别取代。
早在2006年Geoffrey Hinton就提出了深度学习(Deep Learning)的概念[5],在2012年的ILSVERC2012大规模图像分类竞赛中,深度卷积神经网络AlexNet就表现出了神经网络在特征学习和目标识别方面的巨大潜力[6].不仅在分类任务中取得了第一名,甚至比使用人工设计特征结合分类器方法的第二名在误差上降低了接近10个百分点。神经网络能够通过训练数据学习特征,而不需要人工设计特征。之后,2014年Ross Girshick等人提出了基于区域建议的R-CNN框架[7].尽管R-CNN因为反复在每个候选区域上提取特征,非常繁琐以至于检测速度很慢,但是它在检测的准确性上取得了很大的进步。之后,2015年,Girshick等人把SPPNet[8]和R-CNN相结合,提出了Fast R-CNN[9],训练和检测的速度有了大幅度的提高。紧接着,Shaoqing Ren、Kaiming He和Girshick等人又提出了Faster R-CNN算法[10]。Faster R-CNN使用Region Proposal Network(RPN)替代selective search,把区域建议,特征提取,目标确认和目标定位几大板块糅合到了一个神经网络框架里,并大大提高了检测速度和检测精度。Faster R-CNN的识别精度达到了时下顶尖的级别,速度也很快,已经成为目前主流的目标检测方法。但是其速度仍然不能满足实时性的要求。2016年,Joseph和Girshick等人提出了YOLO(You Look Only Once)算法[11],这个算法没有延续R-CNN系列的区域建议思想,而是采用回归思想,得出目标的位置和类别仅需一次前向传播即可。因此它的速度非常快,但是正确率和定位精度略差一些,特别是在检测小目标的时候表现更差。继而,Wei Liu等人同年又提出了SSD(Single Shot MultiBox Detector)算法[12],在YOLO算法的基础上,结合了Faster R-CNN的anchor机制,几乎不损失速度,又提高了精确度。2017年,Joseph和Ali等人又提出了YOLO v2(YOLO9000)[13],在YOLO的基础上,引入了Darknet-19等一些改进。2018年,Joseph和Ali等人又提出了YOLOv3[14],YOLOv3引进了多尺度预测以及新的骨干网络Darknet-53等多项改进,很大程度上弥补了该算法在小目标检测方面的不足,并且使得YOLOv3的整体性能得到了提升。
地面交通图像来源主要是架设在道路上摄像头和手持影像设备,道路摄像头在交通监测管理中应用十分广泛,快速而准确地识别摄像头获取的图像中的车辆,对于交通监管十分有助益。在文献[15]中,阮航,孙涵等人用车辆数据库对Faster R-CNN进行训练,得到检测车辆的网络,用这个网络检测图像中的车辆目标,并将检测到的车辆输入改进的车辆属性识别网络中,对检测得到的车辆颜色、品牌和姿态等属性进行推断.结果表明基于Faster R-CNN的车辆多属性识别方法能充分学习不同属性间的特征。在文献[16]中,朱锋彬,应娜等人把一个轻量级的建议网络嵌入在提取基本特征之后,以产生候选区域,并在早期预处理,丢弃不可能的区域候选框,再采用特征融合技术提取H-yper特征,并对不同层特征进行串联。据结果表明,平均检测质量比Faster R-CNN高9.91%。在文献[17]中,郜雨桐,宁慧等人用选择性搜索方法得出候选区域,之后用融合算法结合边框回归算法,提取出真实车辆区域,再用卷积神经网络提取特征,识别出车辆型号。这些方法都能有效识别道路摄像头拍摄到的车辆。
如果要获取大范围的交通数据和车辆分布等信息,可以从高分辨率遥感图像中获取,这对车辆的宏观调控具有重大意义。文献[18]张勇,牛成磊,谷正气等人通过提取SURF特征和支持向量机(SVM)相结合的方法,来提取高分辨率遥感影像中的车辆信息,测试结果表明,处理时间在分钟级别,错误率低于20%,具有一定的工程适用性。文献[19]中,高鑫,李慧,张义等人在Faster R-CNN的基础上提出DF R-CNN模型,该模型把特征提取模块里的深层和浅层特征图统一到一个较高的分辨率下,再融合产生融合特征图,相比于Faster R-CNN,DF R-CNN在密集区域的检测精度有明显提高。
地面图像细节特征充足,即时性好,但移动性较差,范围很小,无法做到区域范围内车辆信息的整体把控;遥感图像范围足够大,但即时性差,受环境影响大,且分辨率不够高,获取成本也高。近年来,无人机(UAV)由于其便携,易操作,低成本,视野范围大等优点,逐渐在交通状况和车辆分布数据等的获取方面有广泛的应用,使用无人机拍摄的航空图像能有有效填补地面图像和遥感图像之间的空白。基于无人机航空图像的车辆识别,能有快速有效地掌握区域车辆分布特征以及道路状况等,对及时定位交通事故发生地,掌握区域车辆运行状况,引导交通拥堵的车辆等有很大作用。在文献[20]中,Yongzheng Xu, Guizhen Yu等人使用用低空无人机影像对Faster R-CNN进行了训练并检测,测试表明,Faster R-CNN能够很好地克服光照环境和汽车朝向等的影响,但检测速度不够理想,更适合于停车场的车辆检测。在文献[21]中,梅超等通过提取图像边缘,光流和局部特征点,并结合三者实现无人机对车辆的检测和跟踪,据实验结果,其车辆检测误差低于3.9%,车辆跟踪误差低于2.1%。在文献[22]中,Ammour和Alhichri等人先将无人机图像分割成小区域,然后从这些区域里挖掘描述性特征,并使用深度卷积神经网络(CNN)结合支持向量机(SVM)从这些区域里识别出汽车。
无人机作为近年来表现出色的航空图像采集设备,尽管具有巨大前景,但它的发展时间还不够长,其应用开发和资源积累还不充足,并且对于基于无人机的航空图像识别研究也还不够完善,尤其在识别的即时性方面还有待进步。然而新兴的YOLOv3算法准确性高,识别速度极快,但却鲜有将YOLOv3算法运用到车辆检测领域的研究。因此,基于YOLOv3算法的无人机航空图像识别,在智能交通系统中有巨大的应用潜力。
参考文献:
