文献综述(或调研报告):
今年来,自动人脸识别成为模式识别和图像处理领域的一个研究热点[1]。文献调查显示,人脸检测是指在输入图片中确定人脸的位置及大小的过程。一个完整的人脸识别系统包括人脸检测和人脸识别两个模式识别的过程[3]。人脸检测作为人脸识别的前期准备工作,其检测的效果和准确率对于后续的人脸识别有着重要的影响;而人脸识别是一种基于人的相貌特征信息进行身份认证的生物特征识别技术,集成了人工智能,机器识别,机器学习,模型理论,视频图像处理等多种专业技术和成果。
历史上的人脸检测和识别技术主要经历了以下三个大的发展阶段:机械化识别阶段,人脸识别技术的研究期,人脸识别技术商业化发展阶段[2]。
1965年到1990年是人脸识别的初级阶段,也被称作机械化识别阶段,这一阶段主要采用基于人脸几何结构特征的方法对人脸进行检测,集中体现在人们对剪影的研究上。人们在面部剪影曲线的结构特征提取与分析方面进行了大量的研究[3]。但这种检测和识别模式对待处理的图像的要求太高,不具有很好的实际应用价值,因此这一研究阶段的研究成果不是很多[15]。
1991年到1997年是人脸识别研究非常活跃的重要时期,也被称为人脸识别技术的研究期,这一阶段可谓是硕果累累[4]。美国麻省理工学院的Turk和Pentland提出了这一时期内最负盛名的“特征脸”(Eigenface),之后有许多基于该方法的研究。Brunelli和Poggio在1992年对基于结构特征的方法和基于模板匹配的方法进行了实验对比,并给出了模板匹配方法较优异的明确结论。该时期内,美国军方还组织了著名的FERET人脸识别算法测试,极大促进了人脸识别算法的改进以及算法的实用化[5]。
1998年至今,被称为人脸识别技术的商业化发展阶段,研究者开始针对非理想条件下的人脸识别进行研究。光照、姿态等问题逐渐成为研究热点[6]。随之发展起来的基于三维特征的人脸识别对光照和姿态有较好的鲁棒性[9]。人脸识别的商业化进一步发展。美国军方在FERET测试的基础上非别于2000年和2002年组织了两次商业系统测评。基于3D模型的人脸建模与识别以及基于深度学习的人脸识别方法也成为了一个发展方向[7]。
而经过50余年的发展,在人脸检测和识别领域也形成了较为成熟的一些算法,这些算法经过几代人不断的改进和完善,经过了实践的检验,是具有较高检测率和识别率的领域内通用算法[7]。而本课题的一个核心任务就是要对这些检测算法和识别算法进行研究,并实现在FPGA上的运行。下面分别对Haar特征检测算法和Eigen,Fisher,LBP识别算法进行调研综述。
Haar-like特征最早是由Papageorgiou等应用于人脸表示,Viola和Jones在此基础上,使用3种类型4种形式的特征。Haar特征分为三类:边缘特征、线性特征、中心特征和对角线特征,组合成特征模板[8]。特征模板内有白色和黑色两种矩形,并定义该模板的特征值为白色矩形像素和减去黑色矩形像素和。常用的Haar特征模板如左图所示Haar特征值反映了图像的灰度变化情况。例如:脸部的一些特征能由矩形特征简单的描述,如:眼睛要比脸颊颜色要深,鼻梁两侧比鼻梁颜色要深,嘴巴比周围颜色要深等。但矩形特征只对一些简单的图形结构,如边缘、线段较敏感,所以只能描述特定走向(水平、垂直、对角)的结构。
如左图所示,进行相关的Haar特征示例计算和操作演示分析, 对于图中的A, B和D这类特征,特征数值计算公式为:v=Sum白-Sum黑,而对于C来说,计算公式如下:v=Sum白-2*Sum黑;之所以将黑色区域像素和乘以2,是为了使两种矩形区域中像素数目一致。 通过改变特征模板的大小和位置,可在图像子窗口中穷举出大量的特征[3]。上图的特征模板称为“特征原型”;特征原型在图像子窗口中扩展(平移伸缩)得到的特征称为“矩形特征”;矩形特征的值称为“特征值”。 矩形特征可位于图像任意位置,大小也可以任意改变,所以矩形特征值是矩形模版类别、矩形位置和矩形大小这三个因素的函数。故类别、大小和位置的变化,使得很小的检测窗口含有非常多的矩形特征,例如:在24*24像素大小的检测窗口内矩形特征数量可以达到16万个。接下来需要通过积分图快速计算数量庞大的特征(值)(2)通过AdaBoost算法来训练进而确定哪些矩形特征对于分类器分类是最有效的。完成这两步之后就基本可以实现人脸基于Haar-Like的人脸识别算法。
Eigenface特征识别方法是将人脸识别推向真正可用的第一种方法,其过程框图如左图所示,其中主要分为五个步骤。第一步是获取我们所需识别的人脸图像的集合S。每张图像可以转换成一个N维的向量,然后把这些向量放到一个集合S里面。
