文献综述:
前言:
人脸识别是模式识别的重要研究方向,在理论研究和实际应用上都有很高的价值和发展空间。其定义是对于给定的人脸图像,分析数据库中已有的图像信息,然后识别出这个图像中人脸身份的过程。稀疏表示是人脸识别领域的一个重要发展方向,能够依照稀疏表示快速准确地完成人脸识别,具有较高的鲁棒性。
本课题采用鲁棒性稀疏表示分类方法进行人脸识别,并针对人脸识别中特征值选取和遮挡两个问题提出了新的思路。查阅文献主要依据了中国知网和学位论文全文数据库等,搜索关键词为”稀疏表示“和”人脸识别“,共搜索到12,181篇论文,其中有直接参考价值的约25篇。
正文:
- 引言:
人脸识别的过程是,首先通过将样本人脸图像进行采集计算分析,然后建立人脸分类器,完成对人脸的识别,最后确定出需要鉴定的人的身份。人脸识别的技术可靠性高,稳定性好,方便用户的身份验证。基于这些优点,有关人脸识别的探索具备了重要的科研价值和非常大的发展前途[[1]]。
人脸识别技术的产生可以追溯到上个世纪,但直到九十年代人脸识别技术才得到迅速发展和广泛应用。人脸识别是一个涉及到多学科的极富挑战性的前沿课题,人脸数据采集和识别会受到人脸表情、姿势、光照及遮挡等的影响。人脸的结构组成使得人类可以产生丰富的面部表情,如何通过计算机技术对面部表情进行处理成为人脸识别技术中必须解决的重要问题之一[[2]]。而人脸图像作为高维图像的一个子空间,其各个像素点之间有着很强的相关性,对图像进行降维处理和特征提取之后就很容易对图像数据进行操作。现已应用的正脸人脸识别算法可以大致分为:基于集合特征的人脸识别算法、基于代数特征的人脸识别算法、基于隐马尔可夫模型的人脸识别算法、基于机器学习的人脸识别算法以及基于压缩感知理论的人脸识别算法[[3]]。
- 稀疏表示
稀疏表示是目前信号领域非常重要的研究成果,它是一种基于最小化范数的优化方法。稀疏线性表示相对于一个过完备的基本元素和信号原子字典的算法计算问题掀起了兴趣的浪潮,其中令人兴奋的原因大多集中在一个发现上:只要根据图像得到的表示足够稀疏,它就可以有效地进行凸优化计算,虽然一般情况下比较困难[[4]]。采用稀疏表示算法进行的人脸识别,对人脸图像的表情、光照变化、以及局部遮挡和面部妆饰等因素具有良好的鲁棒性。稀疏表示理论的核心问题包括稀疏表示算法设计以及字典的构建等。字典可以很好地表示信号,但是它的过完备性使得在字典中用最小的原子集来表示信号是一个NP(Non-deterministic Polynomial,非确定性多项式)难问题,在过去的几年里,许多学者对这一问题进行了深入研究,提出了获取信号稀疏表示的逼近方法[[5]],这些方法使得稀疏表示变得更加准确和高效,在稀疏表示的人脸识别算法中也可以根据根据所处理的数据库的选择不同的逼近方法来针对某一特定目的。
稀疏表示的最初目的是为了用比香农定力更低的采样率来表示和压缩信号[[6]]。事实上JPEG2000压缩编码标准的成功主要就归功于自然图像小波系数的稀疏性[[7]]。传统的信号表示方法是把信号分解为一组正交基函数的线性组合,而稀疏表示则是利用字典把信号表示成少量原子的线性组合,通过选择很少的数据样本就能达到较为出色的表示效果。稀疏表示的基本思想源于压缩感知,但是与之不同的是,稀疏表示中的字典是通过迭代的训练过程训练得到。但是追根溯源,两者是同一个问题,都是解决约束条件l1范数的最小化问题[[8]]。在过去的几年,稀疏表示已经成功应用于解决信号处理、模式识别等实际问题,各种相关算法也得到了进一步研究和发展。
- 人脸识别中的鲁棒性
如同前文中提到,人脸识别因为拍照者或者图片本身的环境不同,经常会有各种干扰因素,比较常见的有光照、噪声、遮挡、表情等,导致许多较为传统的人脸识别系统无法在较多变的环境中保持较高的识别率,这些系统的鲁棒性也普遍不高。但在面对这些问题时,稀疏表示的识别方法具有良好的重构性能,使得系统具有稳健的鲁棒性[[9]]。与现有多数方法相比,稀疏表示人脸识别算法(Sparse Representation-based Classifier, SRC)直接利用了高维数据分布的基本特性即稀疏性进行统计推断,可以有效地应对维数灾难问题。同时,SRC方法直接利用原始像素进行人脸识别,可以有效地避免各种预处理过程通过选择合适的训练图像(不同光照和表情)并利用稀疏信号对损毁像素建模,SRC方法可以有效地应对光照变化、表情变化局部遮挡等问题,具有良好的鲁棒性[[10]]。
