视频中运动目标检测技术研究文献综述

 2022-11-22 15:59:28
{title}{title}

1 研究背景

对于给定的视频序列,运动目标检测就是通过识别目标的物理运动,将感兴趣的运动目标从周围环境中分离出来。[1]对于得到的目标,我们可以进行后续的提取、分类、识别、跟踪等进一步的处理来获取我们所需要的信息或满足我们应达到的要求。因此,运动目标检测是运动分析的基础。近年来,随着诸多学者研究的逐渐深入,运动目标检测在国家和社会公共安全、航空航天等重要领域以及很多民用领域开始发挥举足轻重的作用,在目标跟踪、人机交互、交通管控、视频检索等领域都有其实践价值。然而,基于不同环境条件下复杂的影响因素,寻求一种通用的运动目标检测方法的道路并不平坦,学者们在前人的基础上不断改进创新,提出更好的检测方法,以期获得更高的性能。

2 运动目标检测的常用方法

目前常用的目标检测方法有帧间差分法、背景减除法、光流法以及各算法的改进、变形。这几种属于基于运动检测的目标跟踪算法,主要通过检测序列图像中目标和背景的不同运动来发现目标存在的区域,实现跟踪,不需要帧间的模式匹配或在帧间传递目标的运动参数,只需要突出目标和非目标在时域或者空域的区别即可。这类算法具有检测多个目标的能力,可用于多目标检测和跟踪。[2]为了综合展示每种方法的特点,图表1[3]对三种方法各方面性能作了比较。

检测方法

目标信息

背景

先验知识

复杂度

准确度

背景减除法

运动

静态

需要

较高

较低

帧间差分法

运动

静、动态

不需要

较低

较低

光流法

运动、结构

静、动态

不需要

较高

Table 1常用目标检测方法比较

2.1 背景减除法

背景减除法是目前最常用的目标检测方法之一,主要应用于固定摄像机的场合之中(即静态背景)。背景减除法的原理是将当前帧与背景图像进行差分来得到运动目标区域。一般情况下,由于运动目标在灰度上与背景灰度存在着很明显的差异,这使得差分后的图像只在目标区域出现较大的灰度值,进一步通过阈值分割可以得到运动目标区域[4]。背景减除法的实现流程如图1所示[5]。这种方法的性能依赖于背景模型的构建,背景建模的准确程度直接影响到检测的效果。由于背景的动态性、光照、阴影等因素的影响难以控制,建立一个尽可能多的满足各种复杂场景的背景模型十分困难。

Figure 1背景减除法实现流程图

在此基础上, Wren等人提出了运动高斯平均法,这种方法对像素的灰度值分布采用单高斯分布近似,并且每个像素的高斯分布是独立的,利用对灰度值的统计更新模型参数[6]。由于使用单一的高斯分布对背景进行描述,因此该方法只适用于背景较稳定的场合。为了适应背景的多模态特性,Stauffer等提出了混合高斯模型GMM( Gaussian Mixture Model),该模型使用多个不同权重的单高斯模型联合建模[7],但仍存在模型构建复杂、计算量大等缺点。

此外,学者们为提高效率还提出了基于核密度估计的算法、贝叶斯模型、 码本法、基于中值滤波器、基于卡尔曼滤波器的背景建模法等。

2.2 帧间差分法

帧间差分法是一种通过对相邻连续两帧或三帧做差来检测是否存在物体运动变化的一种方法,也称为帧差法。它将图像序列中连续帧中所有对应位置的像素值进行相减,得到帧间差分图像。然后将其与给定的阂值进行比较,如果差值大于阈值,则认为该像素为目标像素,否则为背景像素。最后输出的图像就是把背景和前景区分开的二值图像,再通过对二值图像的后续处理,确定目标在图像上的位置。帧差法的一般实现流程如图2所示。

Figure 2帧间差分法实现流程图

帧差法实现简单,计算复杂度低,具有较好的实时性。算法对场景中光线的缓慢变化不太敏感,对于动态环境具有较强的自适应性。该方法比较适用于检测精度要求不高、实时性要求较高的场合。但是两帧差分法也存在一些缺点,目标运动速度越大,检测出的区域就越大,可能将一个运动目标误检测为两个目标。当目标表面存在大的灰度均匀的区域时,在运动实体内部容易产生“空洞”现象。在此基础上提出了三帧差分法,通过对三帧图像中两对相邻图像分别进行差分,使得检测结果更精确。文献[8]提出了基于边缘特征和多帧差分法的运动目标检测算法,在目标检测的过程中不需要进行建模和更新,拥有思路简单,易于实现,检测结果精准,实时性好等特点。

2.3 光流法

Gibson于1950年首先提出了光流的概念。光流是指运动物体在空间的观察成像平面上的像素运动的瞬时速度。由于在空间中,运动可以用运动场来表示,而在一个图像平面上,物体的运动往往是通过图像序列中不同图像灰度分布的不同体现的。因此,空间中运动场投影到图像上我们就称之为光流场,光流场反映了图像上每一个点的运动趋势[9]

基于光流计算基本等式的孔径问题,Horn和Schunck提出了经典的基于全局平滑的稠密光流法;Lucas和Kanade提出了基于局部平滑的稀疏光流法。

光流法的优点在于不需要知道场景的背景信息也能够检测出运动目标,适用于动态背景,但由于采用迭代方法,计算复杂度高,在算法的效率和精度上仍有待提升。

3 总结

本文总结了视频中运动目标检测的三种基本算法。通过上面的总结和实验仿真,我们可以总结出三种基本算法的优点和缺点。光流法可以获取运动物体的运动特征,但是该算法计算复杂,容易受到光照变化等因素的影响,鲁棒性差;帧差法计算过程简单,所以运算速度快,对动态环境自适应性很强,但是在检测运动速度过快或过慢的物体时准确率不令人满意;背景差分法可以提供完整的运动目标特征数据、运算简单、精确度和灵敏度高,但是背景差分法的阈值选择较为复杂,并且它对动态场景的变化比较敏感,难以获得准确的检测结果。三种算法各有优缺点,由于视频监控系统的复杂性,在实际的应用系统设计中,应根据具体情况,选取适当的特征以及相应的运动目标检测算法。

参 考 文 献

  1. Hu Wei-ming, Tan Tie-niu, Wang Liang, et al. A Survey on Visual Surveillance of Object Motion and Behaviors [J]. IEEE Trans. On Systems, Man, and Cybernetics-Part C: Applications and Reviews, Aug. 2004,34(3):334-352.
  2. 蔡荣太,吴元昊,王明佳,吴庆祥.视频目标跟踪算法综述 [J]. 电视技术, 2010,34(350), 12 137-140 144.
  3. 慈文彦. 运动目标检测方法综述[J]. 信息技术,2016(12):93-100.
  4. 宋佳声. 视频序列图像中运动目标检测与跟踪算法研究 [D]. 华南理工大学, 2014.
  5. 王玲玲. 视频运动目标检测算法的研究 [D]. 西北师范大学, 2016.
  6. Wren, C.R., et al., Pfinder: real-time tracking of the human body. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1997. 19; 19(7; 7): p. 780-785.
  7. 李彤. 智能视频监控下的多目标跟踪技术研究 [D]. 中国科学技术大学, 2013.
  8. 火元莲,秦梅,宋亚丽. 基于边缘特征和多帧差分法的运动目标检测算法 [J]. 红外技术, 2017,39(290), 02 59-64.
  9. 胡金金. 基于光流法的运动目标快速跟踪算法研究 [D]. 西安电子科技大学, 2014.

1 研究背景

对于给定的视频序列,运动目标检测就是通过识别目标的物理运动,将感兴趣的运动目标从周围环境中分离出来。[1]对于得到的目标,我们可以进行后续的提取、分类、识别、跟踪等进一步的处理来获取我们所需要的信息或满足我们应达到的要求。因此,运动目标检测是运动分析的基础。近年来,随着诸多学者研究的逐渐深入,运动目标检测在国家和社会公共安全、航空航天等重要领域以及很多民用领域开始发挥举足轻重的作用,在目标跟踪、人机交互、交通管控、视频检索等领域都有其实践价值。然而,基于不同环境条件下复杂的影响因素,寻求一种通用的运动目标检测方法的道路并不平坦,学者们在前人的基础上不断改进创新,提出更好的检测方法,以期获得更高的性能。

2 运动目标检测的常用方法

目前常用的目标检测方法有帧间差分法、背景减除法、光流法以及各算法的改进、变形。这几种属于基于运动检测的目标跟踪算法,主要通过检测序列图像中目标和背景的不同运动来发现目标存在的区域,实现跟踪,不需要帧间的模式匹配或在帧间传递目标的运动参数,只需要突出目标和非目标在时域或者空域的区别即可。这类算法具有检测多个目标的能力,可用于多目标检测和跟踪。[2]为了综合展示每种方法的特点,图表1[3]对三种方法各方面性能作了比较。

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版