1 引言 运动目标跟踪是计算机视觉研究的核心内容之一,是一项融合图像处理、模式识别、人工智能、自动控制等多种不同领域先进成果的高技术课题,它从包含运动目标的图像序列中检测、识别、跟踪并对其行为进行理解和描述,而跟踪技术是其重要技术之一[1]。所谓目标跟踪,就是在一段图像序列的每一帧图像中找到所感兴趣的目标所处的位置。 人脸跟踪作为目标跟踪的一个小领域,在近年来越来越多的受到人们的关注,它是人脸识别、视频检索、虚拟游戏和图形控制的一项关键技术,并且因其巨大的应用前景和市场潜力,已成为计算机视觉研究的一个热点[2]。大部分的研究开始转向头部(或眼部)跟踪技术或头部运动预测。 对图像中人体头部检测是近年来兴起的一个新的研究领域,可以说头部检测是人脸检测的基础,它与立体视觉计算相结合,可以多角度变距离地对人体进行检测和跟踪,有着广泛的应用前景。由于其在计算机应用领域的重要性,已经引起了人们极大的兴趣和研究热情。在计算机的自动识别系统中,人体头部检测常常是关键的第一步。所以,一个高效并且完全自动化的计算机识别系统,当识别的物体涉及到人体时,首先要解决的就是对头部的检测。现在,头部检测技术已经普遍应用于智能汽车研究领域,如行人检测跟踪、乘客检测、头部定位、表情识别、姿势估计等等热点问题中。 2 头部检测与识别 在许多情况下,由于摄像的距离和角度等关系,图像中人脸信息无法获取,视频图像中人体只有部分是可见的,难以通过对完整人体进行建模的方法获得人体的运动参数。并且一旦出现拥挤情况,人体在图像中呈现的状况将更加复杂。 尽管在俯视图像中人体的整体难以作为检测和跟踪的目标,但是由于人体的头部,尤其是头顶部分,通常体现得较为完整,因此头部的俯视信息,如头部轮廓、头部区域颜色分布等,可以作为人体的局部特征,用于对俯视图中的人体目标进行检测、识别与跟踪,因此头部特征的选择与提取就成为俯视图像中人体检测与跟踪的关键环节。 头部检测技术(Head Detection)包括特征选取和特征检测[3]。应用环境是检测技术首先考虑的因素,它直接决定特征选取和特征检测方法。在实际应用中,检测的困难在于目标在图像中的尺度、位置、方向和位姿都是变化的,遮挡和光照条件也是变化的。 2.1 特征选取 大部分情况下,头部检测应用于远距离多角度拍摄的情况,因此肤色特征和头部轮廓特征是可提取的重要特征。头部轮廓特征属于灰度特征,主要由头部边缘点的梯度参数构成。 头部识别部分的输出将对后续的头部跟踪过程产生重要影响,因而如何选择和提取区分度尽可能高的头部俯视特征以及如何利用头部俯视特征进行头部识别就成为基于头部特征提取的人体检测和跟踪方法的关键问题。通常情况下,特征的区分度越高,识别的方法越简单,识别的正确率越高,反之,特征的区分度较低,则为了保证识别的正确率,可能需要采用较为复杂的分类识别方法。在俯视图像中,通常可以选用头部轮廓、头发灰度(颜色)及灰度分布等作为头部特征。 2.1.1 肤色模型 近年来,人们已经提出几种使用形状分析、颜色分割和运动信息结合的模块化系统在图像序列中用于定位和追踪头部和人脸的方法。肤色是人脸的重要信息,不依赖于面部的细节特征,对于旋转、表情、距离、视角等变化情况都能适用,具有相对的稳定性并且和大多数背景物体的颜色相区别,是最容易获取的头部特征。 基于肤色的方法是通过统计学,估计出人头(含有人脸)肤色在Y-Cr-Cb颜色空间中的概率模型,然后对检测点的肤色通过训练的概率模型的估计判断该点是否属于人头(含有人脸)区域,然后再进一步判断。 2.1.2 头部轮廓模型 头部轮廓指人体头部的边缘几何信息,常见的头部轮廓模型有高斯模型、椭圆模型和曲线模型。最常用的头部轮廓模型是椭圆模型。 2.2 特征检测 常用的头部特征检测方法主要三大类:(1)模板匹配方法。存储几种标准的头部模式,用来分别描述整个头部的颜色轮廓特征;计算输入图像和存储的模式间的相互关系并用于检测。(2)基于外观的方法。(3)运动特征法。在动态图像中,通过运动检测方法如背景相除、相邻帧差与光流法,能够缩小搜索范围,再通过特征匹配确认,运动特征法通常不单独使用,要结合模型匹配和神经网络方法,以提高检测效率。与模板匹配方法相反,从训练图像集中进行学习从而获得模型(或模板),并将这些模型用于检测运动目标。检测提取和跟踪技术是智能视频监控的基础部分,也是许多智能视觉监控系统的关键技术。 AdaBoost算法是目前目标检测最为成功的算法之一,该算法是将弱分类器按照一定的权值组合成为强分类器的统计学习方法。而且该算法在训练过程中采用了动态调整阈值的方法,使得分类器需要的弱分类器大大的减少,可以达到视频流实时的检测效果,基本上满足实际的应用。文献[4][5]中作者基于人脸部模型进行头部运动估计研究。前者利用特征点和块匹配确定图像中特征点的运动,由2D到3D的对齐算法,求出模型的三维运动参数;后者采用自动调整与人机交互相结合的方法使特定人脸模型与特定人脸图像相匹配,应用合成面部图像与输入面部图像最佳匹配的方法进行输入面部图像的头部转动方向估计。 2.3 头部检测算法 帧差法、背景差分法和运动场估计法是目前比较成熟而又有效的目标检测算法,得到了很多学者的重视。帧差法就是对视频中相邻几(2或3)帧图像进行像素差分运算,接下来从差分后的结果中提取出目标信息。背景差分算法则需要构建一个背景模型,然后利用构建的背景模型同待测帧进行差分运算,得到差分运算后的图像,接下来用事先提供的阈值去区分出目标和背景。运动场估计法提取目标是根据目标在时间维度上的运动场的变化来得到运动的目标。 文献[6]提出基于ORB特征的目标跟踪算法,并与基于CamShift的跟踪算法进行比较,结果表明基于ORB的跟踪算法可以克服CamShift算法在目标和背景颜色接近时跟踪失效的缺点。 文献[7]利用AdaBoost算法进行头部检测,将头部检测分成了头顶检测、侧面检测、正面检测和后脑勺检测等多个子检测过程。此外,利用图像特征直方图的信息进行头部跟踪,排除了对静态误检目标的统计,提高了检测的精度。 文献[8]提出了一种人头检测方法,可以很好地应用到人数统计领域。文献以头部顶点为特征点,并对头部轮廓进行抽样,完成椭圆拟合,最终以类圆检测的方法实现人头检测。实验表明,该方法应用在人群较稀疏的场景下具有良好的效果。 文献[9]利用帧间差灰度图像双向投影检测出人体的运动区域,针对每个运动区域内人体头部运动信息的骨架轮廓具有近圆形(圆弧)这一关键特征,提出了一种基于曲线连续特征的Hough多圆检测方法来实现多目标头部定位的算法,较好地解决了多人遮挡和交叠的问题,然后提出了一种基于目标运动连续性的匹配算法对人体进行头部跟踪。 文献[10]为提高公交乘客检测的准确率,介绍了一种改进的背景差法,将当前图像和背景图像提取边缘再做背景差。该方法受光照条件变化和干扰物的影响较小,能够有效提取目标边缘;在此基础上通过Hough变换获得乘客头部的圆形轮廓,然后从视知觉角度分析并除去检测到的虚假轮廓,从而实现乘客头部的识别。 3 头部跟踪算法 3.1 跟踪算法研究现状 近二十年,不少国内外学者针对目标跟踪作了深入的研究,取得了丰硕的研究成果。当前流行的目标跟踪方法架构主要包括基于核的方法、Bayes滤波方法这两种类型[11]。第一类目标跟踪方法中的Mean Shift(均值偏移)方法是基于核方法的代表。基于Mean Shift的目标跟踪方法具有实时性、对目标遮挡和变形的鲁棒性等优点。第二类目标跟踪方法就是基于Bayes统计理论的Bayes滤波方法。卡尔曼滤波(Kalman Filtering,KF)被证明是最优Bayes滤波方法。然而实际中存在的非线性、非高斯模型,大大限制了Kalman滤波的应用范围。因此,为了能够适用于非线性、非高斯模型,研究人员提出了两种改进的Kalman滤波方法,即扩展Kalman滤波(Extended Kalman Filtering,EKF)和Unscemed Kalman滤波(UKF)。两者的基本思想是将非线性问题转化为线性问题,并利用标准的Kalman滤波进行处理。为了更好处理非线性非高斯条件下的目标跟踪问题,结合蒙特卡洛方法和Bayes理论推导,有人提出了粒子滤波(Particle Filtering,PF)方法。除了针对粒子滤波自身改进的方法之外,近年来还提出了一些在计算机视觉领域流行的目标跟踪方法,这些多样性方法的提出,涵盖了模式识别、机器学习领域的众多理论,也充分显示了目标跟踪仍然是计算机视觉领域研究热点之一。众多目标跟踪方法根据其类型和采用的数学理论可主要分为:基于滤波的方法(粒子滤波、卡尔曼滤波及其变种)、基于稀疏表示的方法(i-Tracker,Sparse等)、基于学习的方法(在线学习、增量学习、流形(Manifold)学习等)、基于特征的方法(如方向梯度直方图HOG、显著性特征、子空间、超像素等)等。 3.2 Mean-Shift算法 Mean-Shift算法最早由Hosteler和Fukunaga[12]提出,后由Cheng等人进一步发展;该算法是一种在一组数据的密度分布中寻找局部极值的稳定的方法,若数据分布是连续的,处理过程就比较容易,这种情况下本质上只是需要对数据的密度直方图应用爬山算法即可,现阶段该算法已经被大量地运用于目标跟踪、图像分割、图像平滑等相关领域中[13]。 3.3 Camshift跟踪算法 将Mean-Shift算法扩展到连续视频图像序列,就形成了CamShift算法(Continuously Apaptive Mean-Shift),该算法由Bradski首先提出并广泛应用于目标跟踪领域;该算法利用目标的颜色直方图模型得到每一帧图像的颜色投影图并对其作Mean-Shift运算,然后根据上一帧跟踪的结果自动调整当前搜索窗口的大小和位置,并将该大小和位置作为对下一帧图像进行Mean-Shift运算的初始值,对此过程进行循环下去就可实现对目标的跟踪进而还可以得到目标在图像中的位置、大小等相关信息[14]。 在跟踪过程中,Camshift算法是基于目标颜色为特征的跟踪方法。该跟踪算法具有很好的实时性,但是也存在对人脸跟踪需要人工选取目标,不能实现自动跟踪,跟踪过程中鲁棒性不强,遇到遮挡问题跟踪失效等问题。针对这些问题,文献[1]提出了基于改进Camshift的人脸跟踪算法,该算法结合了Adaboost人脸检测算法,自动检测出视频图像序列中的第一张正面人脸,然后根据该人脸图像生成颜色概率分布图,进而用Camshift实现人脸的跟踪。 4 结论 我国视频目标跟踪技术的研究起步较晚,但近年来随着图像处理技术以及计算技术的迅速发展,尤其是模式识别、人工智能、图像信息融合和神经网络等许多新思想的出现和使用,国内的视频目标跟踪算法在理论和应用都取得了较大的发展。经过国内众多大学、研究所和企业的多年技术研究,该项技术已在智能视频监控、人脸识别、军事工业、车辆识别、交通场景跟踪、多摄像机联合跟踪和异常行为检测等方面得到了应用。 参考文献: [1]朱映映,梁叶,文振焜.智能视频监控中头部运动跟踪的自适应算法研究[A].中国计算机学会多媒体技术专业委员会、中国图象图形学学会多媒体专业委员会、中国计算机学会普适计算专业委员会、ACM SIGCHI中国分会、中国自动化学会计算机图形学和人机交互专委会.第七届和谐人机环境联合学术会议(HHME2011)论文集[poster][C].中国计算机学会多媒体技术专业委员会、中国图象图形学学会多媒体专业委员会、中国计算机学会普适计算专业委员会、ACM SIGCHI中国分会、中国自动化学会计算机图形学和人机交互专委会,2011:6 [2]张红.面向轻型模拟器的头部运动建模[D].南京航空航天大学,2011 [3]于海滨.基于头部特征提取的人体检测与跟踪及其应用[D].浙江大学,2007 [4]李梦东,阮秋琦.利用三维网格模型的头部运动估计[J].铁道学报,2002,24(2):117-120 [5]尹宝才,高文等.基于模型的头部运动估计和面部图像合成[J].计算机研究与发展,1999,(1):67-71 [6]孟凡清.基于背景差分法与ORB算法的运动目标检测与跟踪算法研究[D].北京印刷学院,2014 [7]郑翔翔,张怡.基于头部检测和跟踪的人数统计方法[J].计算机应用与软件,2011,(2):44-46+10 [8]刘辉,朱闯,张天永,陈域.一种基于头部特征的人头检测方法[J].光电子技术,2014,(1):21-25 [9]卢湖川,张继霞,张明修.基于Hough变换头部检测与跟踪的方法研究[J].系统仿真学报,2008,(8):2127-2132 [10]姜伟,高军伟,刘新.基于边缘背景差法和Hough变换的公交乘客头部检测方法研究[J].青岛大学学报(工程技术版),2010,(2):1-4 [11]王宁.基于粒子滤波的视觉目标跟踪方法关键技术研究[D].华中科技大学,2013 [12]D Comaniciu,P Meer. Mean shift: A robust approach toward feature space analysis[J].IEEE Transaction on Pattern Analysis and Machine In telligence,2002,24(5): 603-619 [13]Terrillon,C Shirazi,M N Fukamachi,et al.Comparative performance of different skin chrominance models and chrominance spaces for the automatic detection of human faces in color image s[J].Automatic Face and Gesture Recognition,2000(3):28-30 [14]董蓓.基于Camshift算法的运动目标实时跟踪系统[J].自动化技术,2008(19):116-118
|