基于自适应阈值调整拒识子空间学习的人脸检测方法
【技术领域】
[0001]本发明设及计算机视觉、模式识别和机器学习等技术领域,特别是设及了一种基 于自适应阔值调整拒识子空间学习的人脸检测方法。
[000^ 背景
[0003] 人脸检测的目的是在图像或视频中自动判定人脸是否出现W及人脸出现的位置、 大小W及姿态等。人脸检测是计算机视觉和人脸研究中一个非常重要的研究内容,其在智 能图像处理、模式识别、机器学习、智能视频监控等众多研究和应用领域都有着重要的研究 意义和广泛的应用价值,人脸检测技术也受到了众多研究人员和公司部分的广泛关注和发 展。虽然人脸检测得到了很多的关注和研究,鲁邦性的人脸检测一直是一个非常艰巨和富 于挑战性的课题,运主要体现在W下几个方面:现实中的人脸往往存在许多差异,如姿态的 变化(正面脸和侧面脸等)、表情的变化(如严肃和大笑等)W及容貌上的差异(如亚洲人种 和欧洲人种的差异)等等;由于拍照条件和环境的变化引入的影响,如不同的光照条件(强 光照和弱光照)和人脸的遮挡(眼睛、口罩)等;实时性人脸检测,由于无法准确的确定人脸 的位置和大小,人脸检测算法通常采取滑动窗口的方法进行判断,该方法需要扫描海量的 候选窗口,对实时性的人脸检测带来了很大的负担。
[0004] 目前关于人脸检测问题人们提出过很多解决方案,运其中基于学习的方法在人脸 检测领域取得了很好的效果,特别是基于统计特征的方法。该类方法旨在从大量训练数据 中挖掘出类别本身的统计特性,并利用学习得到的统计特性对新样本进行分类,其中最具 代表性的人脸检测模型是Viola Jones于2001年提出的级联Boosting分类器人脸检测模 型,该人脸检测模型主要有W下Ξ个特点:利用积分图像和Haar特征进行快速的特征计算; 利用Boosting算法进行特征选择和弱分类器学习;利用级联检测器框架有效的拒绝大量非 人脸窗口。该框架在提高检测精度的同时达到了实时性的检测要求,也得到研究人员和公 司的广泛发展和应用。虽然级联Boosting分类器具有优异的性能和快速的检测速度,该类 方法中每一层强分类器仅是一个二值分类器(人脸窗输出为1、非人脸窗输出为0),并将所 有的人脸窗口和错分的非人脸窗口都放到下一层去继续训练,运种策略限制了人脸检测模 型的灵活性,人脸检测模型训练起来也非常复杂和耗时,最终得到的人脸检测模型往往层 数很多。如何缩减人脸检测模型的复杂度,提高人脸检测模型的灵活性仍是一个亟待解决 的问题。
【发明内容】
[0005] 为了解决复杂度和灵活性的问题,本发明提出一种基于自适应阔值调整拒识子空 间学习的人脸检测方法,有效地缩减了人脸检测模型的复杂度,提高了人脸检测模型的灵 活性。
[0006] 本发明提出的基于自适应阔值调整拒识子空间学习的人脸检测方法,包括如下步 骤:
[0007] 步骤S1,采集人脸和非人脸图像,并将所有图像进行灰度处理,将图像尺寸缩放至 统一像素大小A,构成训练样本集合;其中人脸图像为正样本、非人脸图像为负样本;
[000引步骤S2,利用步骤S1中的训练样本集合,采用Boosting算法和互信息最大化准则 训练人脸检测模型中第k层的强分类器;
[0009] 步骤S3,计算修正的互信息,利用修正的互信息最大化学习准则自适应的调整人 脸检测模型中第k层强分类器的最优拒识阔值,得到带拒识的强分类器;
[0010] 步骤S4,利用步骤S3中已训练完成的前k层强分类器,在训练集上筛选出拒识的样 本作为第k+1层分类器的训练样本;
[0011] 步骤S5,重复步骤S2至S4直至满足收敛性条件;
[0012] 步骤S6,给定待检测的图像,构建图像金字塔将待检测图像大小缩放至A,并在图 像金字塔的每一层滑动窗口采样,利用训练得到的每一层带拒识的强分类器对每一个采样 窗口进行判定,并将判定为人脸的采样窗口还原到待检测的图像上,通过对待检测的图像 上所有人脸窗口进行聚类得到最终的人脸检测结果。
[0013] 优选的,步骤S1中正样本为不同光照、不同姿态情况下的人脸图像;负样本采集方 式为先采集一个负样本子集进行训练,对采用通过步骤S2至S5训练好的人脸检测模型进行 测试,将人脸检测模型误检的负样本对象进行增量采集加入负样本集中,通过N次反复训练 和测试得到最终的负样本集合。
[0014] 优选的,步骤S2中,人脸检测模型中每层的强分类器均由弱分类器W构成,利用 Boosting算法和互信息最大化准则训练人脸检测模型中第k层的强分类器步骤如下:
[0015] 步骤S21,选取化ar特征,利用总体互信息最大化准则进行弱分类器W的学习,选取 互信息最大的阔值为当前弱分类器的阔值;
[0016] 步骤S22,利用S21所述方法计算得到每一个化ar特征对应的弱分类器及其对应的 互信息值,选取互信息值最大的弱分类器为当前迭代轮的弱分类器wt;
[0017] 步骤S23,根据样本在弱分类器wt下的输出值设定样本权重,样本权重计算公式为
[001 引
[0019] 其中,似嗦示t-1轮迭代后样本i的权重,L康示样本i的真实类别,ht(xi)为样本i 的预测类别,Zt为归一化因子;
[0022] 步骤S24,重复步骤S21-S23直至满足收敛性条件。
[0023] 优选的,步骤S3中,计算修正的互信息,利用修正的互信息最大化学习准则自适应 的调整人脸检测模型中第k层强分类器的最优拒识阔值的步骤如下:
[0024] 步骤S31,计算每个样本在第k层强分类器下的输出值Fi,并设定强分类器的正、负 样本的初始拒识阔值化1、化2 ;
[0025]
[0026] 其中Τ为当前强分类器包含的弱分类器总数;
[0027] 步骤S32,利用非参数估算方法估计正、负样本输出值的条件概率密度;
[002引步骤S33,计算修正的互信息,求解修正的互信息关于参数化1,化2的一阶导数,利 用拟牛顿法迭代求解互信息最大化问题,得到最优的拒识阔值。
[0029]优选的,步骤S32中采用的非参数估计方法为化rzen窗法,利用该方法估算正、负 样本的条件概率密度= Z μ = +1)和口w(z) = = Z11 = -1),其估算公式如下
[0032] 其中为正样本的条件概率密度,斯(Z)为负样本的条件概率密度,G( ·,σ2) 表示高斯核函数,σ表示窗宽。
[0033] 优选的,所述的窗宽σ采用大拇指准则进行估算。
[0034] 优选的,步骤S4中,筛选第k+1层的训练样本时,将初始正、负样本集分别输入已训 练好的前k层人脸检测模型,将前k层人脸检测模型均不能进行确定的分类的样本作为第k+ 1层分类器的训练样本。
[0035] 优选的,步骤S3中,计算修正的互信息的公式为
[0036]
[0037] 其中,为给定的一组拒识阔值,N为正、负样本总数,TP(t2)表示真实类别和 预测类别均为正样本的样本数,FN(ti)表示真实类别为正样本,预测类别为负样本的样本 数;FP(t2)表示真实类别为负样本,预测类别为正样本的样本数;TN(ti)表示真实类别和预 测类别均为负样本的样本数;P(+l)与P(-l)分别是正样本和负样本的先验概率。
[0038] 优选的,所述的弱分类器W为区域分割分类器。
[0039] 优选的,步骤5中的收敛条件为总体分类器层数或已收集不到足够的正、负样本用 于训练。
[0040] 优选的,步骤S5的具体步骤为:给定待检测的图像,首先利用下采样构建图像金字 塔,直至将图像缩放至A大小,并计
算每一层金字塔的积分图;其次在每一层金字塔上滑动A 大小的窗口,并利用训练得到的每一层带拒识的强分类器对每一个滑动窗口进行判定,将 判定为人脸的窗口还原到待检测的图像上,最终对待检测的图像上所有候选人脸窗口进行 聚类得到最后的人脸检测结果。
[0041] 本发明通过分层处理处理的方式,显著的降低了人脸检测模型训练的复杂度,利 用带拒识的强分类器提高了人脸检测模型的灵活度并加快了检测速度,并且各层中强分类 器的最优拒识阔值是基于数据分布的统计特性而自动确定,从而实现了自适应阔值调整的 功能。
【附图说明】
[0042] 图1示出本发明人脸检测方法的结构示意图;
[0043] 图2示出本发明人脸检测方法的人脸检测模型训练过程的算法流程图;
[0044] 图3示出本发明人脸检测方法中每一层强分类器训练过程中的算法流程图;
[0045] 图4示出本发明人脸检测方法中检测过程的算法流程图。
【具体实施方式】
[0046] 为使本发明的目的、技术方案和优点更加清楚明白,W下结合具体实施例,并参照 附图,对本发明作进一步的详细说明。
[0047] 本发明通过基于拒识子空间构建的人脸检测模型可W更加灵活的在分类器的每 一层进行判断,并利用互信息最大化准则训练分类器,从而得到的检测具有更好的鲁棒性 和灵活性。
[0048] 本发明的基于自适应阔值调整拒识子空间学习的人脸检测方法如图1、图2所示, 包括W下步骤:
[0049] 步骤S1,采集一定的人脸和非人脸图像,并将所有图像进行灰度处理,将图像尺寸 缩放至统一像素大小A,构成训练样本集合。图像尺寸缩放至统一像素大小A为24巧4。
[0050] 其中人脸图像为正样本、非人脸图像为负样本,正样本为不同光照、不同姿态情况 下的人脸图像;负样本采集方式为先采集一个负样本子集进行训练,采用如下步骤S2至S5 训练好的人脸检测模型进行测试,将人脸检测模型误检的负样本对象进行增量采集加入负 样本集中,通过N次反复训练和测试得到最终的负样本集合。
[0051] 步骤S2,利用步骤S1中的训练样本集合,采用Boosting算法和互信息最大化准则 训练人脸检测模型中第k层的强分类器;如图3所示。
[0052] 本实施例中人脸检测模型中每层的强分类器均由弱分类器W构成;
[0053] 步骤S21,选取化ar特征,利用总体互信息最大化准则进行弱分类器W的学习,选取 互信息最大的阔值为当前弱分类器的阔值;
[0054] 为了简化训练人脸检测模型和加快检测速度,本实施例中我们选取化ar类型的特 征,弱分类器类型为区域分割分类器(Domain-Partition Classifier),本实施例中将特征 值划分为两个区域,对应的弱分类器W有一个待确定阔值τ和两个输出值(η,η),且ri = ln ((胖1,+扣)/(胖1,-扣))/2^2=111((胖2,+扣)/(胖2,-扣))/2。恥功第1个区域内类别为前样本 总权重。弱分类器的每一个阔值都对应一个分类的混淆矩阵C,如公式(1)所示,其中Cl康示 真实类别为i但预测类别为j的样本数,
(1)
[0化5]
[0056]利用混淆矩阵(1)计算得到其对应的互信息,计算公式如公式(2)所示,
[0058]其中,1表示样本的真实类别;y表示样本的判定类别;ΜΙ表示当前特征和弱分类器 α)
[0化7] 阔值下真实分布和预测分布之间的经验互信息;P(l,y)表示样本的真实类别和判定类别的 联合概率密度;P(l)表示样本的真实类别的概率密度;P(y)表示样本的判定类别的概率密 度;Ni = ci,+i+ci,-读示真实类别为i的样本数量;新=c+|,j+cLt j表示预测类别为j的样本 数量;N是全体样本数量。通过遍历所有的阔值W及计算其对应的互信息,选取互信息最大 的阔值为当前弱分类器的阔值。
[0059] 步骤S22,利用S21所述方法计算得到每一个化ar特征对应的弱分类器及其对应的 互信息值,选取互信息值最大的弱分类器为当前迭代轮的弱分类器wt;
[0060] 步骤S23,根据样本在弱分类器wt下的输出值设定样本权重,样本权重的计算如公 式(3)所示
[0061 ]
(3)
[0062]其中,表示t-1轮迭代后样本i的权重,Zt为归一化因子,以表示样本i的真实类 另lj,,ht(xi)为样本i的预测类别;沪的计算如公式(4)所示,Li的取之如公式(5)所示。
[0(?日]步骤S24,重复步骤S21-S23直至满足收敛性条件。
[0066] 步骤S3,计算修正的互信息,利用修正的互信息最大化学习准则自适应的调整人 脸检测模型中第k层强分类器的最优拒识阔值,得到带拒识的强分类器;
[0067] 步骤S31,计算每个样本在第k层强分类器下的输出值Fi,并设定强分类器的正、负 样本的初始拒识阔值Tki、Tk2; Fi的计算如公式(6)所示。
[0068]
(6)
[0069] 其中T为当前强分类器包含的弱分类器总数;
[0070] 步骤S32,利用非参数估算方法估计正、负样本输出值的条件概率密度;
[0071] 本实施例采用的非参数估计方法为化rzen窗法,利用该方法估算正、负样本的条 件概率密度口P切= ;?(F = z|Z = +;l)和的(乙)=片(护=2|王=-1),其估算如公式(7)、公式 (8)所示
[0074] 其中口p(z)为正样本的条件概率密度,齡切为负样本的条件概率密度,G( ·,σ2)表 示高斯核函数,0表示窗宽。窗宽0采用大拇指准则(Rule of化umb)进行估算。
[0075] 步骤S33,计算修正的互信息,求解修正的互信息关于参数化1,化2的一阶导数,利 用拟牛顿法迭代求解互信息最大化问题,得到最优的拒识阔值。
[0076] 其中给定一组拒识阔值(ti,t2),其对应的分类混淆矩阵可W表示如表1所示。
[0077] 表1分类器对应阔值(ti,t2)的分类混淆矩阵
[007引
[0079] 表1中,+ 1表示正样本,-1表示负样本,0表示拒识的样本;TP(t2)表示真实类别和 预测类别均为+1的样本数,TN(ti)表示真实类别和预测类别均为-1的样本数;FN(ti)表示真 实类别为+1,预测类别为-1的样本数;FP(t2)表示真实类别为-1,预测类别为+1的样本数; RP(ti,t2)表示真实类别为+1但被拒识的样本数;RN(ti,t2)表示真实类别为-1但被拒识的 样本数;N表示正、负样本总数;N+表示真实类别为+1的样本数;N-表示真实类别为-1的样本 数;表示预测类别为+1的样本数;豕表示预测类别为-1的样本数;Nr表示被拒识的样本 数。
[0080] 考虑到引入拒识项带来的退化现象,此处我们利用公式(9)计算修正的互信息值, p(+l)与p(-l)分别是正样本和负样本的先验概率,
[0081]
[0082] 计算可得MMI(ti,t2)关于(ti,t2)的导数分别如公式(10)、公式(11),
[0083]
[0085] 利用拟牛顿法求解修正互信息最大化问题,得到最优决策阔值即第k层强分类器 的决策阔值Tkl,Tk2。
[0086] 步骤S4,利用步骤S3中已训练完成的前k层强分类器,在训练集上筛选出拒识的样 本作为第k+1层分类器的训练样本;
[0087] 利用已训练完成的前k层强分类器,收集第k+1层人脸检测模型的训练样本,将初 始正、负样本集分别输入已训练好
的前k层人脸检测模型,如果前k层人脸检测模型均不能 对样本进行确定的分类,则将其放入第k+1层的训练集中,由此收集完k+1层的训练样本。
[0088] 步骤S5,重复步骤S2至S4多次直至满足收敛性条件。
[0089] 本发明的收敛条件为总体分类器层数或已收集不到足够的正、负样本用于训练; 当总体分类器层数小于设定阔值或已收集不到足够的正、负样本用于训练时执行步骤S6。
[0090] 步骤S6,给定待检测的图像,首先利用下采样构建图像金字塔,直至将图像缩放至 24*24大小,并计算每一层金字塔的积分图;其次在每一层金字塔上滑动24巧4大小的窗口, 并利用训练得到的每一层带拒识的强分类器对每一个滑动窗口进行判定,将判定为人脸的 窗口还原到待检测的图像上,最终对待检测的图像上所有候选人脸窗口进行聚类得到最后 的人脸检测结果。如图4所示。
[0091] W上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步的 详细说明,应理解的是,W上所述仅为本发明的具体实施例,并不用于限制本发明,凡在本 发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范 围之内。
【主权项】
1. 基于自适应阈值调整拒识子空间学习的人脸检测方法,其特征在于,该方法包括如 下步骤: 步骤Sl,采集人脸和非人脸图像,并将所有图像进行灰度处理,将图像尺寸缩放至统一 像素大小A,构成训练样本集合;其中人脸图像为正样本、非人脸图像为负样本; 步骤S2,利用步骤Sl中的训练样本集合,采用Boosting算法和互信息最大化准则训练 人脸检测模型中第k层的强分类器; 步骤S3,计算修正的互信息,利用修正的互信息最大化学习准则自适应的调整人脸检 测模型中第k层强分类器的最优拒识阈值,得到带拒识的强分类器; 步骤S4,利用步骤S3中已训练完成的前k层强分类器,在训练集上筛选出拒识的样本作 为第k+Ι层分类器的训练样本; 步骤S5,重复步骤S2至S4直至满足收敛性条件; 步骤S6,给定待检测的图像,构建图像金字塔将待检测图像大小缩放至A,并在图像金 字塔的每一层滑动窗口采样,利用训练得到的每一层带拒识的强分类器对每一个采样窗口 进行判定,并将判定为人脸的采样窗口还原到待检测的图像上,通过对待检测的图像上所 有人脸窗口进行聚类得到最终的人脸检测结果。2. 如权利要求1所述的基于自适应阈值调整拒识子空间学习的人脸检测方法,其特征 在于,步骤Sl中正样本为不同光照、不同姿态情况下的人脸图像;负样本采集方式为先采集 一个负样本子集进行训练,对采用通过步骤S2至S5训练好的人脸检测模型进行测试,将人 脸检测模型误检的负样本对象进行增量采集加入负样本集中,通过N次反复训练和测试得 到最终的负样本集合。3. 如权利要求1所述的基于自适应阈值调整拒识子空间学习的人脸检测方法,其特征 在于,步骤S2中,人脸检测模型中每层的强分类器均由弱分类器w构成,利用Boosting算法 和互信息最大化准则训练人脸检测模型中第k层的强分类器步骤如下: 步骤S21,选取Haar特征,利用总体互信息最大化准则进行弱分类器w的学习,选取互信 息最大的阈值为当前弱分类器的阈值; 步骤S22,利用S21所述方法计算得到每一个Haar特征对应的弱分类器及其对应的互信 息值,选取互信息值最大的弱分类器为当前迭代轮的弱分类器Wt; 步骤S23,根据样本在弱分类器Wt下的输出值设定样本权重,样本权重计算公式为其中,表示t-Ι轮迭代后样本i的权重,L1表示样本i的真实类别,Iu(X1)为样本i的预 测类别,Zt为归一化因子;步骤S24,重复步骤S21-S23直至满足收敛性条件。4. 如权利要求3所述的基于自适应阈值调整拒识子空间学习的人脸检测方法,其特征 在于,步骤S3中,计算修正的互信息,利用修正的互信息最大化学习准则自适应的调整人脸 检测模型中第k层强分类器的最优拒识阈值的步骤如下: 步骤S31,计算每个样本在第k层强分类器下的输出值?1,并设定强分类器的正、负样本 的初始拒识阈值Tk1、Tk2;其中T为当前强分类器包含的弱分类器总数; 步骤S32,利用非参数估算方法估计正、负样本输出值的条件概率密度; 步骤S33,计算修正的互信息,求解修正的互信息关于参数Tkl,Tk2的一阶导数,利用拟牛 顿法迭代求解互信息最大化问题,得到最优的拒识阈值。5. 如权利要求4所述的基于自适应阈值调整拒识子空间学习的人脸检测方法,其特征 在于,步骤S32中采用的非参数估计方法为Parzen窗法,利用该方法估算正、负样本的条件 概率密度其估算公式如下其中%(幻为正样本的条件概率密度,为负样本的条件概率密度,G( ·,〇2)表示高 斯核函数,σ表示窗宽。6. 如权利要求5所述的基于自适应阈值调整拒识子空间学习的人脸检测方法,其特征 在于,所述的窗宽σ采用大拇指准则进行估算。7. 如权利要求1-6中任一项所述的基于自适应阈值调整拒识子空间学习的人脸检测方 法,其特征在于,步骤S4中,筛选第k+Ι层的训练样本时,将初始正、负样本集分别输入已训 练好的前k层人脸检测模型,将前k层人脸检测模型均不能进行确定的分类的样本作为第k+ 1层分类器的训练样本。8. 如权利要求1-6中任一项所述的基于自适应阈值调整拒识子空间学习的人脸检测方 法,其特征在于,步骤S3中,计算修正的互信息的公式为其中,(It2)为给定的一组拒识阈值,N为正、负样本总数,TP(t2)表示真实类别和预测 类别均为正样本的样本数,FNU1)表示真实类别为正样本,预测类别为负样本的样本数;FP (t2)表示真实类别为负样本,预测类别为正样本的样本数;TNU 1)表示真实类别和预测类别 均为负样本的样本数;P (+1)与P (-1)分别是正样本和负样本的先验概率。9. 如权利要求3-6中任一项所述的基于自适应阈值调整拒识子空间学习的人脸检测方 法,其特征在于,所述的弱分类器w为区域分割分类器。10. 如权利要求1-6中任一项所述的基于自适应阈值调整拒识子空间学习的人脸检测 方法,其特征在于,步骤5中的收敛条件为总体分类器层数或已收集不到足够的正、负样本 用于训练。11. 如权利要求1-6中任一项所述的基于自适应阈值调整拒识子空间学习的人脸检测 方法,其特征在于,步骤S5的具体步骤为:给定待检测的图像,首先利用下采样构建图像金 字塔,直至将图像缩放至A大小,并计算每一层金字塔的积分图;其次在每一层金字塔上滑 动A大小的窗口,并利用训练得到的每一层带拒识的强分类器对每一个滑动窗口进行判定, 将判定为人脸的窗口还原到待检测的图像上,最终对待检测的图像上所有候选人脸窗口进 行聚类得到最后的人脸检测结果。
【专利摘要】本发明公开了一种基于自适应阈值调整拒识子空间学习的人脸检测方法,步骤为:S1,采集人脸和非人脸图像,进行灰度和尺寸归一化处理后形成训练样本集合;S2,利用训练样本集合,采用Boosting算法和互信息最大化准则训练人脸检测模型中第k层的强分类器;S3,采用修正的互信息最大化学习准则自适应的调整人脸检测模型中第k层强分类器的最优拒识阈值,得到带拒识的强分类器;S4,利用带拒识的强分类器在训练集上筛选出拒识的样本作为第k+1层分类器的训练样本;S5,重复S2至S4直至满足收敛性条件;S6,利用带拒识的强分类器对待检测的图像进行人脸检测。该方法缩减人脸检测模型的复杂度,提高人脸检测模型的灵活性。
【IPC分类】G06K9/62, G06K9/00
【公开号】CN105488456
【申请号】CN201510811406
【发明人】樊艳波, 董未名, 胡包钢
【申请人】中国科学院自动化研究所
【公开日】2016年4月13日
【申请日】2015年11月23日