一种基干多层感知器的脸部识别算法’
刘翼光 熊志勇 沈 理
中国科学院计算技术研究所二室
北京2704信箱2分箱 100080 E-mail: liuyg@gsc.ict.ac.cn
摘 要: 人脸识别是人类特征自动分类的一个重要课题。本文提出了一种将多层感知器
和特征脸相结合的方法,构造神经网络聚类器。文中描述了大样本集脸部的“标准脸”,
用多层感知器对标准脸特征向量进行学习和聚类;我们通过实验数据对算法做了一些比较
和说明,对影响感知器识别率的参数进行了
;最后简单地介绍了我们用神经网络聚类
器对脸部识别的方向。
关镶词:脸部识别 特征脸 多层感知器
1 引言
人脸是区分人类的重要表征之一,任何两个不同人的脸都具有各自的脸部特征。在一
些特殊的场合中,人脸的识别比指纹等的识别更具有实时性。基于脸部识别的研究对于特
殊场合下的安全管理,身份鉴别有着重要的意义。
在过去的一些研究中,常见的基于无表情正面脸部识别算法有:模板匹配,特征脸以
及脸部变形等方法。在本文中,我们从实际的应用需要出发,考虑以下的条件:将一被识
别图象从一个大样本脸部图象集中识别出来。为了符合实际的需要,往往要求识别能够在
较短的时间内得到结果,因此识别必须具有实时的特点。神经网络对运算的实时性能够很
好地满足[11。而特征脸用数学的方法描述了脸部整体特征的唯一性和不变性[2,3,4,5,6,7川。
在[2 ,刀中,提出了一种基于“特征脸”,利用“特征脸”的特征向量几何空间距离作为
脸部分类的判定标准;181中提出了“特征脸”特征值的量化系数,利用多层感知器作为分
类器。我们在本文中提出:在特征脸的基础上,将主特征向量作为多层感知器的输入。从
代数上可以认为特征向量不变性是分类的依据。
在本文中,我们将神经网络引入人脸的识别过程中,同时将特征脸作为神经网络的输
入变量。这样所得到的系统能够具有神经网络的快速推理,优良的泛化特性,鲁棒性,黑
箱性质,并保持了特征脸方法对人脸整体特征的不变性质。在本文的第二部分,我们首先
引进了算术平均矩阵,对每个训练样本求出其标准差矩阵,将标准差矩阵作雅可比变换,
引入多层感知器(Multilayer Perceptron)作为神经网络聚类器。算术平均特征脸的主特征
向量作为神经网络的输入向量,通过神经网络的学习(训练),构造出对脸部特征聚类的
本文工作得到中国科学院 “九五”基砒性研究项月XJ952-J1-707的资助
一 642一
神经网络。在文中的第三部分,简单地介绍了系统的环境和构建的一些必要说明,并对实
验的数据进行必要的对比和说明。在文章的最后一部分,对实验的一些结果和算法的进一
步完善作简短的
。
z. 神经网络脸部识别算法的描述
在人脸识别的过程中,图象是通过成象设备感光形成的。因此,所有被识别的图象都
是二维的,人脸由三维立体空间投影到二维图象,必然会丢失一些信息。同时人脸的复杂
表情同样很大程度地影响了识别的效果。因此,人脸识别的研究我们限于识别对象是正面
不变无表情人脸图象。
在特征脸(Eigenface)相关方法中,将图象指定于特定背景中,并将人脸在图象中
占据大部分的点阵。因此在我们的识别样本中总是将图象假定为人脸占据了主体部分的二
维图象。因为在算法中,我们使用了特征脸的数学描述性质,因此在图象个体的预处理中
可以节省脸部的边缘检测过程。因为多层感知器的表达能力强和规则的简单性,在我们的
系统中选用多层感知器作为聚类器。
基于多层感知器的脸部识别过程包括脸部特征学习(训练)的过程,和识别两个部分。
识别算法对训练样本的学习过程如图一。首先将训练样本消除算术平均矩阵
( Arithmetic Means Matrix )影响,求出个体标准差特征脸(Standard Deviation Eigenface),
对个体标准差特征脸作正交变换得到特征向量,进行多层感知器的训练。这就是多层感知
器的学习过程 。
?
?
?
训练
样本
个体
图一:脸部识别算法的学习过程
假设大样本训练集TS= f S(xi),S(xz),、.,S(x.)}共n个已知样本个体,图象的大小为
p X q。定义图象的算术平均矩阵(Arithmetic Means Matrix)么
丫 TS
瓜 =三二匕一一=
艺S(xi)
取训练集中每一样本的标准差,称为图象标准差矩阵(Standard Deviation Matrix),
形式为:D(xi)二S(xi)一么 ,
在实际情况中,由成象设备获得的图象总是受到外界环境不同程度的影响,而这些影
响中,亮点对图象的影响是最多的一部分,算术平均矩阵的引入可以理解为对人脸共性的
统计和泛化亮点 (即亮点的平均分布)对大样本集中图象随机分布的影响。因为大样本集
自身的随机性,反映了一定待识别对象的人脸普遍特征,基于大样本集算术平均矩阵正是
一 643一
样本集的统一描述;所以在一定意义上,可以认为算术平均矩阵是训练集的“标准脸”。
从而,由算术平均矩阵导致的图象标准差矩阵反映了每一样本相对于样本集的个体特征。
我们知道,矩阵的特征向量具有空间不变性。为此,在下一步的过程中,通过雅可比
变换求出标准差矩阵的特征向量。
在变换中,首先对标准差矩阵归一化,得到矩阵C(xl)二D(xi)D(X1)T,对矩阵正交变
换,得到一组特征值乙(m-