狭义的人脸识别(Face Recognition)特指通过人物面部进行身份确认或身份查找。目前,人脸识别技术已趋成熟,不同类型的商用系统已投入使用。人脸识别系统通过建立自动人脸识别报警网络,对特定区域的特定人员进行摄像机自动识别发现,未经登记授权进入特定区域的人员,系统即定向报警。目前的人脸识别系统设备体积较大,移动性能差,不便于携带,难以普及和广泛应用。通信技术日新月异,智能手机的摄录等功能愈加强大和普及,设计融合CBIR技术与手机通信技术的便携式人脸识别系统已成为可能。它不仅具有一般的人脸识别系统确认和查证的功能,而且充分利用了无线通讯的优势,可被广泛应用在电脑或网络安全、访问控制、门禁和考勤、户证管理、公安追逃、出入境边检、机场安检、驾照或护照等重要证件的身份认证等多种不同的安全领域,其移动性的便携功能是一般的人脸识别系统无法替代的,因而有着更为广泛的应用前景。
1 CBIR技术
CBIR(Content Based Image RetrievaI)即基于内容的图像检索,属于图像分析和信息处理的研究领域,是指直接采用图像内容进行图像信息的查询,目的是在给定查询图像的前提下,依据其内容信息或指定的查询标准,在图像数据库中进行内容上一致或相似性匹配,最终提供符合查询条件的相应图像。
1.1 CBIR的基本原理
CBIR一般由图像标引系统和图像检索系统两部分构成。图像标引系统索引图像文件并按设计要求设置检索标目即检索点,形成一个可供匹配检索的有序的标目索引系统。该系统按设计功能提供颜色、纹理、形状和对象等不同图像底层视觉特征的检索入口。
1.2 CBIR的主要检索内容
CBIR的主要检索内容有颜色、纹理、形状和对象等。颜色特征包括图像颜色分布、相互关系和组成等;纹理是指图像纹理结构、方向、组合及对称关系等;形状是指图像轮廓组成、形状、大小等;对象包括图像子对象的关系、数量、属性和旋转等。
1.3 CBIR的特点
CBIR可以直接从图像中抽取特征和语义,检索过程与语义提取直接相连,使得检索过程更加有效,适应性更强;用相似匹配(Similar Match)代替精确匹配(Exact Match),即采用相似比对的方法获得类似图像结构,渐近趋同,直至获得符合要求的结果;用户可以通过浏览选择示例或自己绘制图形来查询,并可不断改进检索式,细化检索过程;提供基于客观属性(关键词)的检索,基于内容的检索,基于对象关联检索以及概念检索等多层次的高效检索。
1.4 CBIR技术的应用系统
在CBIR领域,经过十几年的理论研究,产生了许多比较成熟的算法和一些有价值的系统。现普遍采用低层次的图像信息(如图像颜色、纹理、形状等)来实现图像内容查询。如IBM研究中心开发的QBIC(QueryBy Image Content)图像检索系统,哥伦比亚大学的Visual SEEK图像查询系统,麻省理工学院实验室开发的PhotoBook系统,美国UIUC大学的MARS系统等。为进一步提高检索的准确性,CBIR系统采用相似度算法,计算用户提交结果与索引数据库中记录的相似度大小,提取出满足阈值的信息作为结果并按照相似度降序的方式输出,并在同一次检索过程中不断地与用户进行交互,系统通过对这些反馈的相关信息进行学习,再次进行下一轮检索,从而达到用户的要求。
2 基于CBIR技术的Web应用实例
上述“基于CBIR技术的应用系统”中的系统主要利用图像的颜色、纹理、形状等进行相似度比较,多数是基于图像的底层视觉特征进行检索的,没有完整的Web实现方案,距离普遍使用相去甚远。目前,完整实现Web化的CBIR技术应用网站主要有www.like.com和www.polarrose.com。
www.like.com是一个商业性的服饰购物网站,它以独特的技术实现了对服饰图像的查询和检索。用户提交衣服、鞋帽、手饰等的照片,通过匹配检索后,网站会返回该服饰的品名、价格等相关信息。该系统的最大局限性在于搜索的内容只能是服饰,并且是世界知名产品。有趣的是提交一张名人照片,就可以搜索出名人穿戴的东西,返回一系列类似服饰的价格列表供购物参考。
www.polarrose.com利用其自有的二维图像三维模型转化技术,提供免费的面部图像检索服务。该服务是结合客户端的运行软件和服务器端的处理功能而实现的。客户端软件以电脑网络浏览器Firefox和IE的客户端软件形式对外公开。当用户浏览网站并显示含有人物面部图像的静态图像时,上述客户端软件就会在人物面部产生一个小标志。点击该标志,就能检索出面部与该人物类似的图像。假如该人物的名字已经登记到PolarRose数据库,还可确认其名字。如果选择的人物尚未登记名字,用户还可自行登记名字或更正错误的名字。PolarRose公司的副总裁尼古拉斯这样描述它的功能:“利用我们的人脸搜索技术,你就可以根据人脸部的一些基本特征,实现在不同场景、灯光的照片里寻找同一个人,只要能看清他的脸。”
3 系统设计
基于Internet的普及、CBIR技术的日趋成熟及其Web实现方案的成功实践,提出CBIR、Internet和无线通讯技术三位一体的设计思想,以实现一种新型的以手机为载体的移动人脸识别系统,如图1所示。
该系统的工作原理和人脸识别过程如下:用户通过智能手机自身的拍照功能对需要确认的人物进,行面部特征拍摄,将图片以手机短信形式发送至服务器,服务器将其与数据库中存贮的图像进行“基于内容的”匹配处理后,再将匹配程度高的图片信息以短信形式发送回手机用户,用于进行人物确认。
3.1 系统运行流程
首先建立CBIR技术支持的人物面部图像数据库,在人物面部图像数据库中要对面部特征进行提取和标引等有序化处理,进而建立存贮面纹编码的面部特征库。这是系统工作的基础和前提。在此基础和前提的支持下,用户将手机拍摄的图像通过无线网络发送至服务器,对接收到的图像进行面部特征提取,而后在特征库内进行匹配检索,将相似度高的图片信息用SMS形式回发至手机用户,用于身份确认。
3.2 系统开发工具及运行环境
开发工具:Microsoft制作发行的Visual Studio2008 Tearn Suite系统;操作系统:Windows 2003 Serv-er;应用服务器:JRun 4.0,JRun是一款Macromedia公司开发的Java应用服务器,提供快速可靠的J2EE兼容平台,如果希望在Web应用中添加服务器端Java功能,那么JRun将是最为明智的正确选择;后台数据库:Oracle9i,Oracle9i是由Oracle公司开发的面向Inter-net支持关系对象模型的分布式数据库和高度集成的、智能化的互联网应用基础平台,是Oracle9i Database,Oracle 9i Application Server和Oracle9i Developer Suite的完整集成;服务器数量:2台。
3.3 系统模块说明
(1)数据库
图像数据库1:利用Spider网络蜘蛛程序抓取网页中的人物图像及其说明文字存入图片数据库1,用以弥补专业图像库数量上的不足。
图像数据库2:由专业图像及其注释组成,目的是为用户提供权威性的解释。
图像特征库1:提取图像数据库1中的图像面部特征,将面纹编码存入图像特征库1。
图像特征库2:用来存放图像数据库2中图像的面纹编码。
“面纹编码”是根据脸部的本质特征和形状来工作的,它可以抵抗光线、皮肤色调、面部毛发、发型、眼镜、表情和姿态的变化,具有强大的可靠性,可以从百万人中精确地辨认出一个人。
(2)图像特征提取器
该模块由算法组成,特征向量法和面纹模板是提取器用到的两种主要算法。
特征向量法是先确定眼虹膜、鼻翼、嘴角等面像五官轮廓的大小、位置、距离等属性,然后再计算出它们的几何特征量,这些特征量形成一描述该面部的特征向量;面纹模板法是在库中存贮若干标准面像模板或面像器官模板,在进行比对时,将采样面像所有像素与库中所有模板采用归一化相关量度量进行匹配。此外,还有采用模式识别的自相关网络或特征与模板相结合的方法。
(3)索引器
Index是一个图像整序模块,它对图像数据库和图像特征库进行分类索引。对图像数据库进行索引是优化数据库组织结构和提高系统工作效率的有效方法,实际上它是对图像的面纹编码进行有序化处理,可以有效缩小检索范围,提高系统的响应速度。
(4)GUI
GUI(Graphical User Interface,图形用户接口),是屏幕产品的视觉体验和互动操作部分。GUI是一种结合计算机科学、美学、心理学、行为学及各商业领域需求分析的人机系统工程,强调人一机一环境三者作为一个系统进行总体设计。这种面向客户的系统工程设计的目的是优化产品的性能,使操作更人性化,减轻使用者的认知负担,使其更适合用户的操作需求,本系统的GUI主要涉及网络查询部分和手机部分。
(5)主要接口
手机通过基站与系统服务器的连接,主要通过CMPP或SGIP协议实现。CMPP和SGIP(在CD-MA上是ETIP)协议分别是解决中国移动和中国联通提供的短消息互联网接人方案,它们规定信息资源站实体与互联网短信息网关的应用层接口协议。CMPP和SGIP可以为实现移动数据增值业务提供服务,包括以下业务:Email通知、语音信箱通知、Internet发送短信息、移动平台发Email、催费通知、自动综合业务信息台。
4 结 语
本文所述人脸识别系统成功地融合并应用了CBIR技术、Internet技术和手机通信等现有的技术成果,其独创性在于将短信息服务与手机拍照功能和基于CBIR技术的Web识别系统有机地容为一体,这一以手机为载体的人脸识别系统既是手机增值业务的延伸,同时也为众多领域内基于CBIR技术的识别系统提供了积极的借鉴和更为广阔的应用空间。