新兴技术 | 经典CNN对2D&3D掌纹及掌静脉识别的性能评估
发布时间:2021-02-22论文题名:A Performance Evaluation of Classic Convolutional Neural Networks for 2D and 3D Palmprint and Palm Vein Recognition
论文作者:Wei Jia, Jian Gao, Wei Xia, Yang Zhao, Hai Min, Jing-Ting Lu
全文链接:https://link.springer.com/article/10.1007/s11633-020-1257-9
参考链接:https://mp.weixin.qq.com/s/QOjI9IbwqaAnLgjwK4RDaA
掌纹识别(palmprint recognition)及掌静脉识别(palm vein recognition)作为两种新兴的生物特征识别技术已经引起广泛关注。最近几年,深度学习已经成为人工智能领域最为重要的技术,在许多领域取得了突破。但是,基于深度学习的2D掌纹识别、3D掌纹识别和掌静脉识别的相关研究尚处于起步阶段。
合肥工业大学贾伟副教授团队对于经典的深度卷积神经网络(Convolutional Neural Networks, CNN)的发展历史进行了简要总结,并评估了17个经典CNNs在2D掌纹识别、3D掌纹识别及掌静脉识别中的性能,获得了多个有意义的结论。
图片来自Springer
在网络及数字社会中,身份认证(personal authentication)正成为一项基本的社会服务。众所周知,生物特征识别是解决个人身份认证最有效的技术之一。近年来,两种新兴的生物特征识别技术:掌纹识别(palmprint recognition)及掌静脉识别(palm vein recognition)引起了广泛关注。一般而言,掌纹识别技术有三个子类,包括2D低分辨率掌纹识别、3D掌纹识别和高分辨率掌纹识别。高分辨率掌纹识别通常应用于刑事侦查。2D低分辨率掌纹识别和3D掌纹识别主要服务于民用领域。本文只研究生物特征识别在民用领域的应用,不涉及高分辨率掌纹识别问题。
当前学界已提出许多有效的方法进行2D低分辨率掌纹识别(下文简称2D掌纹识别)、3D掌纹识别和掌静脉识别。这些方法可分为两类,即:传统方法和基于深度学习的方法。
过去十年间,深度学习已经成为人工智能领域最重要的技术。它为许多应用带来性能上的突破,例如语音识别、自然语言处理、计算机视觉、图像和视频处理、多媒体分析等。在生物特征识别领域,特别是人脸识别领域,深度学习已经成为最主流的技术。然而,基于深度学习的2D、3D掌纹识别和掌静脉识别尚处于研究起步阶段。
卷积神经网络是深度学习技术的一个重要分支,广泛用于图像处理和计算机视觉的各种任务中,如目标检测、语义分割和模式识别等。对于基于图像的生物特征识别技术,CNN是最常用的深度学习技术。到目前为止,学界已经提出诸多经典的CNN,并在许多识别任务中取得优异的成绩。然而,这些经典CNN在2D、3D掌纹识别和掌静脉识别中的识别性能还未得到系统研究。
例如,现有的基于深度学习的掌纹识别和掌静脉识别工作只使用简单的网络,没有进行深入分析。未来,随着CNN的快速发展,新型CNN的识别精度将不断提高。可以预见,CNN将成为2D、3D掌纹识别和掌静脉识别的一项重要技术。因此,系统研究经典CNN的识别性能对于2D、3D掌纹识别和掌静脉识别具有重要意义。为此,本文评估了经典CNN在2D、3D掌纹识别和掌静脉识别中的性能,着重对17个代表性的经典CNNs进行了性能评估。
这17个经典的CNNs包括:AlexNet、VGG、Inception_v3、Inception_v4、ResNet、ResNeXt、Inception_ResNet_v2、DenseNet、Xception、MobileNet_v2、MobliNet_v3、ShunffleNet_v2、SENet、EfficientNet、GhostNet、RegNet 以及ResNeSt。
本研究在5个2D掌纹数据库、1个3D掌纹数据库和2个掌静脉数据库上对所选CNNs进行了识别性能评估,这些数据库均是2D、3D掌纹识别和掌静脉识别领域的代表性数据库。5个2D掌纹数据库包括香港理工大学掌纹II数据库(PolyU II)、香港理工大学多光谱蓝光波段(PolyU M_B)掌纹数据库、合肥工业大学掌纹数据库、合肥工业大学跨传感器(HFUT CS)掌纹数据库、同济大学掌纹数据库(TJU-P)。1个3D掌纹数据库为香港理工大学3D掌纹数据库(PolyU 3D)。2个掌静脉数据库包括香港理工大学多光谱掌纹数据库(PolyU M_N)的近红外波段、同济大学掌静脉(TJU-PV)数据库。
值得注意的是,上述数据库中的样本是在两个不同阶段(sessions)、以特定时间间隔采集的。在传统的识别方法中,第一阶段采集的部分样本通常作为训练集,第二阶段采集的全部样本作为测试集。然而,在现有的基于深度学习的掌纹识别和掌静脉识别方法中,训练集往往包含两个阶段的样本,因此容易获得较高的识别精度。如果训练样本仅来自第一阶段,而测试样本来自第二阶段,称此实验模式为分离数据模式(separate data mode)。如果训练样本来自两个阶段,则称之为混合数据模式(mixed data mode)。本研究分别在分离数据模式和混合数据模式下进行实验,观察经典CNNs在这两种不同模式下的识别性能。
本研究的主要贡献如下:
1) 简要总结了经典CNNs,有助于读者更好地了解CNNs在图像分类中的发展历史。
2) 评估了经典CNNs在3D掌纹和掌静脉识别中的性能。这是学界迄今第一次进行这种评估。
3) 在合肥工业大学跨传感器掌纹数据库上评估了经典CNNs的性能。这是首次较大规模地开展基于深度学习的跨设备掌纹识别性能评估。
4) 研究了CNNs在分离数据模式和混合数据模式下的识别性能问题。
本文其余部分组织如下:第二节介绍了相关工作。第三节简要介绍了17种经典CNNs。第四节介绍了用于评估的2D和3D掌纹和掌静脉数据库。第五节对大量实验作了报告。第六节是结论。
来源:《International Journal of Automation and Computing》编辑部