基于神经架构搜索技术(NAS)的2D&3D掌纹和掌静脉识别

发布时间:2021-08-12

论文题名:2D and 3D Palmprint and Palm Vein Recognition Based on Neural Architecture Search

论文作者:Wei Jia, Wei Xia, Yang Zhao, Hai Min & Yan-Xiang Chen

全文链接:https://link.springer.com/article/10.1007/s11633-021-1292-1   

参考链接:https://mp.weixin.qq.com/s/Dw9Bsuihz1HWlgvUVkwg5A

掌纹识别和掌静脉识别是两种新兴的生物特征识别技术。在过去的二十年中,学术界提出许多传统方法进行掌纹识别和掌静脉识别,取得了很大的进展。近年来,在人工智能领域,深度学习凭借其优异的性能,逐渐成为主流的处理和识别技术。

合肥工业大学贾伟副教授团队,在评估了手工设计的卷积神经网络(CNN)对2D掌纹、3D掌纹和掌静脉识别的识别性能之后,接续完成了神经架构搜索技术(NAS)对于2D掌纹、3D掌纹和掌静脉识别的识别性能评估,从传统手工设计的CNN和最新的NAS算法搜索出的CNN两个方面,系统地并比较全面地开展了基于深度学习的2D掌纹、3D掌纹和掌静脉识别的性能评估。在生物特征识别领域,这也是国际上首次对NAS算法进行大规模的识别性能评估。两项成果均已发表于IJAC,全文免费下载!

前期成果链接:

经典CNN对2D&3D掌纹及掌静脉识别的性能评估

图片来自Springer

在数字化及智能化社会中,越来越多的应用场景要求对人的真实身份进行有效认证,而生物特征识别(Biometrics)则被认为是最为有效的个人身份认证(Personal authentication)技术。

所谓生物特征识别技术,就是指基于图像处理、计算机视觉、模式识别等技术,通过对人的物理或行为特征来识别身份的技术。通常,人脸识别、指纹识别及虹膜识别是三种主流的生物特征识别技术,并已得到广泛应用。然而,不同的生物特征识别技术有其不同的优缺点。换言之,没有任何一种生物特征识别技术可满足所有的个人身份认证应用需求。因此,学术界及产业界均积极研究不同的生物特征识别技术以满足不同应用场景的身份认证需求。

近年来,掌纹识别(Palmprint recognition)和掌静脉识别(Palm vein recognition)成为两种新兴生物特征识别技术,吸引了广泛关注。掌纹识别是指基于人的手掌皮肤图像(Palm skin images)完成身份认证的技术。根据掌纹图像的分辨率及数据类型,掌纹识别技术可分为2D掌纹识别和3D掌纹识别。2D掌纹识别又可进一步分为低分辨率掌纹识别和高分辨率掌纹识别。高分辨率掌纹识别通常应用于法医侦查(Forensics)之中,而低分辨率掌纹识别和3D掌纹识别主要用于民用领域。

图片1

图片2

图片来自论文

掌静脉识别(Palm vein recognition)是指利用近红外光(Near-infrared light)条件下采集的掌静脉图像来识别个人身份的技术。掌静脉识别也主要用于民用领域。由于掌纹识别和掌静脉识别都是采集手掌的图像,且两者的识别方法在一定程度上具有相似性,因此很多学者会把掌纹识别和掌静脉识别放在一起进行研究。

本文主要探讨民用领域的生物特征识别技术,故将焦聚于2D低分辨率掌纹识别、3D掌纹识别和掌静脉识别,下文所指的2D掌纹识别,即指2D低分辨率掌纹识别。

360截图20210608100634485

图片来自论文

当前,研究者们已经提出许多有效的方法进行2D和3D掌纹识别和掌静脉识别,这些方法可分为两类:传统方法和深度学习的方法。通常,传统方法基于手工设计特征(Hand-crafted features)和传统机器学习技术。而深度学习可通过图像、视频或文本自动学习特征,此外,深度学习高度灵活的架构(Highly flexible architecture)可直接从原始数据中完成学习,在获取更多数据后,预测的精度也会相应提升。如今,深度学习已经成为人工智能领域一种十分重要的技术。计算机视觉、语音识别、自然语言处理、机器人等领域的飞速发展也离不开深度学习技术的助力。

在生物特征识别领域,特别对于人脸识别,深度学习已经成为最主流的识别技术。卷积神经网络(CNN)是深度学习的一个重要分支。在基于图像的生物特征识别技术中,CNN又是最常用的深度学习技术。截止目前,学界已提出许多经典CNNs,并且在很多识别任务中取得不俗的成绩。这些CNNs的成功进一步推动了特征工程过程(Feature engineering process)的自动化:分层特征提取器以端对端的方式(End-to-end manner)从数据中学习,由此,对架构工程(Architecture engineering)的需求由此与日俱增。

通过手工方式,研究者们设计出越来越复杂的神经网络架构(Neural network architectures)。因此,当前的多数CNN架构均由人类专家人工设计完成,但这是一个非常费时(Time-consuming)且容易出错的过程。为了克服这种人工设计CNN方式的缺点,神经架构搜索技术(Neural architecture search, NAS)成为深度学习一个重要的研究方向。NAS技术的核心思想在于运用搜索算法(Search algorithm)找到性能良好的神经网络结构(Neural network structure)。NAS技术可解决深度学习模型的参数调整问题(Parameter adjustment),这也是一项交叉研究,同时涉及优化(Optimization)及机器学习等方面的技术。

封面

图片来自论文

随着深度学习网络架构的不断优化以及数据量的不断增加,深度学习在不同生物特征识别任务中的识别精度也在不断提升。例如,在人脸识别领域,一些深度学习算法的识别精度大幅超过传统的手工设计算法,这促进了人脸识别技术的大规模应用。然而,在2D和3D掌纹识别和掌静脉识别中,基于深度学习的相关研究仍处于起步阶段。许多研究者使用经典CNNs或手工设计CNNs完成2D和3D掌纹识别和掌静脉识别,而NAS技术却并未很好地用于2D和3D掌纹识别和掌静脉识别的相关研究中。

360截图20210608100909263

图片来自论文

由于NAS代表着深度学习技术的未来发展方向,对NAS方法在2D和3D掌纹识别和掌静脉识别中的性能进行系统评估就显得尤为重要。本文特别选取了20种具有代表性的NAS方法,在5个2D掌纹数据库、1个3D掌纹数据库和2个掌静脉数据库中,对其性能进行了评估。

本文的主要贡献在于:

1) 简要总结了若干重要的NAS方法,以期帮助读者更好理解NAS技术的发展历史。

2) 完成代表性NAS方法在2D和3D掌纹识别和掌静脉识别中的性能评估。在生物特征识别领域,这也是国际上首次对NAS算法进行大规模的识别性能评估。

3) 在合肥工业大学跨传感器掌纹识别数据库(Hefei University of Technology cross sensor palmprint database)中完成代表性NAS方法的性能评估,这是首次使用NAS技术研究跨传感器的掌纹识别问题。

来源:《International Journal of Automation and Computing》编辑部