百度大脑在跨年龄识别人脸方面战胜人类
发布时间:2017-01-17人工智能又一次战胜了人类!这次是在《最强大脑》。吴恩达率队的百度人工智能在人脸识别跨年龄识别任务中以3:2 的比分惊险击败《最强大脑》名人堂轮值主席、世界记忆大师王峰。节目中,植入了百度大脑的机器人"小度"在全国观众的见证下与王峰进行两轮PK,并以微弱优势胜出。
谈到Master 与这次参加《最强大脑》的"小度"的区别,百度IDL实验室的林元庆说,棋类游戏,包括此前的"深蓝"和现在的AlphaGo,从本质上来说,都还是有限空间搜索的问题,但是,识别不是,识别包括了一些模糊推理的能力。
吴恩达在比赛中也提到:"今天,我们基于强大的数据分析,很容易识别两张近期的照片。但是对于识别整容、化浓妆或者有十几年跨度的照片,我们并没有大量的数据可以分析。所以这是人脸识别技术的世界性挑战,也是今天比赛中最大的难点之一。全世界棋类比赛中顶级的选手很少,但是人脸识别能力每个人都具备。这次人机大战,是顶级的人脸识别选手和擅长棋类游戏的人工智能比拼,很公平。"
本次比赛的一个重要特点是识别跨年龄人物的人脸。影响人脸识别的因素有很多,其中影响人脸检测的因素有:光照、人脸姿态、遮挡程度;影响特征提取的因素有:光照、表情、遮挡、年龄、模糊是影响人脸识别精度的关键因素。而在跨年龄人脸检测中影响因素更多。
一般而言,在跨年龄阶段人脸识别中,类内变化通常会大于类间变化,这造成了人脸识别的巨大困难。同时,跨年龄的训练数据难以收集。没有足够多的数据,基于深度学习的神经网络很难学习到跨年龄的类内和类间变化。
根据百度IDL实验室主任林元庆的介绍, 对于第一点,百度IDL的人脸团队选择用度量学习的方法。即通过学习一个非线性投影函数,把图像空间投影到特征空间中。在这个特征空间里,跨年龄的同一个人的两张人脸的距离会比不同人的相似年龄的两张人脸的距离要小。针对第二点,考虑到跨年龄人脸的稀缺性。我们用一个用大规模人脸数据训练好的模型作为底座,然后用跨年龄数据对它做更新。这样不容易过拟合。他说:"将这两点结合起来做端到端的训练,可以大幅度提升跨年龄识别的识别率。"
林元庆表示,百度的人脸识别技术与其他公司的最大不同在于,现在百度已经研发出1对N的系统。具体来说,之前市场上的系统是1比1的,比如说银行的应用里面,你要提交身份证和人脸的信息,系统会拿身份证照片比对一下是不是同一个人,一张比一张,一比一的比对,市场上基本是这个系统。而公安抓逃犯的系统是1比N的,不过精度不会做的特别高,只是用机器筛一遍,还是需要人去看的。1比N很难做到非常高的精度。林元庆说:"我们这个系统第一次能够做到很高的精度,目前在百度在自己内部的大楼闸机中已经开始应用。目前的系统里大概是一万人,机器能很精确的识别一万里面的每一个人。我们现在是万人级别,同时还能做到非常高的精度,这个绝对是国内首创,也是我们下面会重点来推的方向。"
乌镇景区目前已经采纳了这一系统。接下来在安防、罪犯识别、打拐等方面都会有应用。
来源:新智元