智源推出“生物智能开源开放平台”,支撑脑启发的通用智能研究

发布时间:2021-12-16

毋庸置疑,大脑是世界上最智能的机器。

从上世纪40年代基于神经元提出机器学习模型的雏形,到近年来深度学习巨头Hinton“扬言”要代替CNN的胶囊网络……

不难发现,人工智能和脑科学的交叉融合,是我们探索智能本质的极佳推手

但是,即使是小小的斑马鱼脑,其拥有的数据量也非常惊人,更别提容量更为庞大的人脑了。因此,这些重要基础数据的获取对交叉研究至关重要。

近日,北京智源人工智能研究院推出“生物智能开源开放平台”。

https://brain.baai.ac.cn/index.html

该平台由智源首席科学家、清华大学教授刘嘉在内的多名智源“人工智能的认知神经基础”重大研究方向科学家团队联合发起,并由方向博士后团队与工程师共同参与建设。

“生物智能开源开放平台”包括了:

l  集合人类认知任务种类最多的数据库CogNet

l  涵盖从斑马鱼到人的生物大脑数据库BrainDB

l  国内首款面向计算神经科学和类脑计算的自研开源编程工具BrainPy

l  国内首款用于深度神经网络和脑影像交叉研究的工具包DNNBrain

l  涵盖经典感知与认知功能的类脑视觉信息处理模型与算法库。

从数据到工具都一键获取!

这是国内生物智能数据的首个开源平台,不仅填补了相关研究平台型基础设施的空白,还为学者及企业提供低门槛、高效率的科研资料获取途径。

开源两大权威数据库

打造通用人工智能的秘钥

认知科学通过对大脑复杂智能行为的研究,构建认知理论框架,揭示智能的产生机制。

在这个方向上,智源科学家团队通过平台开源了CogNetBrainDB两大数据库,为研究人员提供了丰富的数据。

人类认知行为范式数据库(CogNet是目前为止集合认知任务种类最多的人类行为认知范式开源数据库。

它包含物体识别、记忆、语言、理解判别、数量感、音乐测试、执行功能、空间导航、注意力等九大类认知行为任务、36个数据集等。

利用这些经由认知科学验证过的开源数据,研究人员可以获取认知机制与行为范式,从而推动并揭示类脑算法、结构、功能和表征,进而将人脑的原理机制应用于类脑的开发中,这对脑启发的AI算法与模型创新具有重要作用。

另一数据库是生物大脑数据库(BrainDB)。

这是一个多尺度、多精度、多模态、多认知任务的生物数据库,涵盖了从斑马鱼到人的脑结构与功能连接组数据。

斑马鱼大脑尺寸较小,但却是研究脑科学的重要工具,因为这样的小尺寸大脑能够让脑中的细胞活动情况清晰可见。

BrainDB中包含斑马鱼全脑成像数据100GB+,主要包含斑马鱼全脑神经影像学数据,以及与神经活动对应的行为影像数据。

另外,BrainDB还包含了人脑视觉认知多模态数据600GB+,超过400人次、覆盖了8个典型视知觉任务,包含了与人脑视觉认知相关的结构核磁成像、功能核磁成像、脑磁图、脑电图等多种模态数据,以及部分超高分辨率电镜细胞膜分割数据集(U-RISC)。

生物大脑数据就像是开启通用人工智能的秘钥,而大批量开源这类数据就是这把秘钥的基础。

开源模型与算法

不同尺度探索脑启发

如同显微镜带我们探索微观世界,量子力学从微观角度探讨物理,从不同尺度构建人工智能模型与算法也是脑启发/类脑智能技术研究的重要方法。

基于精细神经机制的计算建模和宏观的认知行为范式启发,平台目前已整合集成并开源三个基础视觉认知能力的算法模型:

l  物体识别算法模型;

l  目标检测算法模型;

l  目标预测跟踪算法模型。

以及四个高级视觉认知能力模型:

l  工作记忆认知能力模型;

l  视觉认知恒常性认知能力模型;

l  持续学习认知能力模型;

l  情景化学习认知能力模型等。

小鼠在进行空间导航时,其编码头朝向的神经元发放会领先于小鼠实际头的位置大概25ms左右,即大脑很可能是通过预测运动物体未来位置的方法进行运动时延补偿,这对于视觉和运动控制至关重要。

受此启发,北京大学吴思团队结合连续吸引子网络和负反馈调节神经机制,提出了一种新的预测编码机制,来实现预测追踪运动刺激。实验和理论研究表明,在很多认知计算任务上,大脑采用连续吸引子神经网络(Continuous Attractor Neural Network)进行信息表征和处理。该计算模型可以在类脑软硬件计算中应用,比如基于硬件实现的连续吸引子网络,可以帮助运动自行车实现对行人的预测追踪。

图:连续吸引子网络模型

开源软件与工具包

完成交叉学科开源闭环

作为类脑算法开发的重要一环,建模分析工具也必不可少。

平台集成了由吴思团队开发的,用于计算神经科学学习,研究和类脑算法开发的建模分析软件BrainPy(灵机)。

该软件为微分动力学方程和随机微分动力学方程等提供了一般性的数值模拟求解器,可以对神经系统进行离子通道、突触、神经元以及网络等不同尺度的建模,并提供了微分动力系统的动力学分析工具,如相图分析等。

BrainPy目前已包含了基本的神经元模型11种、突触模型13种、10多种常用的神经网络模型,方便用户使用。BrainPy为计算神经科学建模和类脑计算提供了通用编程平台,可以促进类脑计算模型的开发。

另外,为促进双脑融合研究,刘嘉团队基于Python环境开发的国内首款用于深度神经网络和脑影像交叉研究的工具包DNNBrain

配合脑影像分析方法,DNNBrain提供对深度神经网络内部的表征探测、表征映射及可视化、激活提取等接口。致力于通过对比脑机之间的异同,来探索其内部表征机制,方便认知神经科学家应用深度神经网络来建模生物神经系统,以及利用认知神经科学范式解释深度神经网络内部的黑匣子,并加速该交叉领域的科学研究。

由此,平台完成了整个交叉研究从数据、算法与模型到工具的开源闭环。

该平台目前推出首个版本,计划明年年中会进行二次迭代,后续也会不断完善,并继续推动交叉领域学术资源的开源开放,也期待更多不同学科、不用研究方向的研究者加入并贡献新数据、新思想、新方法,将平台从生物视觉拓展到更广谱的智能领域,共同建设支撑新一代脑启发的人工智能发展的数据、模型、算法、工具软件等开源基础设施,引领我国在该交叉学科领域的前沿探索和创新发展。

智源生物智能开源开放平台:https://brain.baai.ac.cn/index.html

来源:智源研究院