2021年斯坦福AI指数报告重磅出炉

发布时间:2021-04-26

 

近日,斯坦福大学正式发布《2021年人工智能指数报告》(“Artificial Intelligence Index Report 2021”)。自2017 年起,由斯坦福大学主导,来自MIT、OpenAI、哈佛、麦肯锡等机构的多位专家教授,组建了一个小组,每年发布AI 指数年度报告,全面追踪人工智能的最新发展状态和趋势。本报告也是斯坦福以人为本人工智能学院(HAI)成立以来第二次发布AI指数报告,HAI是近两年斯坦福大学成立的由李飞飞教授与哲学家John Etchemend等领导的新部门。

今年的报告,从学术、工业、开源、政府等方面详细介绍了人工智能发展的现状,并且记录了计算机视觉、自然语言理解等领域的技术进展。报告章节如下:

一、研究与发展

二、技术表现

三、经济

四、AI 教育

五、AI 应用的道德挑战

六、AI 多样性

七、AI 政策与国家策略

以下是报告重点介绍:

第一章:研究与发展

研发是AI进步的基础。自从1950年代技术首次激发计算机科学家和数学家的想象力以来,人工智能已发展成为具有重要商业应用的主要研究学科。在过去的20年中,AI论文的数量急剧增加。人工智能会议和预印本的兴起扩大了研究和学术交流的传播。包括中国、欧盟和美国在内的主要大国都在竞相投资人工智能研究。

1、中国AI顶会论文数量与引用量不成比例

从2019 年到2020 年,人工智能期刊的出版数量增长了34.5%,比2018 年至2019 年高出19.6%。

2000-2020年AI期刊论文数量

从全球来看,经过同行评审的AI 论文中,来自学术机构的比例最高。但各区域中,排名第二的机构有所不同:在美国,企业研究的学术发表排名第二,占出版总数的19.2%;而在中国与欧盟国家,政府主导的研究机构排名第二,分别占出版总数的15.6% 和欧盟17.2%。

2000-2019年中国经过同行评审的AI论文数量的机构分布

2020年,中国在AI 期刊的全球引用量首次超过美国。但是,在过去的10 年间,美国的AI 会议论文引用量一直高于中国。

2000-2020年AI期刊论文引用量的区域分布(占世界总数的百分比)

2000-2020年AI会议论文引用量的区域分布(占世界总数的百分比)

相比之下,中国在2019年全球AI会议论文数量中所占比例已经超过美国,论文引用量对比和论文数量对比有较大差别。自2000年以来,其比例显著增长。

2000-2020年AI会议论文的区域分布(占世界总数的百分比)

另外值得注意的是,在2000年至2019年之间,人工智能会议论文的数量增加了四倍,而在过去十年中增长趋于平稳,2019年的会议论文数量仅比2010年的数量高1.09倍,2020年相比2019年则有大幅下降。

2000-2020年AI会议论文数量

2、新冠疫情使AI顶会参会人数倍增

由于新冠疫情,大多AI 顶会都是线上召开,因此出席人数明显增加。2020年,九个AI 顶会(IROS、ICML、CVPR、AAAI、ICLR、ACL、AAMAS、KR、ICAPS)的参会人数都增加了将近一倍。

2010-2020年参加大型AI会议的人数

2010-2020年参加小型AI会议的人数

3、大公司加剧计算鸿沟?

随着时间推移,大型公司在人工智能会议中的存在率不断提高 。西部大学、弗吉尼亚理工大学和艾维商学院的研究人员认为,学术界计算能力的不平等分布(他们称之为“计算鸿沟”)加剧了深度学习时代的不平等现象。

大型科技公司往往拥有更多的资源来设计AI产品,但与精英或规模较小的机构相比,它们的多元化程度也较低,这引起了人们对人工智能内部偏见和公平的担忧。10个主要AI会议都显示出公司参与度的上升趋势,这进一步扩大了计算鸿沟。

《财富》全球500强发表在AI顶会中的论文数比例

4、TensorFlow依然领先

TensorFlow(由Google开发并于2017年公开发布)在2020年仍然是最受欢迎的AI框架。2020年第二大受欢迎的框架是Keras(也由Google开发,并基于TensorFlow 2.0构建)。

2014-2020年AI框架的GITHUB STARS数量

除TensorFlow之外,PyTorch(由Facebook创建)是另一个越来越受欢迎的框架。

2014-2020年AI框架的GITHUB STARS数量(不包括TensorFlow)

5、AI论文数量猛增

在过去的6 年间,发表在arXiv 上的AI 论文数量增长了6 倍以上(从2015 年的5,478 篇论文增加到2020 年的34,736 篇。

2015-2020年发表在arXiv上的AI论文数量

在2000年至2019年期间,AI论文的总数增长了近12倍。2019年,AI 学术论文占全球所有同行评审科学出版物的3.8%,与2011 年相比增加了1.3%,在2000年这一比例为0.82%。

2000-2019年经过同行评审的AI论文数量

2000-2019年经过同行评审的AI论文(占总数的百分比)

第二章:技术表现

尽管技术的进步使AI系统的部署比以往任何时候都更加广泛和轻松,但对AI使用的关注也在增长,尤其是在算法偏差等问题上。诸如能够合成图像和视频的新AI功能的出现也带来了道德挑战。

1、万物皆可生成?

AI 系统现在可以合成非常高质量的文本、音频和图像,人类甚至无法分辨出合成输出与非合成输出之间的区别。

在过去两年里,生成模型在STL-10数据集中生成令人信服的合成图像方面进展迅速,图像真实性越来越高。

2018-2020年生成模型在STL-10数据集上的FID得分

2014-2020年GAN人脸生成技术的进步

这些技术将促进大量有利于社会或不利于社会的AI 下游应用的出现,并促使研究员投入研究检测生成模型的技术中。比如,DeepFake 检测挑战(DeepFake Detection Challenge)数据显示了计算机在区分不同输出上的优秀能力。

DeepFake检测挑战模型的对数损失变化

2、CV正快速工业化,视频处理将是下一个风口?

CV 模型的性能在一些大型基准上开始趋于平缓,这表明社区需要开发并就更难的标准达成共识,以对性能进行进一步测试。

ImageNet挑战的TOP-1准确率变化

COCO密集姿态估计挑战的平均精度变化

同时,企业正在投入越来越多的计算资源,以前所未有的速度训练CV 系统。

ImageNet最佳系统的训练时间和硬件消耗

ImageNet训练时间分布的变化

ImageNet(到达93%准确率)的训练成本的变化

而且,在部署系统中使用的技术(例如用于分析视频中静止帧的目标检测框架)正在迅速成熟,表明将进一步部署AI。

YOLO的目标检测mAP变化

3、NLP 超越其评估指标

NLP的进展如此之快,以至于技术进步已经超过了基准测试。这一点可以从在SuperGLUE上获得人类水平性能的系统的快速兴起看出。SuperGLUE是为响应早期NLP 进展(超越GLUE 评估的功能)而开发的NLP 评估套件。

SuperGLUE基准

SQUAD 1.1 和SQUAD 2.0的F1 SCORE变化

GPT-3在42个基准测试上的平均表现

4、AI推理取得显著进步

大多数技术问题的度量标准都以固定的基准显示了每个时间点上最佳系统的性能。针对AI 指数开发的新分析提供了指标,这些指标可以用在不断更新的基准测试上,也可以用在获得一段时间内一组系统整体性能表现的单个信用系统上。这些分析适用于两个符号推理问题:自动定理证明(Automated Theorem Proving)和布尔公式的可满足性(Satisfiability of Boolean formulas)。

在布尔满足问题上,虽然从2016年到2018年最佳求解器的性能没有明显变化,但在2019年和2020年有明显的改进。

2016-2020年解决所有400个实例的总时间(布尔满足问题)

在自动定理证明上解决的问题比例持续上升,表明该领域取得了进展。值得注意的是,从2008年到2013年包括FOF、TF0和TH0子集实现了强劲发展。

1997-2020年解决的问题百分比(自动定理证明)

5、机器学习正在改变医疗保健和生物学领域

DeepMind 的AlphaFold 2应用了深度学习技术,在长达数十年的蛋白质折叠生物学挑战中取得了重大突破。

2006-2020年CASP最佳团队在自由建模中的预测准确度

科学家使用ML 模型来学习化学分子的表示形式,以进行更高效的化学合成规划。

CHEMICAL SYNTHESIS PLANS 基准的TOP-1测试准确率

AI 创业公司PostEra 使用基于ML的技术,在新冠疫情期间快速找到了相关的药物。

PostEra:Moonshot提交的药物总数(COVID Moonshot是一项众包计划,已有500多名国际科学家加入,以加快COVID-19抗病毒药物的开发)

“Transformers架构的统治地位令人瞩目,该架构最初是用于机器翻译的,但现在已经成为几乎通用的神经网络架构。更广泛地说,尽管NLP在利用深度学习方面落后于愿景,但现在看来NLP的进步也正在推动愿景。”——斯坦福大学Percy Liang

“最近在语言生成方面取得的令人难以置信的进步已对NLP和机器学习领域产生了深远的影响,使以前困难的研究挑战和数据集突然变得毫无用处,同时鼓励了新的研究工作投入到这些复杂的新模型中。”——艾伦AI研究所Carissa Schoenick

第三章:经济

人工智能(AI)的兴起不可避免地提出了一个问题,即技术将在多大程度上影响企业、劳动力和经济。考虑到AI的最新进展和众多突破,该领域为企业带来了巨大的利益和机遇,从自动化的生产率提高到使用算法为消费者量身定制产品、大规模分析数据等等。

但是,人工智能所承诺的效率和生产率的提高也带来了巨大的挑战:公司必须努力寻找并留住熟练的人才来满足他们的生产需求,同时要牢记实施措施以减轻使用人工智能的风险。此外,COVID-19大流行给全球经济造成混乱和持续的不确定性。私营公司如何依靠并扩展AI技术来帮助其企业度过最困难的时期?

1、AI生物获得最多AI投资

“药物、癌症、分子、药物发现”在2020 年获得了最大的私人AI 投资,总额超过138 亿美元,是2019 年的4.5 倍。

2019年与2020年AI全球私人投资的领域分布

2、新冠没有阻止AI人才的工作热情

2016 年至2020 年,巴西、印度、加拿大、新加坡和南非是AI 招聘人数增长最快的国家。尽管新冠疫情爆发,但2020年,所有采样国家的AI 招聘人数都还在继续增长。

2020年AI招聘指数的国家分布

2016-2020年AI招聘指数在不同国家变化

2013-2020年美国的AI招聘信息(占所有招聘信息的百分比)

3、印度AI技术普及度最高?

2015年至2020年的汇总数据显示,印度(全球平均水平的2.83倍)的AI技术相对普及率最高,其次是美国(全球平均水平的1.99倍), 中国(全球平均值的1.40倍),德国(全球平均值的1.27倍)和加拿大(全球平均值的1.13倍)。

2015-2020年按国家划分的AI技能相对普及率

4、AI私人投资趋向头部独角兽?

越来越多AI 私人投资集中到少数的初创公司中。尽管出现疫情,但2020 年的私人AI 投资金额比2019 年增加了9.3%,比2018年至2019年的增长率(5.7%)更高,尽管新成立公司的数量连续三年都在下降。

2015-2020年全球新增AI公司数量

2015-2020年度AI基金公司的私人投资额

2015-2020年AI私人投资的国家分布

5、AI道德问题不受关注?

麦肯锡的一项调查显示,尽管越来越多人呼吁解决AI 使用相关的道德问题,但业界在解决这些问题的努力上非常少。例如,AI 的平等和公平问题受到公司的关注相对较少。此外,与2019年相比,2020年,越来越少公司将个人隐私视为相关风险,并且受访者中,正在采取措施来减轻这些特殊风险的企业百分比没有发生变化。

2020年机构认为与采用AI技术相关的风险的比例

2020年机构采取措施以缓解AI带来的风险的比例

6、新冠疫情没有阻挡投资者的热情

尽管疫情造成了经济衰退,但在麦肯锡的一项调查中,有一半的受访者表示,新冠疫情对他们在AI 方面的投资没有影响,27% 的受访者甚至表示AI 投资有所增加。只有不到四分之一的企业减少了对AI 的投资。

COVID-19大流行期间的AI投资变化

7、美国AI人才就业严峻

自2019 年到2020 年,美国的AI 岗位发布比例有所下降,这也是6 年以来的首次下降。从2019 年到2020 年,美国的AI 岗位发布总数下降了8.2%,从2019 年的325,724 个岗位减少到2020 年的300,999 个职位。

2013-2020年按国家划分的AI职位(占所有职位的百分比)

第四章:AI教育

随着AI成为经济活动的越来越重要驱动力,想要了解它并获得从事该领域工作的必要资格的人们对之越来越感兴趣。同时,工业界对AI的需求不断增长,正吸引着更多的教授离开学术界进入私营部门。本章重点介绍AI人才的流动趋势。

1、世界顶级大学对AI教育的重视度如何?

2020年 的一项AI 指数调查显示,过去4 年间,世界顶级大学均提高了在AI 教育上的投资。在过去的4 个学年里,向本科生与研究生传授AI 应用技能的课程数量分别增加了102.9% 和  41.7% ,如下图所示。

2、AI博士生更多选择学术界还是工业界?

根据计算机研究协会(CRA)的年度调查,过去的10年里,在北美地区,选择进入工业界的AI 博士生更多,而选择进入学术界工作的较少。

具体而言,过去10 年选择进入业界工作的AI 博士毕业生的比例增加了48% (从2010 年的44.4% 增至2019 年的65.7%,如下图蓝线所示)。

相比之下,进入学术界的AI 博士毕业生的比例下降了44%(从2010 年的42.1% 下降至2019 年的23.7%,如下图红线所示)。

3、AI专业在CS博士群体中有多火爆?

根据CRA 的调查,在过去的10年里,美国AI 博士毕业生数量占比可真谓是一冲再冲、独占鳌头———从占CS 博士毕业生总数的14.2%,上升到了2019 年的约23%(如下图所示),而排名二三位的 理论&算法、机器人/视觉占比都是不到10%。

同时,其他以前热门的CS 博士学位专业的人气则是有所下降,比如网络、软件工程和编程语言。相对于2010年,所有编译器专业都减少了博士学位的授予数量,而AI 和机器人/视觉专业领域则有了大幅增长。

4、AI 教职人员转业界发展趋势下降还是增长?

经过两年的发展,在北美地区,从大学AI 教职人员转到业界发展的人数从2018 年的42 人下降至2019 年的33 人(其中28 人是终身教职,5 人是无教职员工)。

其中卡内基梅隆大学在2004 年至2019 年间的 AI 教职员工人数最多(16人),其次是佐治亚理工学院(14人)和华盛顿大学(12人)。

5、AI 博士国际毕业生占比如何?

2019年,北美地区AI 博士毕业生的国际学生比例继续上升,达到64.3%,相比2018 年增长了4.3%。

6、AI 博士国际毕业生去向如何?

调查数据显示,大约81.8%的国际毕业生会留在美国工作,而8.6% 的毕业生则在其他地区任职。这大概能说明美国对AI博士国际毕业生的吸引力很强,人才留存率很高。

另外在欧盟国家中,绝大多数专业的AI 学术课程都只是面向硕士生授课。目前,机器人技术和自动化是本科生和硕士生最常学习的课程,而机器学习在短期课程专业中占最大比例。

第五章:AI 应用的道德挑战

随着以人工智能为基础的创新在我们的生活中变得越来越普遍,人工智能应用的道德挑战越来越明显,并且受到了严格审查。如前几章所述,各种AI技术的使用会导致意想不到但有害的后果,例如侵犯隐私、基于性别、种族/民族、性取向或性别认同的歧视和不透明的决策等问题。

应对现有的道德挑战,并在部署之前构建负责任的、公平的AI创新,这一点正从未如此重要过。

本章介绍了为解决随着AI应用程序的兴起而出现的道德问题所做的努力。

1、AI道德关键字在论文标题上的体现如何?

自2015 年起,尽管在主流AI 会议上,论文标题与道德关键字相匹配的论文平均数量仍处于较低水平,但这一数量已经多少有所增加,每年增长大概1到2个百分点如下图所示。

2、各个国家地区新出台了多少AI道德原则?

自2015年以来,政府,私人公司,政府组织和研究/专业组织一直在编写规范性原则文件,以应对AI应用道德挑战的方法。

AI原则的发布表明组织正在注意并建立AI治理的愿景。即便如此,所谓伦理原则的泛滥也遭到了伦理研究者和人权从业者的批评,他们反对与伦理有关的术语的不精确使用以及缺乏制度框架,在大多数情况下不具有约束力。这些原则的模糊和抽象无法为如何具体实施与AI相关的道德准则提供指导。

下图显示了在2015年至2020年期间,共发布了117篇与AI原则有关的文件。

数据显示,截至2020年,欧洲和中亚地区的发布数量最多(52),其次是北美(41)、东亚和太平洋地区(14)。

而就推行道德原则而言,在2018年对于包括IBM,Google和Facebook在内的科技公司以及英国,欧盟和澳大利亚政府机构在内的高科技公司来说无疑是一波小高潮。而推行之后的效果如何就得另说了。

3、AI道德相关的新闻报道主题?

从下图可以看出,排在前四位的分别是:1、指导咨询,框架;2、研究,教育;3、人脸识别;4、算法偏差。

4、最受关注的AI伦理新闻话题?

2020年有关AI伦理的话题真可谓是一波未平,一波又起,其中最受关注的5 个AI 伦理新闻话题分别是:

1、欧盟委员会发布AI白皮书;

2、谷歌解雇AI 伦理学研究员Timnit Gebru;

3、联合国成立AI 伦理委员会;

4、梵蒂冈发布AI 伦理计划;

5、IBM退出人脸识别业务。

第六章:AI多样性

尽管人工智能具有极大地影响社会的潜力,但构建AI系统的人员并不能代表那些系统所服务的人员。尽管多年来人民一直在强调AI带来的不利因素和风险,但AI劳动力在学术界和行业中仍然主要是男性为主,并且缺乏多样性。

种族、性别认同和性取向方面缺乏多样性,不仅有可能在劳动力中造成权力分配不均的风险,而且同样重要的是,加剧了人工智能系统产生的不平等现象,并导致不公正的结果。

1、AI多样性在性别上的写实?

十多年来,女性AI博士毕业生和计算机科学终身制教师的比例一直很低。根据计算机研究协会(CRA)的年度调查,北美AI博士女毕业生平均不到所有博士毕业生的18%。另一项AI指数调查显示,在全球很多所大学中,女教师仅占所有终身制CS教职员工的16%。

2、AI多样性在种族上的写实?

CRA调查显示,2019年美国居民AI博士新毕业生中,白人占45%,亚洲人占22.4%,西班牙裔占3.2%,非裔美国人占2.4%,如下图所示。

在过去的十年中,白人(非西班牙裔)新计算机博士学位的百分比变化不大,平均占62.7%。同期黑人或非裔美国人(非西班牙裔)和西班牙裔计算机博士学位的比例明显较低,平均分别为3.1%和3.3%。

3、AI顶会中的黑人研讨会?

从下图可以看出,近年来与NeurIPS 共同举办的A黑人研讨会中,2019年的与会者和提交的论文数量是2017年的2.6倍,而被接受论文的数量是2.1倍。

4、AI领域中受到的歧视如何?

在Queer在2020年对AI成员的调查中,几乎一半的受访者表示,他们认为该领域缺乏包容性是他们成为AI / ML领域从业者所面临的障碍。接受调查的成员中,有40%以上表示他们在工作或学校中遭受过歧视或骚扰(以及被歧视的次数),如下图所示。

第七章:人工智能政策与国家战略

人工智能将在未来几十年内塑造全球竞争力,并有望为早期实践应用者赋予重要的经济和战略优势。迄今为止,各国政府以及地区和政府间组织已竞相制定以AI为目标的政策,以最大程度地利用该技术,同时解决其社会和道德影响。

自加拿大于2017年发布全球首个国家人工智能战略以来,截至2020年12月,其他30多个国家和地区也都积极发布了类似的文件。

1、美国如何做的?

2020年启动了全球AI伙伴关系(GPAI)和经济合作与发展组织(OECD)AI政策观察站以及AI专家网络,促进了政府间共同努力以支持所有人的AI发展。

在美国,第116届国会是历史上最关注AI的国会会议。本届国会在立法、委员会报告和国会研究服务(CRS)报告中提及AI的次数是第115届国会的三倍多。

2019年和2020年的综合数据表明,创新和技术,国际事务和国际安全,行业和法规等主题是美国AI政策文件的主要重点,如下图所示。

2、中国如何做的?

中国是人工智能大国,中国选择参加了一系列科技双边协议,这些协议强调在“一带一路”倡议的框架下,开展作为数字丝绸之路一部分的人工智能合作。例如,在“一带一路”倡议下与阿拉伯联合酋长国的中国经济合作中提到了人工智能。

(注:关于中国在AI方面更多政策和战略,本报告中未提及太多。)

最后,这是一份完整详尽的全球AI指数报告,在新的一年为大家从各个方面展示了AI全球图景,这或许能为各个国家、企业、组织、个人等做下一步的AI规划参考。

更多内容请移步完整版报告链接:https://aiindex.stanford.edu/wp-content/uploads/2021/03/2021-AI-Index-Report_Master.pdf

来源:AI科技评论