微软发布GPT-4报告:《通用人工智能的火花:GPT-4的早期实验》【附源论文&中文翻译文件】

发布时间:2023-03-31

23年3月,在 OpenAI 发布GPT-4之后,微软随后发表了GPT-4的能力测评了论文《Sparks of Artifificial General Intelligence: Early experiments with GPT-4》。论文一发布,立刻引发业界轰然。


GPT-4 能力测评,部分能力甚至超过人类

文中对 GPT-4 进行了全面评测,通过测试,微软的研究者证实:GPT-4不仅精通语言,还能在数学、编程、视觉、医学、法律、心理学等多样化和高难度的任务中表现出色,且无需特别提示。

例如,为了测试模型将艺术与编程相结合的能力,该研究要求 GPT-4 用 javascript 写一段代码,以生成康定斯基风格的随机图像,下图第一张为 Wassily Kandinsky 创作的,第二张和第三张分别由 GPT-4 和 ChatGPT 生成的:

你还能要求 GPT-4 用 ABC 记谱法生成和修改曲调:

更令人惊奇的是,其前端 / 游戏开发能力也惊人。该研究让 GPT-4 用 JavaScript 在 HTML 中编写 3D 游戏,GPT-4 在零样本的情况下生成了一个满足所有要求的游戏。

GPT-4可被视作AGI (通用人工智能)的早期版本

此外,文中也也指出AGI具有推理、规划、解决问题、抽象思维、理解复杂思想、快速学习和经验学习能力。「GPT-4初具AGI雏形」的观点被首次提出。颇具盛名的微软雷蒙德研究院机器学习理论组负责人万引大神 Sébastien Bubeck 联手2023新视野数学奖得主 Ronen Eldan、2023新晋斯隆研究奖得主李远志、2020斯隆研究奖得主Yin Tat Lee等人,将“GPT-4可被视作AGI (通用人工智能)的早期版本”这句跨时代的话写进论文结论部分。他们认为「鉴于 GPT-4 能力的广度和深度,我们相信它应该被合理视作一个通用人工智能(AGI)系统的早期(但仍不完整)版本」。微软还表示,「本文的主要目标是对 GPT-4 的能力和局限性进行探索,我们相信 GPT-4 的智能标志着计算机科学及其他领域的真正范式转变」。

另外有趣的是,有读者发现在未删减版的论文中,GPT-4实际上也是该论文的隐藏第三作者,内部名称 DV-3,后被删除。据 Paper with Code 统计,这篇论文是最近30天内关注度最高的AI论文,没有之一。值得一读。

腾讯云开发者中英文-文件速递

论文分为 10 个章节:第一章为总括部分;第二章介绍了多模态,主要和视觉生成内容相关;第三章代码,根据指令生成代码、理解现有代码;第四章数学能力;第五章与世界的交互;第六章与人类的交互;第七章判别力;第八章 GPT-4 局限性;第九章社会影响;第十章未来方向及结论。

【腾讯云开发者译中版】人工通用智能的星星之火-GPT-4的早期实验.pdf

【论文原文】Sparks of Artificial General Intelligence-Early experiments with GPT-4.pdf

来源:腾讯云