DeepMind突破性研究:AI自主玩转《我的世界》,论文登上Nature
发布时间:2025-04-23近日,DeepMind开发的DreamerV3智能体在游戏《我的世界》中实现重大突破,无需人类数据干预,仅通过强化学习与自建“世界模型”,成功完成高难度钻石收集任务。这一成果发表于2025年4月的《Nature》期刊,论文由Danijar Hafner等研究者主导。
团队指出,Dreamer的核心创新在于摒弃传统依赖人类示范数据的训练方式,完全通过试错学习掌握复杂任务链。
研究亮点在于Dreamer构建的“世界模型”系统,该模型通过三个神经网络协同工作:世界模型负责预测环境状态与奖励,评论家网络评估行动价值,行动者网络决策最优策略。在《我的世界》随机生成的3D环境中,智能体需完成伐木、制作工具、采矿等12项子任务才能获取钻石,全程依赖内部“想象”规划路径。
实验显示,Dreamer在连续9天游戏后达成目标,对比PPO、Rainbow等算法展现显著优势。团队进一步验证了该框架在机器人控制、Atari游戏等150余项任务中的通用性,其数据效率与跨领域适应性为AI自主学习树立新标杆。
论文链接:https://www.nature.com/articles/s41586-025-08744-2
来源:阿尔法公社