谷歌发布Gemini Robotics On-Device,实现机器人AI模型本地化运行
发布时间:2025-07-186月24日,谷歌DeepMind推出全新机器人端侧模型Gemini Robotics On-Device,这是其首个可直接部署在机器人上的视觉-语言-动作(VLA)模型,基于多模态推理模型Gemini 2.0开发。该模型由加州大学伯克利分校、多伦多大学等机构联合支持,其配套的MuJoCo Playground模拟器刚获得机器人科学与系统会议杰出论文奖,标志着机器人智能研究的重要进展。
Gemini Robotics On-Device具备三大突破性能力:无需网络连接即可实现低延迟推理,在拉开拉链、折叠衣物等灵巧操作任务中表现优异;仅需50-100个演示样本就能快速适应新任务,成功跨平台部署至Franka FR3双臂机器人和Apollo人形机器人;在分布外任务测试中,其性能显著优于其他端侧模型。谷歌同步发布了配套SDK工具包,开发者可在MuJoCo模拟器中测试模型表现。此外,DeepMind还宣布下调Gemini系列免费API调用额度,并推出新一代图像生成模型Imagen 4系列,其中Imagen 4 Ultra已开放免费试用。
https://mp.weixin.qq.com/s/JfxwsoHgQqsp4q1-7HZLmw
来源:阿尔法公社/DeepTech深科技