谷歌DeepMind团队发布Gemini 2.5 Pro,编程性能超越Claude3.7

发布时间:2025-05-19

谷歌DeepMind团队近日发布了升级版Gemini 2.5 Pro(I/O版)AI模型,该模型由诺贝尔奖得主、DeepMind CEO Demis Hassabis领衔推出,并得到谷歌母公司Alphabet CEO及Google AI负责人Jeff Dean的公开支持。在正式亮相前,团队通过Google AI Studio和Vertex AI平台向开发者开放了API接口,并获得了Cursor CEO Michael Truell等业内人士的高度评价,称其在工具调用失败率等方面有显著改进。

fr5.1.png

fr5.2.png

此次升级的核心突破在于Gemini 2.5 Pro一举斩获文本、视觉和WebDev三大领域基准测试冠军,成为首个全面超越Claude 3.7和GPT-4系列模型的SOTA系统。其突出亮点包括:能将手绘草图即时转化为交互式网页应用,根据自然图像生成代码图案,以及将YouTube视频转录为可交互的p5.js动画。开发者实测显示,该模型在智能花园规划、3D太阳系模拟、物理光影动态等复杂场景中表现卓越,用户可在20分钟内创建城市交通模拟器等复杂项目,尤其在代码转换与智能体工作流开发方面展现碾压性优势。DeepMind研究员Hassabis透露,模型ELO评分提升达147分,视频理解能力更在VideoMME基准测试中获得84.8%的高分。这些突破标志着AI编程领域的技术壁垒被再次刷新。

来源:阿尔法公社