英特尔连甩AI大招!288核至强芯、3代AI芯片、PC断网跑大模型
发布时间:2023-09-229月19日,2023英特尔On技术创新峰会在美国加州圣何塞盛大开幕。
本次峰会的主题是“让AI无处不在,从客户端和边缘到网络与云”。会上,英特尔甩出了一揽子的产品方案和未来技术路线图:
面向AI计算,首先,英特尔首次亮出三代AI芯片路线图,采用5nm制程的Gaudi 3将于明年推出,再下一代AI芯片代号为Falcon Shores。
Gaudi 3的算力是Gaudi 2的两倍,网络带宽、HBM容量是Gaudi 2的1.5倍。
其次,英特尔介绍了一台完全采用英特尔至强处理器和4000个英特尔Gaudi2加速器打造的大型AI超级计算机,它将跻身全球TOP15超算。AI独角兽企业Stability AI是这个超算的主要客户。
阿里云CTO周靖人通过一段视频短片,阐述了阿里巴巴如何将内置AI加速器的第四代英特尔至强可扩展处理器用于其生成式AI和大语言模型,即“阿里云通义千问大模型”。他谈到英特尔技术大幅缩短了模型响应时间,平均加速可达3倍。
在桌面端,英特尔提出“AI PC”概念,预告未来两年三款酷睿处理器,并现场演示了在基于英特尔技术的PC(个人电脑)上用生成式AI模型生成一段泰勒斯威夫特曲风的歌曲、在断网情况下跟AI聊天机器人实时聊天,以及在远程视频聊天中实时将法语转写翻译成英语等能力。
知名华裔AI科学家李飞飞(Fei-Fei Li)也来到现场,与英特尔智能系统研究实验室Fellow及主任Lama Nachman进行对谈。
此外,英特尔宣布英特尔开发者云全面上线,发布发行版OpenVINO工具套件2023.1版,并预览了晒出了面向云端数据中心的最新英特尔至强处理器路线图,第五代英特尔至强处理器将于12月14日发布。
一项令人印象深刻的发布是,英特尔宣布与Arm联手,Arm将支持英特尔OpenVINO。
在先进制造与封测方面,基辛格重申:摩尔定律活得好着呢!
基辛格宣布,英特尔的“四年五个制程节点”计划进展顺利,并分享了英特尔在先进封装和国际Chiplet标准UCIe上的最新进展,还展示了基于Intel 3制程节点和基于台积电N3E制程节点的两个UCIe IP芯粒。Intel 7已实现大规模量产,Intel 4已生产准备就绪,Intel 3按计划推进中,目标是2023年年底。
最后,基辛格分享了英特尔神经拟态、量子计算及量子SDK等面向未来的先进计算的最新进展。
01.
AI促进“芯经济”崛起,
英特尔开发者云平台全面上线
峰会开场前,先播放了由英特尔CEO帕特·基辛格出演的一个炫酷小短片。基辛格努力运动,通过采集数据训练出一个“AI增强版CEO”。
紧承其后,基辛格一出场,上来就先做了几个俯卧撑,然后说出今天的主题:AI代表新时代的到来,创造了巨大的机会,今天峰会将探讨如何让AI无处不在,使其在从客户端和边缘,到网络和云的所有工作负载中得到更普遍的应用。
这是为了引出第一个使用英特尔AI的案例——英国AI公司ai.io使用英特尔技术来加速应用程序,从而评估运动员的表现。
基辛格强调了硅芯片和AI的重要性,芯片支持着5740亿美元的半导体产业,驱动着全球约8万亿美元的技术经济,然后抛出一个“芯经济”概念,谈到世界对计算的需求呈指数级增长,这种需求与芯片的面积、成本和功耗成反比。简而言之,这就是摩尔定律。
更充足、更强大、更具性价比的处理能力,是经济增长的关键组成。“AI代表着计算的新时代”基辛格说,这促进了“芯经济”的崛起。
他介绍了今天的第一项发布——英特尔开发者云(Intel Developer Cloud)平台全面上线。
英特尔开发者云平台可以帮助开发者利用最新的英特尔软硬件创新来进行AI开发,包括使用英特尔云端AI训练芯片Gaudi2,并授权开发者使用英特尔最新的硬件平台,如第五代英特尔至强可扩展处理器和英特尔数据中心GPU Max系列1100和1550。
在使用英特尔开发者云平台时,开发者可以构建、测试并优化AI以及HPC应用程序,还可以运行从小规模到大规模的AI训练、模型优化和推理工作负载,以实现高性能和高效率。
该云平台建立在支持多架构、多厂商硬件的oneAPI编程模型基础之上,为开发者提供硬件选择,并摆脱了专有编程模型,以支持加速计算、代码重用和满足可移植性需求。
02.
AI PC:现场AI生成“霉霉”曲风,
本地畅跑大语言模型
第二个发布重点是基辛格提出的“AI PC”概念。AI将通过云与PC的紧密协作,进而从根本上改变、重塑和重构PC体验,释放人们的生产力和创造力。我们正迈向AI PC的新时代。
现场演示了在基于英特尔技术的PC(个人电脑)上用生成式AI模型生成一段泰勒·斯威夫特(中国歌迷称呼“霉霉”)曲风的歌曲。
全新PC体验在新推出的代号为Meteor Lake的英特尔酷睿Ultra处理器上得到展现。该处理器配备英特尔首款集成的神经网络处理器(NPU),用于在PC上带来高能效的AI加速和本地推理体验。酷睿Ultra将在12月14日发布。
酷睿Ultra处理器是英特尔客户端处理器路线图的一个转折点——首个采用Foveros封装技术的客户端芯粒设计。该处理器内置NPU,采用Intel 4制程节点,还通过集成英特尔锐炫显卡,带来了独立显卡级别的性能。
宏碁首席运营官高树国来到现场为英特尔站台,介绍了搭载酷睿Ultra处理器的宏碁笔记本电脑。高树国说:“我们与英特尔团队合作,通过OpenVINO工具包共同开发了一套宏碁AI库,以充分利用英特尔酷睿Ultra平台,还共同开发了AI库,最终将这款产品带给用户。”
用AI提取音频和视频内容的Rewind AI也来到现场,演示在断网的情况下,由英特尔OpenVINO驱动完全在PC本地运行大语言模型,与AI聊天机器人进行实时问答。
随后英特尔演示了将远程视频聊天中的法语实时转写翻译成英语的能力。
03.
云端:晒未来四代至强路线图,
预告288核高能效处理器
英特尔预览了下一代英特尔至强处理器,第五代英特尔至强处理器将于12月14日发布,届时将在相同功耗下为数据中心提高性能和存储速度。
具备高能效的能效核(E-core)处理器Sierra Forest将于2024年上半年上市。与第四代至强相比,拥有288核的该处理器预计将使机架密度提升2.5倍,每瓦性能提高2.4倍。
紧随Sierra Forest发布的是具备高性能的性能核(P-core)处理器Granite Rapids,与第四代至强相比,其AI性能预计将提高2到3倍。
2025年,代号为Clearwater Forest的下一代至强能效核处理器将基于Intel 18A制程节点制造。
基辛格说,五大超级技术力量——计算、连接、基础设施、人工智能、传感和感知,由“芯经济”推动。
基辛格宣布了英特尔发行版OpenVINO工具套件2023.1版的发布,OpenVINO是英特尔的AI推理和部署运行工具套件,在客户端和边缘平台上为开发人员提供了优质选择。该版本包括针对跨操作系统和各种不同云解决方案的集成而优化的预训练模型,包括多个生成式AI模型,例如Meta的Llama 2模型。
Strata项目以及边缘原生软件平台的开发:该平台将于2024年推出,提供模块化构件、优质服务和产品支持。
这是一种横向扩展智能边缘和混合人工智能所需基础设施的方式,并将英特尔和第三方的垂直应用程序整合在一个生态系统内。该解决方案将使开发人员能够构建、部署、运行、管理、连接和保护分布式边缘基础设施和应用程序。
04.
披露未来制程节点计划,
Intel 3制程今年年底见
英特尔的“四年五个制程节点”计划进展顺利,Intel 7已经实现大规模量产,Intel 4已经生产准备就绪,Intel 3也在按计划推进中,目标是2023年年底。
Intel 20A将是首个应用PowerVia背面供电技术和新型全环绕栅极晶体管RibbonFET的制程节点。同样将采用这两项技术的Intel 18A制程节点也在按计划推进中,将于2024年下半年生产准备就绪。
此前英特尔Intel 18A已官宣多项进展。今年4月,英特尔代工服务事业部(IFS)和Arm宣布签署协议,旨在使芯片设计公司可利用Intel 18A制程工艺来开发低功耗计算SoC。今年7月,爱立信宣布将采用英特尔18A制程和制造技术为爱立信的下一代5G基础设施优化提供支持。
除制程外,英特尔向前推进摩尔定律的另一路径是使用新材料和新封装技术,如玻璃基板(glass substrates)。
这是英特尔刚于本周宣布的一项突破。玻璃基板将于2020年代后期推出,继续增加单个封装内的晶体管数量,助力满足AI等数据密集型高性能工作负载的需求,并在2030年后继续推进摩尔定律。
英特尔展示了基于通用芯粒高速互连开放规范(UCIe)的测试芯片封装。该测试芯片集成了基于Intel 3制程节点的英特尔UCIe IP芯粒,和基于台积电N3E制程节点的新思科技UCIe IP芯粒。
这些芯粒通过EMIB(嵌入式多芯片互连桥接)先进封装技术互连在一起。英特尔代工服务(Intel Foundry Services)、台积电和新思科技携手推动UCIe的发展,体现了三者支持基于开放标准的芯粒生态系统的承诺。
基辛格认为,摩尔定律的下一波浪潮将由多芯粒封装技术所推动,如果开放标准能够解决IP集成的障碍,它将很快变成现实。去年发起的UCIe标准将让来自不同厂商的芯粒能够协同工作,以新型芯片设计满足不同AI工作负载的扩展需求。
目前,UCIe开放标准已经得到了超过120家公司的支持。
最后,基辛格介绍了英特尔神经拟态计算、量子计算等前沿研究的最新进展。
基于Loihi 2第二代研究芯片和开源Lava软件框架,英特尔研究院正在推动神经拟态计算的发展。Loihi 2基于Intel 4制程节点开发,每个芯片最多可包含100万个神经元。
Loihi 2还具有可扩展性,8芯片Loihi 2开发板Kapoho Point,可通过堆叠满足大规模工作负载的需求。英特尔提供了开源、模块化、可扩展的Lava软件框架,助力神经拟态应用开发。
量子计算方面,今年6月,英特尔发布包含12个硅自旋量子比特(silicon spin qubit)的全新量子芯片Tunnel Falls,继续探索量子实用性。
在英特尔的晶圆厂里,Tunnel Falls是在300毫米的硅晶圆上生产的,利用了英特尔领先的晶体管工业化制造能力,如极紫外光刻(EUV)技术,以及栅极和接触层加工技术。
05.
结语:英特尔全面拥抱AI
一如既往,英特尔将每年“压箱底”的创新积累拿出来倾数分享,从芯片制造如何推进摩尔定律,到如何从PC到云端数据中心让AI无处不在,以创造驱动未来的硅芯之门。
生成式AI与大模型浪潮的影响已经发生在更广泛的市场机会中,从基础设施层到系统层,再到应用层和服务层,人们需要的解决方案、平台和技术正在以极快的速度变化,我们看到英特尔正以自己的方式对不断变化的需求做出回应。
英特尔已将AI构建到每个平台,从PC端、边缘、网络到数据中心,其整体AI战略侧重于AI基础设施、AI平台、AIaaS(AI即服务)以及AI应用,旨在解锁整个AI可持续性,让AI技术越来越触手可及。
来源:芯东西