菜单导航

英伟达(NVDA.O)|2022 GTC:全新架构GPU,硬件、软

作者: 精装之家 来源: 精装之家 发布时间: 2022年03月27日 05:43:16

  英伟达于近期举办2022GTC大会,发布HoPPer架构GPU,并更新在AI硬件、软件平台、软件应用等领域最新产品进展和动态。全新一代Hopper架构GPU在制程工艺、晶体管数量、大模型支持、内存带宽等核心技术特性方面较上一代安培架构大幅升级。同时在CPU、高速网卡、芯片互联(NVlink)等产品&技术层面亦进展明显,叠加底层软件平台CUDA等的升级,我们看好公司在数据中心领域的持续领先优势。同时公司在应用层的软件布局亦进展喜人,包括Omniverse cloud、自动驾驶(Drive)、医疗(Clara Holoscan)、人形机器人(Metropolis)等,软件业务有望逐步成为公司重要的营收来源,以及长期成长性的支撑。持续领先的产品,叠加软硬一体化平台能力,我们持续看好公司的短期、中长期投资价值。

  ▍AI硬件:英伟达在2022GTC大会上发布基于最新Hopper架构及NVLink和Switch的计算加速卡H100、计算平台DGX H100、超级计算机Eos等,同时公布了CPU产品Grace的最新进展。

  1)H100:(a)从参数配置来看,H100含有800亿个晶体管(上代产品为540亿个),采用台积电4nm工艺。同时支持Transform引擎(性能较上代产品提升六倍)、机密计算(首次支持机密计算功能)、NVLink(最多可实现256个H100 GPU的链接)、DPX指令(性能较上代产品提升7-40倍)等技术。目前H100共包含SXM、PCIe 5.0两种形态,以满足下游不同客户的需求。(b)从应用场景来看,H100 可部署于各种数据中心,包括内部私有云、云、混合云和边缘数据中心。公司预计最新的H100将于2022年下半年开始出货。

  2)DGX H100:(a)从参数配置来看,DGX H100系统集成八颗H100芯片、搭配两颗PCIe 5.0 CPU处理器(Intel Sapphire Rapids四代可扩展至器),拥有总计6400亿个晶体管、640GB HBM3显存、24TB/s显存带宽。(b)从AI能力来看,AI算力32PFlops(每秒3.2亿亿次),浮点算力FP64 480TFlops(每秒480万亿次),FP16 1.6PFlops(每秒1.6千万亿次),FP8 3.2PFlops(每秒3.2千亿次),分别是上代DGX A100的3倍、3倍、6倍,而且新增支持网络内计算,性能3.6TFlops。

  3)DGX SuperPOD架构。从参数配置来看,通过公司最新的NVLink技术,最多可将32个DGX H100实现链接。通过公司最新的NVLink Switch系统,可将DGX系统链接到Quantum-2 400 Gbps InfiniBand 交换机,最多实现数千个H100的链接与共享。(b)从用途来看,公司依托DGX SuperPOD努力打造Hopper AI工厂。

  4)发布Eos超级计算机。通过上述系统级工程技术,公司发布Eos超级计算机,主要是由576个DGX H100服务器系统和4608个DGX H100显卡组成,可提供18.4 EFLOPS的AI计算性能,比目前世界上最快的超算——日本的「富岳」快4倍。

  5)Grace:Grace是英伟达面向数据中心打造的CPU芯片,专注于处理海量数据处理。在此次GTC大会上,公司公布了Grace芯片的最新进展。Grace产品主要包括Grace Hopper(CPU+GPU的结合体)、Grace CPU Superchip(两个CPU结合体)两种,公司预计该款芯片将于2023年出货。

  6)从公司在AI加速领域的产品布局来看,公司依托GPU加速卡、DGX系统、NVLink技术、Switch系统、CPU产品等,实现了产品模块的布局,在很大程度上降低了定制化开发的研发成本及应用场景有限的弊端。

  展望未来,我们持续看好公司在数据中心“底层芯片、加速堆栈、行业垂直方案、具体应用的全栈式产品线”的布局。中长期来看,千行百业数字化转型是未来发展趋势,推动AI训练、AI推理、HPC等并行计算相关的需求快速爆发;从竞争格局来看,英伟达凭借丰富的产品矩阵以及强大的AI能力,应用场景不断丰富,系统级竞争优势突出。

  ▍AI软件:GTC大会新更新60多个SDK应用程序,CUDA生态系统建设不断加速。

  1)英伟达致力于做AI全栈式布局的供应商,涵盖AI计算硬件、软件领域。近些年来,公司依托CUDA架构,不断加大在AI软件领域中的产品布局。截至目前,全球已有超过数百万研发人员使用英伟达SDK来加速他们的处理工作。在此次GTC大会上,公司更新了约60多个SDK应用程序(2021年更新约65个SDK应用),不断加速推进CUDA生态系统的建设。

  2)从此次SDK产品更新的进展来看,主要涉及Riva语音2.0、Maxine视频通话模型、数据处理引擎(RAPIDS)、多代理多约束路线规划(CUOPT)、网络安全深度学习框架(Morpheus)、量子电路加速仿真器(cuQuantum)、5G无线电加速软件(Ariel)、6G通信研究框架(Sionna)。

  ▍AI平台软件:加大在Omniverse&机器人平台领域中的布局。

  1)公司认为,经过若干年的发展,TensorFlow和Pytorch已成为AI框架中必不可少的部分。未来AI的发展方向将沿着机器人或AI规划行动展开。为抢占后续市场份额,公司将依托Omniverse加大在数字机器人、虚拟形象和实体机器人领域中的布局。