菜单导航

平庸向左,黄仁勋向右

作者: 精装之家 来源: 精装之家 发布时间: 2022年04月01日 20:22:19

不提供二次转载

01

创立一家公司很容易,保持一家公司活着很难。

为了让曾经多次处在存亡之际的英伟达能够活下去,联合创始人兼 CEO 黄仁勋 (Jensen Huang) 在过去的29年里曾经做出许多在当时极具风险的决定。

神奇的是,这些决定当中的绝大多数,最后竟然都被证明是正确的:从 TNT,到可编程 Shader(着色器),再到 CUDA 架构以及其开源和前向兼容,以及总是超过当前图形市场主流应用场景需求的算力和存储性能水平——这些关键的技术和产品,以及革新性的战略决策,一次又一次将英伟达在计算市场的地位推至新高。

在营销策略助推下,今天的人们尊称黄仁勋为“AI教父”,夸张地将英伟达的图形计算产品描述为“核弹”。然而实际上,黄仁勋并没有什么封神的幻想——他做出的很多决定,完全是为了避免自己最害怕的事情发生:

英伟达沦为一家平庸的个人电脑零部件供应商。

“屏幕上就有那么多像素,芯片上能加的功能就那么多,但晶体管的数量还在不断增加。这样下去,在某个时间点上,图形计算性能完全可以足够任何人使用。你看今天各种集成显卡,性能又好,又不要钱,就会发现这个分析是完全正确的,”

“那么,如果我们不重新发明电脑图形计算,不革自己的命,不彻底解放这块图形处理器的能力的话,结局就是英伟达必然会被商品化 (commoditized)。”

——黄仁勋,via Stratechery 

带着这样的恐惧,黄仁勋走上了一条自己革自己命的创业路。这条路,走到今天,已将近三十年。

02

最近,英伟达召开了年度技术大会 GTC 2022,发布了最新一代商用级 H100 GPU,和以知名计算机科学家 Grace Hopper 命名的 Hopper 架构。新架构采用台积电4纳米制程工艺,内存带宽达到每秒3TB,在32和64位浮点计算上相比前一代 Ampere 架构的 A100 GPU 快了三倍。

H100 已经成为最新一代“核弹”,但英伟达还有更多杀手锏:

通过最新的互联技术 NVLink 技术,8张H100单卡连接构成了的 DGX H100 模组化超级计算机,算力达到了惊人的 1EFlops;而 NVLink Switch 技术在扩展性上也获得了史诗级提升,支持最多256张 H100 GPU 互联。

由于 GPU 进行深度学习计算需要大量的内存带宽,英伟达甚至和 ARM 合作开发了一款采用全新 Grace 架构的 CPU,专门用来辅助 GPU 进行带宽分配,从而让 GPU 可以全力开动进行计算,不会因为在内存带宽上受到限制而影响发挥。

3

早已在深度学习计算方面身位领先的英伟达,再一次打造了新的 GPU、CPU 架构、互联技术。今天这家公司早已不再是单纯的显卡技术公司——它已经将图形加速计算的功力推到极限,为深度学习计算带来了新的可能性。

在 GTC 大会上,黄仁勋认为人类将会迎来 AI 被 AI(而不只是人类)所创造出来的时代,并将其称为“生产智能”(intelligence manufacturing)。

会后,黄仁勋接受了 Stratechery 博客主笔/知名分析师 Ben Thompson 的采访。特别的是,黄仁勋在这次采访中谈到了一些过去鲜少讨论的话题——特别是对于公司平庸化的恐惧,以及英伟达三十年的创业路走到今天的感悟。

在他看来,没有比让英伟达变成 “Wintel” 生态下的一家普通供应商更可怕的事情了。

2009年,黄仁勋在斯坦福大学做了一场名为“Vision Matters”的演讲。其中,他回忆起了公司在2000年推出可编程像素着色器(programmable pixel shader, 以下简称可编程 shader),在当时差点要了公司的命。

但是如果没做那个决定,英伟达可能就不会获得今天的行业地位。

作为独立图形处理器概念的主要推手,英伟达拿着红衫等投资者的2000多万美元苦心研发 GPU 技术,虽然头两款产品 NV1、NV2 GPU 都遭遇了失败,还好 NV3(正式命名为 RIVA 128)由于技术相对先进、价格低廉,推出不到1年就实现了100万枚出货量。在 RIVA 128 打下的基础上,英伟达又在次年推出了 RIVA TNT,性能显著优于当时的竞争对手 3dfx 的产品,成功揽下当时多家显卡厂商加入其阵营。

RIVA 128 和 TNT 的优秀战绩,助推英伟达在1999年成功上市,然而当时的黄仁勋已经不再看好这两款产品所代表的技术理念了。

早年的 GPU 产品,包括 RIVA TNT 在内,都属于固定功能的芯片。这类芯片的优势就是运行固定功能的效率很高。