Nvidia的GB10：小型超级计算机的革命

作者：

CBISMB

责任编辑：

张金祥

来源：

ISMB

时间：

2025-01-13 17:26

关键字：

Nvidia GB10 Jensen定律

最近，Nvidia推出了GB10，这是一个令人惊叹的小型超级计算机，令人不禁赞叹于其在人工智能性能上的创新。随着技术的进步，或许我们需要引入“Jensen定律”：在相同的AI性能下，降低每浮点运算价格25%需要100个月的时间。这一理念可能预示着AI技术市场的下一场革命。

意外的超越

当Nvidia决定推出像GB10这样的产品时，几乎没有人会料到。毕竟，作为一家因销售数十万美元的高端硬件而成为全球最有价值公司的企业，为何会选择以如此低廉的价格推出整套系统？但我相信，Nvidia的目标是要像四十五年前的IBM一样，彻底改变计算领域。

Jensen定律的提出

Jensen定律的核心在于，随着技术的积累，达到相同AI性能所需的成本将持续降低。回顾2016年，Nvidia推出的DGX-1售价高达129,000美元，配置一颗16核Intel Xeon CPU和八张P100 GPGPU卡。而现在，新的Digits超计算机售价仅为3,000美元，拥有1000 Teraflops的AI性能，使用FP4精度（支持稠密和稀疏操作）。可以推测，Digits的处理能力约为完整装载的8卡Pascal DGX-1的一半。

在Digits的核心是GB10 SoC，包含20个Arm核心（10个Arm Cortex-X925和10个Cortex-A725）。另外，这款微型超级计算机搭载了一颗Lite版的Blackwell GPU（相当于B100），并具有100W的功耗和825GB/s的带宽。

表头 - 列0	DIGITS	DIGITS 2.4X	DGX-1 v1	DGX与DIGITS的差异
深度（估计） mm	89	89	866	9.73x
宽度（估计） mm	135	324	444	1.37x
高度（估计） mm	40	40	131	3.28x
重量（kg）	~1	~2.4	60.8	25.35x
价格（美元，2024年11月调整）	3000	7200	170100	23.63x
GPU性能 FP16（TF）	0	0	170	Row 5 - Cell 4
GPU性能 FP16稠密（TF）	~282	676.8	680	1.00x
GPU性能 FP4稠密（TF）	1000	Row 7 - Cell 2	0	Row 7 - Cell 4
GPU内存（GB）	128	307.2	128	0.42x
最大功耗（W）	~150	~300	3200	10.67x
存储（TB）	4	9.6	7.68	0.80x
GPU系列	Blackwell	Blackwell	Pascal	Row 11 - Cell 4
GPU功耗（W）x8	~100	~240	2400	10x
GPU晶体管数量（十亿）x8	~30	~72	120	1.67x
内存带宽（GB/秒）x	~850	~850	720	0.85x

从边缘到主流

为何Nvidia会启动这个名为Project DIGITS的项目？我认为，核心目的在于巩固其市场护城河。通过使其产品变得不可或缺，Nvidia正在保障自身的行业地位，并防止竞争对手的入侵。正如过去微软、谷歌和苹果所做的那样，Nvidia通过CUDA技术实现了对整个生态的控制。这种策略使得竞争对手更难以追赶。

Nvidia近期转向FP4的推断处理能力，使得其在性能基准测试中表现出色。例如，Blackwell GPU在FP8训练中的表现提升了2.5倍，而在FP4推断中则提升了5倍。目前，AMD的MI300X/325X系列仍未提供FP4计算能力。

Nvidia的目标不仅仅是为了继续与现有竞争对手抗衡，还希望扩展到超大规模云计算市场之外，进入更多应用场景。CEO Jensen Huang清晰地表明了这一愿望：“人工智能将融入每个行业的每个应用。通过Project DIGITS，我们希望将AI超级计算机带到每位数据科学家、AI研究者和学生的桌前，使他们能够参与塑造AI时代。”

Mediatek的合作伙伴关系

许多人对Nvidia与Mediatek的合作感到困惑，Mediatek在声明中强调了自己在Arm架构SoC性能和功耗效率方面的设计专长。这一合作对Nvidia的短期利益或许并不显著，但从长远来看，Nvidia可能会逐渐独立于Mediatek，专注于更直接的产品开发。

Huang在谈到与Mediatek的合作时表示：“现在他们可以为我们提供支持，同时也能为其他市场服务，实现双赢。”这意味着Nvidia不会急于进入AMD和Intel的直接竞争，而是寻找自身独有的发展路径。

未来展望

随着数据科学家越来越倾向于选择Apple的Mac平台，因为其在性能和价格上的平衡，Nvidia接下来将如何应对？一个明显的方向是考虑将内存集成到SoC中，类似于Apple的M系列SoC。这样的调整不仅能降低成本，也会提升性能。

未来，Nvidia将如何在相同价格内提供更多功能，或者在相同性能下降低价格，成为行业观察的重点。它还有可能鼓励关键合作伙伴（如PNY、Gigabyte和Asus）推出类似的产品；这使得Nvidia可以在不直接进入消费市场的情况下，获得更高的市场份额。

此外，Nvidia的Jetson Orin系列也引发了关注，尤其是NX 16GB版本在INT8性能上升级至157 TOPS。这一平台被定位于DIY和边缘应用，尽管与纯训练或推断任务的关系较弱，但未来的变化仍充满想象。

Nvidia显然在主动进行产品更新，以避免被市场其他参与者逼近。真正的挑战在于，这家企业会在多大程度上破坏自身的当前优势，以迎接未来的创新和突变。Nvidia的每一步都显示出其在AI领域的深远规划，而这场计算革命才刚刚开始。