Nvidia的GB10:小型超级计算机的革命
CBISMB
责任编辑:张金祥
ISMB
时间:2025-01-13 17:26
Nvidia GB10 Jensen定律
最近,Nvidia推出了GB10,这是一个令人惊叹的小型超级计算机,令人不禁赞叹于其在人工智能性能上的创新。随着技术的进步,或许我们需要引入“Jensen定律”:在相同的AI性能下,降低每浮点运算价格25%需要100个月的时间。这一理念可能预示着AI技术市场的下一场革命。
意外的超越
当Nvidia决定推出像GB10这样的产品时,几乎没有人会料到。毕竟,作为一家因销售数十万美元的高端硬件而成为全球最有价值公司的企业,为何会选择以如此低廉的价格推出整套系统?但我相信,Nvidia的目标是要像四十五年前的IBM一样,彻底改变计算领域。
Jensen定律的提出
Jensen定律的核心在于,随着技术的积累,达到相同AI性能所需的成本将持续降低。回顾2016年,Nvidia推出的DGX-1售价高达129,000美元,配置一颗16核Intel Xeon CPU和八张P100 GPGPU卡。而现在,新的Digits超计算机售价仅为3,000美元,拥有1000 Teraflops的AI性能,使用FP4精度(支持稠密和稀疏操作)。可以推测,Digits的处理能力约为完整装载的8卡Pascal DGX-1的一半。
在Digits的核心是GB10 SoC,包含20个Arm核心(10个Arm Cortex-X925和10个Cortex-A725)。另外,这款微型超级计算机搭载了一颗Lite版的Blackwell GPU(相当于B100),并具有100W的功耗和825GB/s的带宽。
表头 - 列0 | DIGITS | DIGITS 2.4X | DGX-1 v1 | DGX与DIGITS的差异 |
---|---|---|---|---|
深度(估计) mm | 89 | 89 | 866 | 9.73x |
宽度(估计) mm | 135 | 324 | 444 | 1.37x |
高度(估计) mm | 40 | 40 | 131 | 3.28x |
重量(kg) | ~1 | ~2.4 | 60.8 | 25.35x |
价格(美元,2024年11月调整) | 3000 | 7200 | 170100 | 23.63x |
GPU性能 FP16(TF) | 0 | 0 | 170 | Row 5 - Cell 4 |
GPU性能 FP16稠密(TF) | ~282 | 676.8 | 680 | 1.00x |
GPU性能 FP4稠密(TF) | 1000 | Row 7 - Cell 2 | 0 | Row 7 - Cell 4 |
GPU内存(GB) | 128 | 307.2 | 128 | 0.42x |
最大功耗(W) | ~150 | ~300 | 3200 | 10.67x |
存储(TB) | 4 | 9.6 | 7.68 | 0.80x |
GPU系列 | Blackwell | Blackwell | Pascal | Row 11 - Cell 4 |
GPU功耗(W)x8 | ~100 | ~240 | 2400 | 10x |
GPU晶体管数量(十亿)x8 | ~30 | ~72 | 120 | 1.67x |
内存带宽(GB/秒)x | ~850 | ~850 | 720 | 0.85x |
从边缘到主流
为何Nvidia会启动这个名为Project DIGITS的项目?我认为,核心目的在于巩固其市场护城河。通过使其产品变得不可或缺,Nvidia正在保障自身的行业地位,并防止竞争对手的入侵。正如过去微软、谷歌和苹果所做的那样,Nvidia通过CUDA技术实现了对整个生态的控制。这种策略使得竞争对手更难以追赶。
Nvidia近期转向FP4的推断处理能力,使得其在性能基准测试中表现出色。例如,Blackwell GPU在FP8训练中的表现提升了2.5倍,而在FP4推断中则提升了5倍。目前,AMD的MI300X/325X系列仍未提供FP4计算能力。
Nvidia的目标不仅仅是为了继续与现有竞争对手抗衡,还希望扩展到超大规模云计算市场之外,进入更多应用场景。CEO Jensen Huang清晰地表明了这一愿望:“人工智能将融入每个行业的每个应用。通过Project DIGITS,我们希望将AI超级计算机带到每位数据科学家、AI研究者和学生的桌前,使他们能够参与塑造AI时代。”
Mediatek的合作伙伴关系
许多人对Nvidia与Mediatek的合作感到困惑,Mediatek在声明中强调了自己在Arm架构SoC性能和功耗效率方面的设计专长。这一合作对Nvidia的短期利益或许并不显著,但从长远来看,Nvidia可能会逐渐独立于Mediatek,专注于更直接的产品开发。
Huang在谈到与Mediatek的合作时表示:“现在他们可以为我们提供支持,同时也能为其他市场服务,实现双赢。”这意味着Nvidia不会急于进入AMD和Intel的直接竞争,而是寻找自身独有的发展路径。
未来展望
随着数据科学家越来越倾向于选择Apple的Mac平台,因为其在性能和价格上的平衡,Nvidia接下来将如何应对?一个明显的方向是考虑将内存集成到SoC中,类似于Apple的M系列SoC。这样的调整不仅能降低成本,也会提升性能。
未来,Nvidia将如何在相同价格内提供更多功能,或者在相同性能下降低价格,成为行业观察的重点。它还有可能鼓励关键合作伙伴(如PNY、Gigabyte和Asus)推出类似的产品;这使得Nvidia可以在不直接进入消费市场的情况下,获得更高的市场份额。
此外,Nvidia的Jetson Orin系列也引发了关注,尤其是NX 16GB版本在INT8性能上升级至157 TOPS。这一平台被定位于DIY和边缘应用,尽管与纯训练或推断任务的关系较弱,但未来的变化仍充满想象。
Nvidia显然在主动进行产品更新,以避免被市场其他参与者逼近。真正的挑战在于,这家企业会在多大程度上破坏自身的当前优势,以迎接未来的创新和突变。Nvidia的每一步都显示出其在AI领域的深远规划,而这场计算革命才刚刚开始。