下载客户端

英伟达甩出三大“王炸”

半导体产业纵横

关注

2025-03-20 12:37

北京

来源：澎湃新闻·澎湃号·湃客

黄仁勋戏称，英伟达芯片买得越多、省得越多。

在今日凌晨的英伟达 GTC 2025 大会主题演讲中，英伟达 CEO 黄仁勋再次身穿皮衣登场，两个小时的时长被芯片架构、数据中心、自动驾驶、AI计算机以及机器人等关键分享塞得满满的。

演讲的开篇，黄仁勋强调了计算和软件的重要性，他表示：世界正在进行一场过渡——计算方式迎来变革、软件的未来需要资本投资。

Blackwell Ultra芯片：推理性能较前代暴涨40倍

正如大家期待的那般，英伟达在GTC大会上宣布推出Blackwell Ultra芯片，其包括GB300 NVL72机架级解决方案和NVIDIA HGX B300 NVL16系统。

其中，GB300 NVL72将72个Blackwell Ultra GPU与36个基于Arm Neoverse的Grace CPU相连，有效地充当一个大规模GPU来支持复杂问题解决并提高响应质量。基于现有Blackwell架构的Blackwell Ultra预计将比前代产品提供1.5倍的AI性能，显著增加AI工厂的收入机会。

而HGX B300 NVL16是服务器级产品，搭载 16 个 Blackwell Ultra GPU，对比前代 Blackwell GPU，大语言模型推理速度提升 11 倍，计算能力提高 7 倍，内存容量增加 4 倍。

黄仁勋在演讲中强调，Blackwell Ultra 是为 “推理和代理型 AI” 时代设计的平台，可高效支持大模型的预训练、微调及实时推理，并称其为英伟达 “最强大的芯片”，推动 AI 基础设施向推理优化转型。

黄仁勋表示，“在推理模型中，Blackwell 的性能是 Hopper 的 40 倍”。在展示中，传统模型的代表是 Meta Llama 3.3，而推理模型是 DeepSeek 的 R1。

值得一提的是，GB300系列将于2025年5月启动量产，B300系列计划下半年交付，配套服务器系统同步上市。其中，台积电负责芯片制造，SK 海力士提供 HBM3e 内存，超微负责服务器集成，确保产能稳定。

据英伟达透露，全球四大云巨头部署的Blackwell芯片数量已达Hopper芯片的三倍，2024 年他们共采购了130万片 Hopper架构芯片。2025 年又购买了360 万Blackwell 芯片。考虑到每颗Blackwell芯片的售价高达数万美元，这意味着数十亿美元的市场规模。黄仁勋打趣道，在最新技术的加持下，搭建AI工厂的厂商“买得越多、省得越多”，总而言之就是掏钱吧。

英伟达新一代AI芯片Rubin于2026下半年推出

黄仁勋重磅公布了新一代 AI 芯片 Rubin，也就是 Hopper、Blackwell 之后的下一代架构。Rubin的命名风格延续了英伟达一直以来以杰出科学家命名芯片架构的传统，是为纪念“证实暗物质存在”的女性科学先驱薇拉・鲁宾（Vera Rubin，1928–2016，婚前姓 Cooper）。

Vera Rubin和Grace Blackwell类似，集成了CPU和GPU。在Grace Blackwell中，Grace是CPU，Blackwell是GPU；而在Vera Rubin中，Vera是CPU，Rubin是GPU。

其中，Vera CPU是英伟达首次基于自主架构Olympus设计的处理。此前，英伟达一直使用Arm授权的通用CPU设计，这在某种程度上限制了其系统级优化能力。随着AI计算负载的特殊性日益凸显，通用CPU已难以满足极致性能和能效比的要求。英伟达表示，Vera CPU的内存是Grace的4.2倍，内存带宽是Grace的2.4倍。结合Vera的88个CPU内核，英伟达称该芯片的整体性能将是前一代产品的两倍。

而Rubin GPU的创新之处在于其双GPU架构设计。与Blackwell一样，Rubin也采用了多芯片封装技术，但英伟达对这一技术的定义进行了重要调整。从Rubin开始，英伟达将多芯片模块中的每个裸片视为独立的GPU，而非整体一个GPU。这一定义变更不仅是技术表述的调整，更反映了英伟达对未来GPU架构发展的战略思考。

在推理性能方面，Rubin实现了惊人的50 petaflops，是当前Blackwell芯片的2.5倍。同时，其288GB的超大内存容量，为处理超大规模AI模型提供了充足的空间。这意味着Rubin能够更高效地运行如GPT-4等数万亿参数的超大模型，使实时推理和更复杂的推理任务成为可能。

英伟达还公布了"Rubin Next"的开发计划，Vera Rubin之后的一代芯片，名为Vera Rubin Ultra。将于2027年下半年上市的Vera Rubin Ultra将把Vera CPU和Rubin Ultra芯片结合在一起。每个Rubin处理器由两个GPU组成一个单芯片，而Rubin Ultra则由四个GPU裸片组成，进一步将性能翻倍。这种"更多GPU"的集成策略，与行业的多芯片模块（MCM）和芯粒（Chiplet）趋势相呼应，代表了高性能计算芯片的未来发展方向。

黄仁勋展示了 Vera Rubin NVLink576 的外观和参数，并宣称 Rubin 的性能可达 Hopper 的 900 倍，而 Blackwell 是 Hopper 的 68 倍。

Blackwell Ultra和Vera Rubin的发布，标志着英伟达已成功将芯片更新周期从两年缩短至一年。

在本次发布会，英伟达公开了其产品路线图：Blackwell(2024年) → Blackwell Ultra(2025年) → Vera Rubin(2026年) → Rubin Next(2027年) → Feynman(2028年)。这一清晰的"双芯双代"发展路线（每两代架构各两款芯片），让英伟达能够在保持技术领先的同时，最大化每代架构的商业价值。