- +1
英伟达甩出三大“王炸”

黄仁勋戏称,英伟达芯片买得越多、省得越多。
在今日凌晨的英伟达 GTC 2025 大会主题演讲中,英伟达 CEO 黄仁勋再次身穿皮衣登场,两个小时的时长被芯片架构、数据中心、自动驾驶、AI计算机以及机器人等关键分享塞得满满的。
演讲的开篇,黄仁勋强调了计算和软件的重要性,他表示:世界正在进行一场过渡——计算方式迎来变革、软件的未来需要资本投资。
Blackwell Ultra芯片:推理性能较前代暴涨40倍
正如大家期待的那般,英伟达在GTC大会上宣布推出Blackwell Ultra芯片,其包括GB300 NVL72机架级解决方案和NVIDIA HGX B300 NVL16系统。

其中,GB300 NVL72将72个Blackwell Ultra GPU与36个基于Arm Neoverse的Grace CPU相连,有效地充当一个大规模GPU来支持复杂问题解决并提高响应质量。基于现有Blackwell架构的Blackwell Ultra预计将比前代产品提供1.5倍的AI性能,显著增加AI工厂的收入机会。
而HGX B300 NVL16是服务器级产品,搭载 16 个 Blackwell Ultra GPU,对比前代 Blackwell GPU,大语言模型推理速度提升 11 倍,计算能力提高 7 倍,内存容量增加 4 倍。
黄仁勋在演讲中强调,Blackwell Ultra 是为 “推理和代理型 AI” 时代设计的平台,可高效支持大模型的预训练、微调及实时推理,并称其为英伟达 “最强大的芯片”,推动 AI 基础设施向推理优化转型。
黄仁勋表示,“在推理模型中,Blackwell 的性能是 Hopper 的 40 倍”。在展示中,传统模型的代表是 Meta Llama 3.3,而推理模型是 DeepSeek 的 R1。
值得一提的是,GB300系列将于2025年5月启动量产,B300系列计划下半年交付,配套服务器系统同步上市。其中,台积电负责芯片制造,SK 海力士提供 HBM3e 内存,超微负责服务器集成,确保产能稳定。
据英伟达透露,全球四大云巨头部署的Blackwell芯片数量已达Hopper芯片的三倍,2024 年他们共采购了130万片 Hopper架构芯片。2025 年又购买了360 万Blackwell 芯片。考虑到每颗Blackwell芯片的售价高达数万美元,这意味着数十亿美元的市场规模。黄仁勋打趣道,在最新技术的加持下,搭建AI工厂的厂商“买得越多、省得越多”,总而言之就是掏钱吧。
英伟达新一代AI芯片Rubin于2026下半年推出
黄仁勋重磅公布了新一代 AI 芯片 Rubin,也就是 Hopper、Blackwell 之后的下一代架构。Rubin的命名风格延续了英伟达一直以来以杰出科学家命名芯片架构的传统,是为纪念“证实暗物质存在”的女性科学先驱薇拉・鲁宾(Vera Rubin,1928–2016,婚前姓 Cooper)。

Vera Rubin和Grace Blackwell类似,集成了CPU和GPU。在Grace Blackwell中,Grace是CPU,Blackwell是GPU;而在Vera Rubin中,Vera是CPU,Rubin是GPU。
其中,Vera CPU是英伟达首次基于自主架构Olympus设计的处理。此前,英伟达一直使用Arm授权的通用CPU设计,这在某种程度上限制了其系统级优化能力。随着AI计算负载的特殊性日益凸显,通用CPU已难以满足极致性能和能效比的要求。英伟达表示,Vera CPU的内存是Grace的4.2倍,内存带宽是Grace的2.4倍。结合Vera的88个CPU内核,英伟达称该芯片的整体性能将是前一代产品的两倍。
而Rubin GPU的创新之处在于其双GPU架构设计。与Blackwell一样,Rubin也采用了多芯片封装技术,但英伟达对这一技术的定义进行了重要调整。从Rubin开始,英伟达将多芯片模块中的每个裸片视为独立的GPU,而非整体一个GPU。这一定义变更不仅是技术表述的调整,更反映了英伟达对未来GPU架构发展的战略思考。
在推理性能方面,Rubin实现了惊人的50 petaflops,是当前Blackwell芯片的2.5倍。同时,其288GB的超大内存容量,为处理超大规模AI模型提供了充足的空间。这意味着Rubin能够更高效地运行如GPT-4等数万亿参数的超大模型,使实时推理和更复杂的推理任务成为可能。

英伟达还公布了"Rubin Next"的开发计划,Vera Rubin之后的一代芯片,名为Vera Rubin Ultra。将于2027年下半年上市的Vera Rubin Ultra将把Vera CPU和Rubin Ultra芯片结合在一起。每个Rubin处理器由两个GPU组成一个单芯片,而Rubin Ultra则由四个GPU裸片组成,进一步将性能翻倍。这种"更多GPU"的集成策略,与行业的多芯片模块(MCM)和芯粒(Chiplet)趋势相呼应,代表了高性能计算芯片的未来发展方向。
黄仁勋展示了 Vera Rubin NVLink576 的外观和参数,并宣称 Rubin 的性能可达 Hopper 的 900 倍,而 Blackwell 是 Hopper 的 68 倍。
Blackwell Ultra和Vera Rubin的发布,标志着英伟达已成功将芯片更新周期从两年缩短至一年。
在本次发布会,英伟达公开了其产品路线图:Blackwell(2024年) → Blackwell Ultra(2025年) → Vera Rubin(2026年) → Rubin Next(2027年) → Feynman(2028年)。这一清晰的"双芯双代"发展路线(每两代架构各两款芯片),让英伟达能够在保持技术领先的同时,最大化每代架构的商业价值。

值得一提的是,在Rubin之后的下一代AI芯片架构,英伟达将其命名为Feynman,取自著名物理学家理查德・费曼。他是美国理论物理学家,以对量子力学的路径积分表述、量子电动力学、过冷液氦的超流性以及粒子物理学中部分子模型的研究闻名于世。根据英伟达路线图,Feynman架构将于2028年登场。
掀起小高潮的AI计算机与机器人
除了芯片,此次GTC大会的另一个小高潮就是黄仁勋介绍英伟达在AI计算机和机器人产线的突破。
英伟达推出了新款 DGX Spark 和 DGX Station 个人 AI 计算机,黄仁勋称其为“AI 时代的超级计算机”。
据介绍,这两款超级计算机均由 Grace Blackwell 平台支持,旨在“让 AI 开发人员、研究人员、数据科学家和学生在桌面上对大模型进行原型设计、微调和推理”。
其中,Spark 搭载了 GB10 Blackwell 芯片,提供第五代 Tensor Core 和 FP4 支持,具有 128GB 统一内存和高达 4TB 的 NVMe SSD 存储,可以提供“高达每秒 1 千万亿次运算的 AI 计算。”
而体积更大的 DGX Station 可以容纳英伟达刚刚宣布的功能更强大的 GB300 Blackwell Ultra 芯片,可提供“每秒 20 千万亿次运算的 AI 性能和 784GB 的统一系统内存”。
Spark 将于今日开始预订,售价 3000 美元起。DGX Station 目前尚未定价。
在机器人领域,英伟达推出了全球首款开源人形机器人功能模型GR00T N1。
GR00T N1 基础模型采用双系统架构,其灵感来自人类认知原理。“系统 1”是一种快速思考的行动模型,反映了人类的反应或直觉。“系统 2”则是一种慢速思考的模型,用于深思熟虑、有条不紊的决策。
在视觉语言模型的支持下,系统 2 可以推理其环境和收到的指令,从而规划行动。然后,系统 1 将这些计划转化为精确、连续的机器人动作。
目前,GR00T N1 可以实现常见任务,例如抓取、用一只或两只手移动物体,以及将物品从一只手转移到另一只手,或者执行需要技能组合的多步骤任务。开发人员和研究人员可以使用真实或合成数据对 GR00T N1 进行后期训练,以适应特定的人形机器人或任务。
*声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台。
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

- “远亲不如近邻”
- 央行最新例会:择机降准降息
- 金正恩会见绍伊古重申对俄支持

- 胡塞武装称袭击以色列本·古里安机场及美航母多艘护航军舰
- 经济日报:协同推进政策实施和预期引导

- 一位知名华裔男演员,主演电影《旺角黑夜》等,最近因为推出英语网课而爆火
- 《诗经》中,“蒹葭苍苍,白露为霜,所谓伊人”的下一句是

- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2025 上海东方报业有限公司