英伟达推出面向 “AI 推理时代” 的Blackwell Ultra人工智能芯片(2025年04月06日)


英伟达(Nvidia)在周二的年度GTC大会上宣布了用于构建和部署人工智能模型的新芯片。



英伟达推出面向 “AI 推理时代” 的Blackwell Ultra人工智能芯片


该公司首席执行官黄仁勋(Jensen Huang)透露了将于今年下半年上市的Blackwell Ultra系列芯片,以及预计将于2026年上市的该公司下一代图形处理单元(GPU) Vera Rubin 。



自2022年底OpenAI发布ChatGPT实现业务转型以来 ,英伟达的销售额增长了6倍多。这是因为它的“大型GPU”占据了开发高级人工智能的大部分市场,这一过程被称为训练。



软件开发者和投资者正在密切关注该公司的新芯片,看它们是否能提供足够的额外性能和效率 ,以说服该公司最大的终端客户——包括微软 、谷歌和亚马逊在内的云计算公司——继续花费数十亿美元建造基于英伟达芯片的数据中心 。



“去年几乎整个世界都参与了进来 。计算需求 ,人工智能的缩放定律,更有弹性,事实上 ,速度也更快。 ”黄仁勋说。



周二的公告也是对英伟达新年度发布节奏的一次考验 。该公司每年都在努力宣布新的芯片系列。在人工智能热潮之前,英伟达每隔一年就会发布新的芯片架构。



在加州圣何塞举行的GTC大会也是英伟达展示实力的机会 。



此次活动是英伟达自疫情以来举行的第二次面对面会议,预计将有2.5万名与会者 ,数百家公司将讨论如何将该公司的硬件用于人工智能。其中包括Waymo、微软和福特等公司。通用汽车(General Motors)也宣布,将在下一代汽车上使用英伟达的服务 。



英伟达周二表示,Rubin之后的芯片架构将以物理学家理查德·费曼(Richard Feynman)命名 ,延续其以科学家命名芯片家族的传统。据黄仁勋展示的幻灯片显示,英伟达的Feynman芯片预计将于2028年上市。



英伟达还将在此次活动中展示其其他产品和服务 。



例如,英伟达发布了使用其芯片的新型笔记本电脑和台式机 ,包括两款专注于人工智能的个人电脑,分别名为DGX Spark和DGX Station,这两款电脑将能够运行大型人工智能模型 ,如Llama或DeepSeek。该公司还宣布更新其网络部件 ,将数百或数千个GPU连接在一起,使它们作为一个整体工作,以及一个名为Dynamo的软件包 ,帮助用户充分利用他们的芯片。



*Vera Rubin*


英伟达预计将在2026年下半年开始推出下一代GPU系列系统 。



该系统有两个主要组成部分:一个名为Vera的CPU和一个名为Rubin的新型GPU设计 。它是以天文学家维拉·鲁宾(Vera Rubin)的名字命名的。



该公司表示,Vera是英伟达的首款定制CPU设计,其核心设计名为奥林巴斯(Olympus)。


以前 ,当需要CPU时,英伟达使用Arm的现成设计 。已经开发出定制Arm核心设计的公司,如高通(Qualcomm)和苹果公司(Apple) ,表示它们可以更量身定制,并释放出更好的性能。



该公司表示,定制的Vera设计将是去年Grace Blackwell芯片使用的CPU速度的两倍。



当与Vera配对时 ,Rubin在进行推理时可以进行每秒50千万亿次的运算,是该公司目前的Blackwell芯片每秒20千万亿次运算的两倍多 。Rubin还可以支持高达288GB的快速内存,这是人工智能开发人员关注的核心规格之一。



英伟达也在对所谓的GPU做出改变。英伟达称 ,Rubin实际上是两个GPU 。



目前市场上的Blackwell GPU实际上是两个独立的芯片组装在一起 ,作为一个芯片工作。



从Rubin开始,英伟达将表示,当它将两个或多个芯片组合成一个芯片时 ,它将把它们称为单独的GPU。在2027年下半年,英伟达计划发布一款“Rubin Next ”芯片,该芯片将四个芯片组合成一个芯片 ,将Rubin的速度提高一倍,并将其称为四个GPU 。



英伟达表示,将在一个名为Vera Rubin NVL144的机架上推出。之前版本的Nvidia机架被称为NVL72。



*Blackwell Ultra*


英伟达还宣布了其Blackwell系列芯片的新版本 ,并将其称为Blackwell Ultra 。



该公司在一次简报中表示,该芯片每秒将能够产生更多的tokens,这意味着该芯片可以在与其前身相同的时间内生成更多的内容 。



英伟达表示 ,这意味着云提供商可以使用Blackwell Ultra为时间敏感型应用程序提供高级人工智能服务,从而使他们从新芯片中获得的收入是2023年出货的Hopper一代芯片的50倍。



Blackwell Ultra将推出两种版本,一种是双处理器配英伟达Arm CPU ,名为GB300 ,另一种是只配GPU,名为B300。它还将推出在单个服务器刀片上配备8个GPU的版本,以及配备72个Blackwell芯片的机架版本 。



英伟达表示 ,四大云计算公司部署的Blackwell芯片数量是Hopper芯片数量的三倍。



*DeepSeek*


中国的DeepSeek R1在1月份发布时可能吓到了英伟达的投资者,但英伟达已经接受了这款软件。这家芯片制造商将使用该模型测试其几款新产品 。



据报道,DeepSeek的模型所需的芯片比美国制造的模型少 ,许多人工智能观察家认为,这对英伟达的业务构成了威胁。



但黄仁勋今年早些时候表示,对英伟达来说 ,DeepSeek实际上是一个好兆头。这是因为DeepSeek使用了一个称为“推理”的过程,这需要更多的计算能力来为用户提供更好的答案 。



英伟达表示,新的Blackwell Ultra芯片更适合推理模型。



它开发的芯片可以更有效地进行推理 ,所以当新的推理模型在部署时需要更多的计算能力时,英伟达的芯片将能够处理它。



“在过去的两三年里,人工智能取得了重大突破 ,取得了根本性的进步 。我们称之为具身智能(代理式人工智能 ,agentic AI)。”黄仁勋表示,“它可以推理出如何回答或如何解决问题。 ”