新闻资讯

一文看懂2025GTC:AI推理时代到来,英伟达推出“算力核弹”

界面新闻记者 | 李彪

界面新闻编辑 | 文姝琪

美国时间3月18日,英伟达在美国圣何塞举办GTC(GPU技术大会)。作为全球最受关注的科技巨头,今年GTC吸引约2.5万人线下参加,另有30万人通过线上方式收看直播。

英伟达CEO黄仁勋在主题演讲开场说道,“因为AI技术爆发,GTC大会的规模每年都在扩大。去年他们说GTC是AI行业的‘伍德斯托克摇滚音乐节’。今年我们搬进了体育场,GTC已经成AI行业的‘超级碗’”。

而在此次GTC大会上,英伟达不仅发布了Blackwell GPU、硅光交换机、机器人模型等一系列新产品。黄仁勋还在演讲中反复传递出一个信号:随着AI行业在模型训练上的整体需求放缓,再加上DeepSeek在模型推理上所做创新,AI推理时代即将到来。

演讲结束后,英伟达股价收盘跌超3.4%,报115.43美元/股,盘后继续下跌0.56%。

Blackwell  Ultra GPU:专为AI推理打造的“算力核弹”

作为GTC的重头戏,黄仁勋在演讲中宣布推出数据中心AI GPU的新一代产品——NVIDIA Blackwell Ultra GPU。

此前市场传言英伟达去年年底计划将Blackwell Ultra改名为B300 ,但根据现场公布的结果,官方保留了原始命名。Blackwell Ultra GPU相比于上一代B200GPU性能提升了50%,约为15P FLOPS(基于低精度的四位浮点数格式FP4标准),内存上则搭载了业内更先进的HBM3E,从192GB升级到了288GB。

图源:英伟达

基于Blackwell Ultra,英伟达面向云计算厂商等大型企业客户客户提供两款系统集成产品:Blackwell Ultra NVL72机架式解决方案与NVIDIA HGX Blackwell Ultra NVL16系统。

其中,Blackwell Ultra NVL72是在一个数据中心机架(一台服务器搭载8个GPU,一个机架可以容纳多台服务器)中连接了72个Blackwell Ultra GPU以及36个英伟达基于ARM架构设计的Grace CPU。据与上一代B200GPU的同类产品相比,Blackwell Ultra NVL72在AI算力性能上提升超过了50%。HGX Blackwell Ultra NV16则是运用NVLink高速互联 *** 连接8个Blackwell Ultra GPU的服务器系统产品。

与A100、H100等多款主要用在AI模型预训练的产品不同,英伟达此次明确定位Blackwell Ultra“专为AI模型推理打造”(AI-Reasoning),同时兼顾"训练和多场景AI应用的高效性"。Blackwell Ultra NVL72和HGX Blackwell Ultra NVL16(8GPU)两款系统产品也在提升计算能力和内存容量的同时,专为复杂AI推理任务做了优化。以HGX Blackwell Ultra NVL16为例,相较于上一代Hopper架构,这款新品在大模型推理速度上提升了11倍。

此前在DeepSeek用极低的算力成本完成模型开发后,外界就曾担忧市场对英伟达算力芯片产品的旺盛需求是否会放缓,英伟达官方及黄仁勋就曾在多个场合表示,相比于AI厂商先前将大量算力投资用于AI模型训练上,DeepSeek主要在模型推理运用了创新技术,而AI推理依然需要大量英伟达GPU和高性能 *** 。

在AI行业的“Scaling Law”法则(模型规模越大,模型越智能)在预训练环节放缓后,推理环节将催生更大规模的算力需求,因此“DeepSeek的出现反而证明市场需要更多AI芯片”。

据黄仁勋介绍,Blackwell系列,目前已经全面投产。“产量惊人,客户需求惊人,因为人工智能出现了一个拐点,由于推理人工智能以及推理人工智能系统和智能体系统的训练,人工智能领域必须完成的计算量大大增加。”

按照英伟达“一年一更新”发布节奏,黄仁勋演讲中预告了下一代Rubin架构两款产品Rubin GPU、Rubin Ultra GPU的性能信息。

Rubin GPU算力性能将在FP4标准下达到50P Flops,约是Blackwell Ultra GPU的3.3倍,Rubin Ultra GPU则在相同标准下为100P。两款新架构产品届时也将用上HBM4、HBM4E先进AI内存。搭载Rubin GPU的Vera Rubin NVL144(连接144个GPU)将于 2026 年下半年推出,Rubin Ultra GPU的Rubin Ultra NVL576(连接576个GPU)将于2027年下半年推出。

继Rubin架构之后,黄仁勋现场公布下一代GPU架构的命名为“Feynman”,取自著名物理学家理查德・费曼(Richard Feynman),Feynman架构产品将于2028年发布。

智能体和机器人时代,AI将需要更多芯片

与去年GTC密集发布各种新产品的节奏不同,黄仁勋今年在公布新品前,在现场花了更多时间科普“Agentic AI”的概念,以及AI推理带来的巨大改变。

在现场展示的AI技术发展路线图中,黄仁勋按照“Generative AI(生成式AI)、Agentic AI(智能体)、Physical AI(具身AI)”三个阶段的进化路线,将Agentic AI描述为AI技术发展的中间态。

相比于生成式AI的主要应用——语言大模型与聊天机器人——主要聚焦于生成文本、图像内容,Agentic AI更进一步,能够理解任务、进行复杂推理、制定计划并自主执行多步骤操作,目前业内热议的数字员工等AI Agent即为相关应用。

图源:英伟达

在生成式AI的之一阶段,AI行业的“Scaling Law”法则集中体现在模型训练上,特别是预训练环节(Pre-Training,即从无到有开发模型的前期训练阶段),投入更多的数据、更大规模的算力资源训练出更好的模型,训练规模越大,模型越智能。

黄仁勋认为,从过去一年的行业发展进程来看,预训练为主的Scaling Law法则已走入“误区”。从今年乃至未来很长一段时间内,Agentic AI将代替生成式AI,成为行业新的发展方向。由于Agentic AI强调自主性与复杂问题解决能力,每一步解决复杂问题、分解任务的逻辑思考过程都需要用到“模型推理”,因此推理将成为新阶段的核心动力。

而从生成式AI发展到Agentic AI,并不意味着Scaling Law法则失效。相反,由于将应用范围从训练进一步扩展到推理,不只在预训练环节,模型的后训练(Post-Training,指预训练得到模型后,根据特定任务或需求,使用更小规模、更专注的数据集对模型进行进一步优化训练或微调的过程)和日常推理的长期思考(Long-Thinking)都要继续消耗算力资源,Scaling Law法则对规模的要求非但会变小,相反会进一步扩大。

以一个用户访问AI应用时产生的Token来举例,对于Agentic AI来说,推理所涉及的任务更加复杂,可能需要生成或处理更多Token来完成规划和执行。同时随着更多用户同时访问AI,Token的数量会爆炸式增加。对于大模型来说,每生成一个Token往往需要数千亿次浮点运算,如何在有限时间内尽可能多的生成Token,并快速将推理结果反馈给用户,大规模的算力资源是完成这一切的基础。

按照现场显示的效果,Blackwell Ultra NVL72集群在运行DeepSeek-R1 671B交互式副本时,只需10秒就可以给出答案,而上一代Hopper架构的H100同类产品则需要1分半。

此次大会上,英伟达还发布了一款新型的AI 推理服务软件Dynamo。它协调和加速数千个GPU之间的推理通信,并使用分解服务将大型语言模型的处理和生成阶段分离在不同GPU上。这允许每个阶段根据其特定需求进行独立优化,并确保更大程度地利用GPU资源。

黄仁勋认为,推理所需算力需求规模增长能“轻松超过去年估计的100倍”,未来行业需要更多、性能更强的AI芯片。根据他的预测,数据中心建设的投入到2028年将达到1万亿美元,目前“相当确定很快就会达到这个目标”。

硅光 *** 交换机、机器人模型与量子计算研究中心

此外,在今年GTC大会上,英伟达还将在硅光芯片、机器人应用、量子计算等领域有进一步的探索。

硅光领域,英伟达最新发布了NVIDIA Spectrum-X(基于以太网,适合兼容更广泛的企业 *** )及NVIDIA Quantum-X(基于InfiniBand,偏向专用计算集群)硅光 *** 交换机。

这两款硅光 *** 交换机新品是英伟达首次利用“光电共封装技术”(co-packaged optics, CPO)将光通信直接集成到交换机上,推出的商用化硅光交换机产品。此前英伟达的交换机产品的光通信部分主要为“外挂式”,依赖从Finisar和Lumentum等外部供应商采购的标准化模块。

此次英伟达的硅光 *** 交换机新品与台积电、Coherent、康宁公司(Corning)、富士康、Lumentum和SENKO等行业巨头合作。Quantum-X交换机预计将于今年晚些时候上市,Spectrum-X交换机预计于2026年通过主流基础设施和系统供应商推出。

黄仁勋曾经用“A工厂”描绘AI时代超大规模数据中心的未来形态。随着AI数据工厂规模的扩张, *** 基础设施也需要同步彻底革新。英伟达希望通过将硅光子技术直接集成到交换机中,突破超大规模和企业 *** 的传统限制,为目前万张、十万张GPU的数据中心向百万张GPU的AI工厂过渡奠定基础。

机器人作为未来“具身AI”(Physical AI)的关键应用,英伟达旗下辅助生成机器人训练数据的物理世界模型Co *** os、人形机器人基础模型GROOT N1以及3D实时仿真平台Omniverse是这一领域的主要产品。

图源:视觉中国

其中,GROOT N1是通用机器人基础模型,英伟达此次正式宣布已经将其开源。GROOT N1模型采用双系统架构,灵感来自人类认知原理。在视觉语言模型的支持下,一个系统可以推理其环境和收到的指令,从而规划行动。另一个系统然后将这些计划转化为精确、连续的机器人动作。

除硅光芯片与机器人应用外,在谷歌、微软相继在量子计算芯片领域有重大突破后,量子计算当前成为了硅谷科技巨头布局未来的一个热门方向。英伟达此次也在GTC大会上宣布,将在波士顿建设NVIDIA加速量子研究中心(NVAQC)。据官方介绍,该中心是一个以研究为导向的机构,将通过尖端技术推动量子计算架构与算法的发展。

值得关注的是,去年谷歌发布的Willow芯片攻克困扰量子计算研究30年的“量子纠错”难题,市场升温带动量子计算概念股上股价涨,黄仁勋曾在今年1月接受分析师采访时给量子计算的落地“泼了一盆冷水”:要造出“非常有用的量子计算机”,可能需要20年。黄的这一评价当时导致一众量子计算相关股票应声下跌。

黄仁勋在谈及英伟达成立量子研究中心的目标时提到,量子计算的实用化依赖于解决关键技术挑战,如量子比特噪声和纠错。而NVAQC的使命是推动这些突破:“NVIDIA加速量子研究中心将是突破发生的地方,以创建大规模、有用的加速量子超级计算机。”

对于市场担忧量子计算颠覆现有计算工具,以前所未有的计算速度在密码学、隐私数据保护领域形成“量子霸权”,黄仁勋明确表示,量子计算不会单独取代现有的计算技术,而是作为AI计算能力的补充。未来的量子计算将成为AI超级计算机的“增强工具”,在药物开发、新材料制造等特定高复杂性领域发挥作用。

  • 上海商办市场升温:一季度大宗交易成交增长20%,长租公寓表现亮眼
  • 鲜花妆上海,花香荟申城!2025上海国际花展开幕,龚正出席并启动花展
  • 部分中国供应商按原价向美国恢复发货,但压价现象仍在
  • 紫金矿业午后涨超3% 美银证券维持“买入”评级
  • 增收不增利、过度依赖大客户,物流设备商中科微至 “开卷”海外市场
  • 海关总署召开进出口企业、行业协会商会座谈会
  • 首都航空:太原至三亚航班巡航阶段出现机械故障,已备降南宁机场
  • 美机构提起集体诉讼 请求法院恢复被撤销签证国际学生的合法身份
  • 购买11箱茅台酒用于公务接待,河南医药系统厅官陈建国被“双开”
  • 事关民营经济,国家发改委最新发声
  • 新疆维吾尔自治区原质量技术监督局局长刘新胜接受审查调查
  • 美国国防部泄密事件不断 前发言人称遭遇“全面崩溃”
  • 五一假期首日,上海外滩客流超55万人次
  • 人民网评:“中国传递爱而不是关税”
  • 一周外盘头条|特朗普:鲍威尔“越早走人越好” 金价再创新高 4000美元可期? 黄仁勋:中国市场至关重要
  • 受特朗普关税冲击 美国航空业寻求豁免
  • 消息称蚂蚁集团旗下蚂蚁国际计划在香港上市
  • 徐丹任武汉大学药学院院长:研究领域在国际上处领跑地位
  • 世贸组织:美关税政策致全球贸易前景严重恶化
  • 国际奥委会委员于再清当选名誉委员
  • 淘天饿了么加入即时零售“三国杀”
  • 航行警告!南海部分水域进行军事训练,禁止驶入
  • 华泰证券:以内部确定性为配置锚
  • 遭马代丽思卡尔顿酒店管家性侵中国女游客再发声:案件进展缓慢,近两年后涉事管家仍未被捕
  • 香江电器二冲港交所:超97%收入来自代工、OBM业务却明显萎缩 研发费用率仅为2.4%、依赖海外大客户
  • 又双叒叕出差太空了!神二十成功出发,神十九乘组扫榻以待
  • 现货黄金4月份涨超5% 白银期货V形走势整体跌超6%
  • 张凯丽:推动书香企业建设,大力推进企业全员读书
  • 美商务部对柬马泰越四国太阳能电池作出双反肯定性裁定
  • 农民钟睒睒的下一个目标
  • 北向资金一季度持有A股至2.24万亿元!“聪明钱”选择加仓电子、消费行业
  • DeepSeek横空出世是好奇心的成功
  • 澎湃读报丨解放日报8个版聚焦:牢记嘱托,砥砺奋进
  • 独家 | 瑞幸咖啡高层人事变动:郭谨一不再担任董事长,大钲资本黎辉接任
  • 瑞典品牌Craft入华来势汹汹,一次进入两大地标商场
  • 家清黑马“绽家”带飞母公司,业绩股价均创新高
  • 白宫突然调整关税政策,是为了“救美债”?
  • LVMH一季度营收不及预期,高管称在观望关税并考虑重新定价
  • 扩大内需如何破局?投资、财政刺激不可忽视
  • “准万亿GDP”城市一季报:经济增速均超全国水平,温州领跑
  • 壳牌第一季度调整后利润超预期,宣布35亿美元股票回购
  • 李家超:香港特区政府积极推进十五运会各项筹办工作
  • 全美首例,加州起诉特朗普政府滥用关税政策“违法”
  • 独家披露:美方通过多渠道主动与中方接触,希望就关税问题进行谈判
  • 标普分析师:航空行业下行风险大幅增加
  • 针灸学专家夏玉清逝世,20岁时奔赴抗美援朝战场救护伤员
  • 万泰生物净利“斩去”9成,钟睒睒的疫苗生意“崩了”?
  • 王嘉评《在机器的边界思考》|一种宇宙技术的思考
  • 收盘:美财长称贸易战不可持续 美股周二大幅收高
  • 昂瑞微冲科创板:3年累亏超8亿元,存货跌价计提存蹊跷
  • 礼来一季度净利增近三成,明星GLP-1药物替尔泊肽贡献近半收入
  • 一图读懂|上海海关公布一季度数据:钢材出口增长超143%
  • 基本面 | 12月70城二手房价环比全部下降
  • 业主被开发商“背刺”,119万买房4年后只值40万
  • 多款AI产品挺进第一梯队,昆仑万维海外收入大涨22%
  • 美财长暗示:90天内无法完成与主要贸易伙伴的关税协议
  • 建设银行天津河西支行下辖支行一主要负责人被终身禁业:员工管理不到位、员工从事违法活动
  • 民生银行发布个人积存金业务市场风险提示
  • 稳中求进、质效并升:江苏银行擦亮普惠为民底色
  • 锻造上海歌剧人才,上音版“波西米亚人”青春逼人
  • 美前副总统彭斯称关税措施是“失策”
  • 午盘:美股维持涨势 纳指上涨2.8%
  • 特朗普政府解雇美国工人健康与安全机构的员工
  • 真是难得,日本“最强硬警告”美国
  • 说法·关注AI法律问题丨AI生成作品,享有著作权吗?
  • 专访丨美加征关税将促使马耳他在内国家加速与他国合作——访马耳他工商会发言人阿塔尔德
  • 天下的中师生,中师生的“天下”
  • 光明日报:回应辅警“转正”呼声,是一门政民互动公开课
  • 台积电一季度净利增长六成,预计今年AI芯片营收增长一倍
  • 赛力斯拟赴港上市:去年扭亏为盈净利59亿元,三年内实现百万销量目标
  • 华为路由X1将于4月25日开售
  • 耐克、阿迪达斯呼吁特朗普豁免鞋类产品关税
  • 成本9元素颜霜标价38元、非法获益超500万元,两名涉案人员被判刑
  • “青瓦台魔咒”难逃,韩国前总统文在寅遭起诉
  • 稀缺题材,A股市场仅4只,3股股价创历史新高,业绩也爆了!
  • 市场情绪现转机?美股高管们加速抄底,买卖比率接近2023年末以来最高
  • 午盘:道指上涨逾500点 纳指突破18000点整数关口
  • OPEC+讨论将6月原油供应上调40万桶/日
  • 平安资管总经理罗水权因个人工作原因辞职
  • 海南旅文局通报游客入住酒店港币被调包:成立调查组赴陵水调查
  • 重磅!山西省省长金湘军被查
  • 基本面 | 2023年全国房地产开发投资同比下降9.6%
  • 驻美国使馆发言人就美方希就关税问题与中方对话答记者问
  • 如此城市|漫步瑞金医院展览,艺术可以成为一种“社会雕塑”
  • 康方生物早盘涨逾4% 近日NMPA批准爱达罗新药上市申请
  • 欧盟官员:将推迟对美国关税的报复,为谈判争取时间
  • 畅通以旧换新回收链
  • 首映丨纪录电影《特别的你》:点亮孤独症群体心中恐惧和迷茫
  • 国内首款基因疗法获批,同类药海外定价百万美元
  • 【专访】卢锋:特朗普试图用高关税促进制造业大规模回流的目标难以实现
  • 神秘公司带来近29亿订单,算力黑马宏景科技业绩扭亏,四大隐忧浮现
  • 永辉超市“反向抹零”遭质疑,门店:“四舍五入”是系统自动设定
  • 最贵的几款新车都在这里了|2025上海车展
  • 一季度金融机构被罚没6亿,1.32亿重罚信用信息违规,投行业务是另一处罚焦点丨金融合规季报
  • 冯象|那“交出”后的崩溃,如撒旦坠落诸天
  • 迈瑞医疗一季度业绩环比大幅改善 国内业务将从今年三季度迎来重大拐点
  • 一小型飞机在美国佛罗里达州坠毁,已致3人死亡
  • CVS健康一季度业绩超预期并上调盈利指引
  • 从微短剧到电商,流媒体能摸着“抖快”过河吗?
  • 泽连斯基用一份协议,同时警告了特朗普和普京
  • “避险锚点”?贸易战视角下巴西在全球供应链中的机遇
  • 上海这台人形机器人完成半马:无故障、无摔倒,冲过终点不忘挥手致意
  • 天工机器人夺冠了,多家供应链“绯闻对象”却不公开承认
  • 从6家试点扩展至全行业,券商并表监管有何看点?
  • 关键词: