AI不再只是"说话",它开始"干活"了——NVIDIA GTC 2026 全景回顾
每年三月,圣何塞都会迎来一场不同寻常的朝圣。
2026年3月16日,美国加州圣何塞SAP中心,来自190个国家的3万人涌入这座体育场,场外还有数以百万计的观众守在屏幕前。他们等待的,是一个穿着标志性黑色皮夹克的61岁男人,走上舞台,讲两个小时的PPT。
这个人,是黄仁勋。
这场大会,是NVIDIA年度开发者大会GTC 2026。
开场没有寒暄。黄仁勋直接抛出一个让全场倒吸一口冷气的数字:Blackwell与Vera Rubin两代平台,截至2027年底的累计订单总额将超过1万亿美元。
去年他给出的预测是5000亿美元。一年之内,这个数字翻了一倍。
这不是财报数字,这是一张关于未来的账单。
一、AI的叙事,正在换挡
如果你回看这几年GTC的主题演讲,会发现一条清晰的叙事升级路线:
2023年,黄仁勋用整场演讲告诉世界,生成式AI来了,ChatGPT只是开始。
2024年,Blackwell架构亮相,算力军备竞赛全面开启,重点是**“训练更大的模型”**。
2025年,“物理AI”成为核心词,AI开始被要求走出屏幕、进入真实世界。
2026年,故事的重心悄然转移到了一个词——Agent(智能体)。
这一次,甚至在演讲开始之前,答案就已经写在了GTC园区的每一个角落。英伟达在会场专门设置了”Build-a-Claw”互动专区,让与会者现场搭建自己的AI智能体。
黄仁勋在演讲中用一句话点破了时代的转折点:
“AI的演进轨迹是:感知→生成→推理→行动。你不再问AI是什么、在哪、何时、如何,你要求它创造、执行、建构。”
如果说Hopper架构让机器学会了”说话”,Blackwell让它说得更流利——那么,Vera Rubin的使命,是让机器学会**“干活”**。
二、Vera Rubin:七芯合体,为智能体时代而生
本次GTC最核心的硬件发布,是备受期待的Vera Rubin平台。
黄仁勋用一句话总结这款产品的设计哲学:“当我们说Vera Rubin,我们说的是整个系统——垂直整合的整个系统。”
这个系统,由七款芯片构成:
-
NVIDIA Vera CPU(88核心,专为AI工作负载设计的全新处理器)
-
NVIDIA Rubin GPU(第六代HBM4内存,单芯片带宽高达22 TB/s,内存容量288GB)
-
NVLink 6 交换机
-
ConnectX-9 超级网卡
-
BlueField-4 DPU
-
Spectrum-6 以太网交换机
-
Groq 3 LPU(这是今年最大的惊喜——英伟达去年以200亿美元收购的Groq技术,首次以独立芯片形态集成进来)
性能数据同样令人震惊:整体能效比上一代Grace Blackwell提升10倍;在Blackwell平台上,黄仁勋纠正了此前的说法——“我们说NVL72比上一代能效提升30倍,我们说错了,实际是50倍,成本降低35倍。”
而Groq LPU的加入,解决了GPU长期以来一个根本性的矛盾:高吞吐量与低延迟天生对立。
GPU极擅长并行计算,适合AI推理的”预填充”阶段(Prefill);但在生成每一个Token的”解码”阶段(Decode),需要极低延迟,这恰恰是Groq LPU的强项。英伟达用Dynamo软件将两者拼合,实现了”解耦推理”——高价值推理工作负载的吞吐量因此提升了35倍,且每兆瓦的吞吐量同样提升了35倍。
路线图也同步揭晓:Rubin Ultra NVL576将于2027年下半年出货,性能是Rubin的4倍;再下一代Feynman架构,预计2028年到来,采用台积电最先进的1纳米级16A工艺制造。
一年一代架构,这个节奏没有变,但每一代的性能跃升幅度,正在加速。
三、Token经济学:数据中心不再是存文件的地方
演讲中,黄仁勋反复强调一个新的底层逻辑——Token经济学。
他说,今天的数据中心已经不是存文件的地方,而是生产Token的AI工厂。推理才是真正的工作负载,Token是新的大宗商品。
他还展示了一张他称之为”对企业最重要的图”——在相同功耗下,AI工厂的Token吞吐量对比。核心逻辑是一个飞轮:更多Token → 更聪明的模型 → 更多Token需求 → 更聪明的模型。
这也是为什么他自嘲地展示了那张”Token之王”的表情包,并坦然接受了这个称号。
这种叙事框架的转变,意义深远。它意味着评价AI基础设施的标准,正在从参数量、算力峰值,转向每瓦每美元能生产多少Token。这直接决定了哪家公司的产品更有商业竞争力,也决定了谁能在下一场算力军备竞赛中活下来。
黄仁勋甚至放出了一个更大胆的预言:到本世纪末,全球AI基础设施支出将达到3到4万亿美元。这不是夸张,这是他推演出来的必然结论——AI工厂将像电厂一样成为现代社会的基础设施。
四、OpenClaw:让所有CEO都睡不着觉的开源项目
演讲最出人意料的高潮,不是新芯片,而是一个开源项目——OpenClaw。
黄仁勋在台上给出了一个惊人的判断:“OpenClaw上线仅数周,下载量和影响力已经超越了Linux三十年的积累。它将是这个时代的Linux,这个时代的HTML。”
他用描述操作系统的语言来解构OpenClaw——资源管理、工具调用、文件系统访问、大模型连接、任务调度、子Agent分发、多模态IO……
这款由奥地利独立开发者创建的”龙虾主题”AI智能体框架,本质上是一套智能体操作系统。它能让AI智能体在用户本地设备上执行真实的任务:发邮件、管理文件、调用工具、协调多个子智能体同步工作。
与此同时,NVIDIA在GTC上推出了企业级封装版NemoClaw——一套包含策略执行、网络护栏和隐私路由的企业级安全参考架构,配合全新的OpenShell运行时环境,让自主智能体在受控沙箱里运行,解决OpenClaw爆红后暴露出的严重安全问题。
此前OpenClaw已经发现了超过2万个暴露实例和800多个恶意插件,一个CVSS 8.8级的远程代码执行漏洞更让企业采购团队噤若寒蝉。NemoClaw的推出,就是英伟达给这个问题的系统性答案。
值得一提的是,黄仁勋在演讲中透露了英伟达内部的编码实践:NVIDIA内部100%使用Claude Code、Codex和Cursor的组合进行软件开发。“今天没有一位软件工程师不被一个或多个AI智能体协助编码,“他说。
五、物理AI:每家工业公司都将成为机器人公司
演讲的后半程,黄仁勋带领现场观众进入了一个更宏大的叙事——物理AI(Physical AI)。
他的核心判断只有一句话:“物理AI已经到来,每一家工业公司都将成为机器人公司。”
这不是比喻,这是正在发生的现实:
在汽车领域,黄仁勋宣布NVIDIA与Uber达成合作,将基于DRIVE AV软件在2027年上半年率先于洛杉磯、旧金山推出自动驾驶出租车,并计划到2028年扩展至全球28个城市,横跨四大洲。采用DRIVE Hyperion平台开发Level 4自动驾驶的车企名单同步扩大:比亚迪、现代、日产、吉利、五十铃全部入列。黄仁勋用了一个熟悉的句式:“自动驾驶的ChatGPT时刻,已经到来。”
在工业机器人领域,NVIDIA与ABB、Universal Robots、库卡、卡特彼勒等头部企业展开合作,将物理AI模型集成至仿真系统,推动机器人大规模进入制造产线。电信巨头T-Mobile也已加入,推动基站逐步演进为边缘AI平台。
在医疗领域,NVIDIA发布了医疗机器人物理AI平台——开源数据集Open-H包含776小时手术视频,Cosmos-H用于生成合成手术视频,GR00T-H处理临床任务指令。
在基础设施层面,NVIDIA宣布推出物理AI数据工厂蓝图,包含Cosmos 3世界模型、Isaac GR00T人形机器人基础模型,以及Omniverse DSX AI工厂数字孪生方案,让全球供应商在虚拟世界中协作设计AI基础设施。
演讲最后,黄仁勋迎来了一位特殊嘉宾——迪士尼《冰雪奇缘》的雪宝机器人。它装着英伟达Jetson处理器,使用由英伟达、迪士尼和Google DeepMind三方联合开发的Newton物理引擎在Omniverse虚拟环境中完成步态训练,随后走上真实世界的舞台,与黄仁勋有来有往地对话,动作自然,反应流畅。
黄仁勋说:“未来的迪士尼乐园,所有角色都将拥有真正的智能,在园区里自由行走,与每一位游客展开真实的互动。”
然后,整场演讲在一段由唱歌机器人、黄仁勋数字人和一只动画龙虾共同演唱的篝火歌曲中落幕。荒诞又震撼,这就是2026年的GTC。
六、太空数据中心:地球的电,已经不够用了
演讲接近尾声时,黄仁勋抛出了一个科幻级的预告:Vera Rubin Space-1——世界上第一个太空数据中心模块,算力比H100高25倍,合作方包括Axiom Space、Starcloud、Planet。
“NVIDIA有很多优秀工程师在做这件事,“他淡淡地说。
表面上这是未来遥想,但背后有一个非常现实的逻辑。知乎上一篇分析写得很直白:“这不是科幻,这是因为地球上的电不够用了。”
黄仁勋在演讲中专门提出了AI产业的”五层蛋糕”框架:能源、芯片、基础设施、模型、应用。最底层,是能源。
这在过去所有AI公司的演讲里几乎从未被提及——大家谈参数有多大、推理有多快,却鲜少谈电从哪里来。现在,英伟达已经在认真思考把AI算力送入轨道,用太空散热来解决地球上建不下、冷却不了的问题。
2026年全球大型科技公司的AI基础设施支出预计将达到6350亿美元,较上年增长近70%。能源危机,已经成为AI产业不得不正视的天花板。
七、AI芯片的护城河,还在吗?
GTC 2026结束之后,业界最值得深思的问题,其实不是Vera Rubin有多快。
而是:英伟达的护城河,还能守多久?
OpenClaw的爆发,已经引发了一场关于AI模型”大宗商品化”的恐慌——当一个独立开发者就能构建出有竞争力的AI智能体,那些依赖”模型能力护城河”的万亿美元估值,还站得住脚吗?
从芯片侧看,ASIC定制芯片(谷歌TPU、亚马逊Trainium、微软自研芯片)正在大量蚕食训练市场;Groq LPU擅长的低延迟推理也在成为新的竞争维度。英伟达垄断AI算力的格局,正面临越来越多的挑战。
黄仁勋心里清楚这一点。所以他在台上不停强调”每瓦Token数”的优势——这不只是性能比较,这是在重新定义游戏规则。如果衡量标准从”算力峰值”变成”能效比”,英伟达凭借全栈协同设计的优势,仍然保持着难以逾越的系统性领先。
更重要的是,NVIDIA在过去这一年,悄悄把自己从一家”卖铲子的公司”变成了一家”卖整个矿山的公司”——芯片只是起点,软件栈(CUDA、NeMo、Omniverse)、数据工厂蓝图、AI智能体平台、乃至太空数据中心,都是同一张拼图的一部分。
这种从产品到平台、从平台到生态的战略升级,才是英伟达真正难以复制的壁垒。
尾声:当AI开始”干活”
有人说,GTC是AI世界的春节晚会。这个比喻有些道理,但也不够准确。
春晚是娱乐,GTC是预言。
2022年,黄仁勋在台上大谈元宇宙,台下有人嗤之以鼻。
2023年,他说生成式AI是新一次工业革命的起点,当时ChatGPT才发布三个月。
2024年,Blackwell发布,那一年英伟达市值从不到5000亿美元飙升至3万亿。
2025年,物理AI正式提出,机器人赛道在全球掀起融资狂潮。
2026年,他说智能体时代到来,说所有工业公司都将成为机器人公司,说太空数据中心不是科幻。
我不知道这些预言会兑现几成。但我知道一件事:在过去四年里,黄仁勋每一次在GTC上说的话,都比当时大多数人预想的更快成为了现实。
AI不再只是”说话”了。它开始”干活”了。
这,或许才是GTC 2026真正想传递的信息。
本文数据来源:NVIDIA官方博客、CNBC、钛媒体、知乎、新浪科技等。文中所有财务预测均为企业方估计,不构成任何投资建议。