当 NVIDIA 不再只卖 GPU:黄仁勋的”代理世界”蓝图
看完老黄在 2026 GTC 台北站的那场演讲,我只有一个感受:
这人已经不满足于做显卡了。他想要成为 AI 时代的"国家电网"。
从"聊天玩具"到"数字员工"
过去两年多,我们一直在跟生成式 AI 玩。让 ChatGPT 写个总结、让 Midjourney 画张图、让 Claude 改段代码——这些本质都是"输入-输出"的一次性互动。
但老黄这次说得非常明白:真正的拐点到了。
"Agentic AI"(代理型 AI)这个词才是这场演讲的真正主角。AI 不再只是你问起笔它才回答的工具,而是能够自主思考、制定计划、调用工具并执行复杂任务的数字劳动力。
GitHub 的数据显示,AI 代理正在把软件开发生产力提升三倍。这让我脑海中闪过一个画面:
以前一个程序员面对一张待办清单,一个 AI 在旁边帮你搜索、帮你写、帮你 debug。以后,是你面对一张待办清单,AI 那个"员工"直接替你干完了大部分。
"计算机制等于收入"——这句话虽然听起来像典型的"卖铲人"逻辑,但还真没法反驳他。因为每个 token 背后都对应着真实的企业产出和利润,这意味着什么?
全球对算力的渴求只会越来越疯狂。而老黄就是那个卖铲的人,现在他不仅要卖铲,还要把整个矿场的基建都包了。
老黄的野心:你不只买我的卡,你要买我的"工厂"
Vera Rubin 架构的发布,标志着 NVIDIA 彻底撕掉了"GPU 公司"的标签,正式转型为基础设施公司。
6 万亿个晶体管、超 1.8 万个组件、革命性的 PCB 中间层设计实现无电缆化,机架组装从 2 小时缩短到 5 分钟——这些数字不是工程师们在炫技,而是 NVIDIA 在告诉全世界:
"我要替你建 AI 工厂,而且要让这些工厂像乐高一样快速搭建、像发电厂一样稳定运行。"
45 摄氏度热水液冷技术降低能耗,这是针对买方的核心痛点打的牌。毕竟之前切片式地买卡回去自己攒集群的时代正在被终结。
这就像亚马逊当年从卖书变成做 AWS,当整个行业都需要一种底层服务时,卖服务的永远比卖单品的更有话语权。
NVIDIA 正在把 AI 算力变成像水电一样的基础设施。而且,它要收"水费"。
专为 Agent 而生的 Vera CPU:老黄重新定义了芯片逻辑
这场演讲里我个人最感兴趣的部分。
老黄直言:传统的通用 CPU 根本不适合 AI 代理时代。
在一个 AI 工作循环里,CPU 是指挥官。如果 CPU 反应慢,那旁边摆着再贵的 GPU 也只能"空转"——这损失比想象中大得多。所以他提出了一个非常有冲击力的定位:
"Vera CPU 是专为 agent 设计的,不是为人类设计的。"
这句话本身就很有信息量。过去几十年,CPU 的设计哲学是服务人类操作系统的调用、终端任务和通用计算。而 Vera 的设计目标是极致单线程性能、超高 IPC、3.6 Tbps 的织网速度——一切为了让 agent 之间的通信和调度尽可能快。
底层任务快 3 倍,纽交所实时流任务快 6 倍——这个对比放在金融和交易领域,基本就是碾压式的代差。
我的判断是:通用计算时代正在分裂。 CPU 赛道会进一步分化成"为人优化的旧架构"和"为 AI 优化的专用架构"。Intel 和 AMD 如果不能迅速跟进这种思维,被甩开的危险不是不存在。
RTX PC:把数据中心塞进你的背包
如果 Vera 架构是向上(超大规模数据中心),那 RTX Spark 系列就是向下——把 AI 能力塞进每个人的个人电脑里。
老黄说这是"PC 产业 40 年来最大的变革",说实话,这种话他以前也说过不少。但这次我倾向于认为他七成是认真的。
想象一个场景:你不再需要打开 Photoshop 调参数、不需要去 Blender 里切来切去,而是直接对电脑说"帮我做一个赛博朋克风格的角色,带荧光紫披风"——然后本地 AI 代理自己去操作这些工具,把你的意图翻译成上百个精确的操作步骤。
这才是真正的"自然语言编程"——不是教用户写代码,而是让 AI 直接替你操作代码和工具。
"每个家庭都有一台 AI 超级计算机"——这句话听起来宏大,但核心前提是:这些算力到底要多少钱?联发科做 NEX 芯片、微软推系统层适配,说明这个生态的拼图正在慢慢拼上。
PC 产业的 AI 化是不可逆的趋势。问题是:谁来做 AI PC 时代的定义者?NVIDIA 显然不想只当幕后配角。
物理 AI 与 Cosmos 3:最远的一步,也是最性感的一步
如果说 AI 代理是"现在",RTX PC 是"马上",那物理 AI(Physical AI)就是"未来"。
Cosmos 3 基础模型的核心能力是什么?生成物理真实的视频,让机器人在进入物理世界前,先在虚拟环境里"试错"一万次。
这解决了机器人/自动驾驶行业一个核心瓶颈:真实世界数据的获取太贵了。你不可能让人形机器人在现实里摔一万跤来学走路,但你可以让它在模拟器里摔。
配合 GR00T 机器人平台,NVIDIA 正在做一盘很大的棋:从仿真训练到硬件运行,全栈打通。
这本质上是在降低具身智能的门槛。未来做机器人的公司,可能不再需要自建昂贵的物理测试场,而是先在 Cosmos 里完成 90% 的训练。
我的结语
回到文章开头那场演讲的本质。
黄仁勋讲的不是几款新硬件,而是未来十年社会的运转方式:
在代理驱动的世界里,人的价值将从"执行"转向"意图"和"创意"。你不需要精通 Photoshop、不需要会写代码、不需要了解复杂的工程流程——你只需要能清晰表达你想要什么,剩下的,agent 会替你完成。
听起来很美好,甚至有点乌托邦。但我作为一直在这个行业观察的人,有几个保留意见:
第一,"计算机制等于收入"本质上是卖方视角。 算力确实重要,但它是不是直接等于收入?很多公司买了大量 GPU 后发现利用率并不理想,AI 落地的大卡车远远还没开到终点。老黄这么说,是在帮自己的商业叙事。
第二,NVIDIA 的全栈野心值得警惕,也值得尊敬。 从芯片到架构到工厂到 PC 到机器人生态,它在每一个 Layer 都试图占据核心位置。当一个参与者既做裁判(定义标准)又做运动员(卖产品)时,行业的竞争格局会变得很有趣。
第三,Agentic AI 确实会改变工作方式,但不会一夜之间替代所有执行层。 越是复杂的任务,人类意图的设定、监督和对齐就越关键。未来最值钱的能力可能是"精准描述你要什么"。
最后一句总结:
NVIDIA 不再卖 GPU,它在卖"新世界的基建"。而这座城到底有多大、有多少人住进来,不只看老黄铺多少路,也看整个生态能不能找到真正落地的人工智能应用。
以上。
你怎么看 Agentic AI 这个趋势?你觉得老黄这次是在画饼还是新一轮技术浪潮的前奏?评论区聊聊。