如果说 GPU 是英伟达的左心、CUDA 是右心,那么 Vera CPU 就是黄仁勋为智能体时代锻造的第三颗心脏。
在 GTC 台北主题演讲中,黄仁勋正式发布了专为智能体设计的 Vera CPU——88 核 Arm 架构、1.2TB/s 内存带宽、PCIe Gen6,内外带宽均达到同类 x86 CPU 的 2 至 3 倍。更关键的是,这是首款在纠正多位错误时不损失带宽的 CPU。
几个数据足以说明 Vera 的野心:
“目前的订单量已注定它将成为我们公司历史上最快速、最成功的产品发布。”黄仁勋这句话并非虚张声势。Anthropic、OpenAI、SpaceX 三家 AI 巨头已率先部署 Vera CPU。在 Q1 财报中,英伟达曾透露 Vera 将开启一个价值 2000 亿美元 的市场,预计本财年末收入达 200 亿美元。
Phoronix CPU Benchmark Suite 作者 Michael Larabel 的评价一针见血:”NVIDIA Vera 是英特尔和 AMD x86_64 处理器有史以来最强大的竞争对手。”
Vera 背后的设计哲学值得深究。传统 CPU 追求每颗插槽的核心数,切片、虚拟化、按小时出租。但在智能体时代,CPU 已成为 GPU 利用率的瓶颈,直接影响 token 吞吐量与时延。Vera 的四大设计原则——领先的每时钟指令数(IPC)/ 单线程性能、每核心带宽、总带宽以及能效——正是为打破这一瓶颈而生。
Vera CPU 已进入全面量产,将于今年秋季通过系统合作伙伴正式上市。
“时隔 40 年,微软与英伟达将重新发明 PC。”黄仁勋的这句话,配上 RTX Spark 超级芯片的发布,分量十足。
RTX Spark 采用台积电 3nm 工艺,内置 700 亿晶体管,提供 128GB LPDDR5X 统一内存和 1PetaFLOPS FP4 AI 算力。Blackwell RTX GPU 拥有 6144 个 CUDA 核心和第五代 Tensor Core,通过 NVLink C2C 连接到与联发科合作开发的定制 20 核 Grace CPU。
这意味着什么?一台搭载 RTX Spark 的 PC,可以渲染 90GB 超大型 3D 场景、编辑 12K 4:2:2 视频、运行 100 万 token 上下文的 1200 亿参数 大语言模型,还能以 1440p 分辨率和每秒 100 帧以上畅玩 3A 大作。
微软与英伟达发布了面向智能体的全新三大 Windows 产品线——笔记本电脑、台式机、桌面超算。其中笔记本厚度仅 14mm、重量 3 磅,可 24 小时不间断本地运行 AI 智能体。联想、戴尔、微软等厂商将在今年秋季推出首批搭载 RTX Spark 的 AI PC。
更深层的信号是:“计算即收入”。黄仁勋说,以前使用 PC 要启动应用程序、点击鼠标、输入文字;现在只需提出请求,电脑就能完成工作。PC 正从工具进化为智能体终端,这一变革的重要程度”不亚于普通手机演变为智能手机”。
虽然消费级 AI PC 已经令人震撼,但英伟达的真正野心在 DGX Station for Windows——全球最强大的桌面 AI 超算。
搭载 GB300 Grace Blackwell Ultra 桌面级超级芯片,DGX Station 提供 748GB 统一内存、20PetaFLOPS FP4 算力、800Gbps ConnectX-8 SuperNIC 网络。它可以运行 万亿参数 级 AI 模型,同时驱动 数百个 智能体。
黄仁勋预言,未来有一天每个家庭都会有一台 AI 超级计算机,运行着你所有的智能体和助手。DGX Station 预计今年第四季度上市。
在模型层面,英伟达拿出了迄今最强开源模型 Nemotron 3 Ultra——5500 亿参数,全球首个基于 SSM(状态空间模型)与 MoE(专家混合)混合架构的模型。
速度是同级别领先模型的 5 倍,完成相同智能体任务的运行成本降低 30%。在智能体生产力测试中,Nemotron 3 Ultra 的分数超过或打平了三个领先的国产智能体模型——智谱 GLM 5.1、月之暗面 Kimi K2.6、阿里 Qwen3.5。
英伟达同时推出了企业级智能体工具包。最令人印象深刻的案例是:英伟达与 Cadence 合作打造的芯片设计超级智能体,可将原本耗时数周的验证工作压缩到几小时,验证周期快了 40 多倍。
面向物理 AI,英伟达开源世界基础模型 Cosmos 3,基于混合 Transformer 架构,统一视觉推理与跨文本、视频、图像、环境音效和动作的多模态生成。开发者可针对不同形态和应用场景进行后训练。
英伟达还宣布成立 Cosmos 联盟,Agile Robots、Black Forest Labs、Runway 等顶尖 AI 实验室将共同开发下一代 Cosmos。
在机器人领域,英伟达与宇树科技联合发布了 Isaac GR00T 参考人形机器人——宇树 H2 Plus 机身(1.8 米、68 公斤、31 个自由度)+ Sharpa Wave 五指灵巧手 + Jetson Thor 处理器,开箱即用。今年年底由宇树科技供货。
OpenAI 官宣进军机器人赛道。 山姆·奥特曼在社交平台发布 Robotics 招聘信息,称短期内专注研发协助型机器人,长远目标是让每个人都能拥有个人机器人。这与英伟达的”每个家庭一台 AI 超算”遥相呼应。
Anthropic 秘密递交 IPO 申请。 公司声明称已向 SEC 提交 S-1 文件草案,上市将取决于市场状况。与此同时,Anthropic 将向欧盟网络安全局提供 Mythos 模型访问权限。
宇树科技科创板 IPO 过会,拟募资 42.02 亿元用于智能机器人研发与制造基地建设。智谱也宣布拟在科创板上市,A 股发行数量占总股本 2% 至 8%。
“实用 AI 时代已经到来。AI 现在是利润生成器、GDP 生成器。Token 已成为盈利的收入单位。”
黄仁勋在 GTC 台北的这几句话,或许是对 2026 年 AI 产业最精准的注脚。从 Vera CPU 颠覆数据中心架构,到 RTX Spark 重塑个人计算,再到 Cosmos 3 重构物理世界——英伟达不再是一家 GPU 公司,而是一家全栈 AI 基础设施公司。
而当 OpenAI 官宣进军机器人、Anthropic 冲刺 IPO、国产大模型百花齐放,一个清晰的图景正在浮现:2026 年,AI 正从”能力竞赛”进入”基础设施竞赛”。 谁掌控了从芯片到模型、从云端到终端、从数字世界到物理世界的全栈能力,谁就掌握了下一个十年的门票。
本文基于 2026 年 6 月 2 日公开信息整理,仅代表个人观察与思考。 (内容由AI生成,仅供参考)