黄仁勋又夸了DeepSeek,新一代“算力巨兽”正在量产,性能暴增5倍

摘要:“Rubin的到来恰逢其时,因为训练和推理的AI计算需求正在激增。”
北京时间1月6日早五点,英伟达CEO黄仁勋在CES 2026开幕前的 keynote 演讲中,用90分钟为全球科技产业描绘了一幅激进且完整的未来图景。
在这场信息密度极高的演讲中,他不仅宣告人工智能的发展重心正从纯粹的“数字智能”迈向与物理世界交互的“物理AI”新纪元,更以一系列开源重器——从世界模型Cosmos、自动驾驶系统AlphaMio到新一代AI芯片架构Vera Rubin——展示了英伟达作为全栈巨头的野心:即为这个新时代构建从底层芯片、基础设施到顶层模型与应用的全部基石。

当AI时代的算力需求正无限放大,英伟达仍在通过对计算平台的极限升级,试图吃下这个庞大的数字世界算力基座。
DeepSeek带来的启示,开源是创新主引擎
演讲伊始,黄仁勋便以历史性的视角定调感慨:“每隔10到15年,计算行业就会发生一次平台迁移。”他强调,当前我们正同时经历两大迁移:一是应用转向以AI为核心构建;二是整个软件开发和运行范式被重塑——从“编程”转向“训练”,从CPU转向GPU,从执行预编译代码转向实时生成内容。

“这意味着过去十年价值约10万亿美元的计算产业,正在被现代化改造。”黄仁勋指出,驱动这场变革的资金,来自全球研发预算向AI的转移以及海量的风险投资。
他特别用大量篇幅盛赞了开源模型的革命性作用,并再一次感叹了DeepSeek让世界震惊,开源让AI迅速扩散,没有人愿意掉队。“开源模型已经触及技术前沿,”黄仁勋表示,虽然顶尖开源模型与最前沿专有模型之间仍有约6个月的差距,但这种快速迭代正激活全球创新。
“我们怎么可能让智能的数字形式拋下任何人?”他反问道。英伟达自身也投入了价值数十亿美元的DGX超级计算机集群来推动开源模型发展,并在蛋白质结构预测(Open Fold Three)、天气预测(Forecast Net)等多个科学领域取得突破。
智能体与物理AI——从理解语言到理解世界
黄仁勋详细阐述了AI能力演进的下一个关键阶段:从大语言模型的“记忆与生成”迈向智能体(Agent)的“推理与行动”。他解释,早期模型会产生“幻觉”,是因为它们缺乏在回答前进行“基础研究”的能力。而现代智能体框架能够进行思维链推理,主动规划步骤、调用工具,从而解决从未被明确训练过的新问题。

“这为各种应用打开了大门。我们不再需要在第一天就训练AI懂得一切。”黄仁勋说。这一智能体架构本质上是多模型、多云、混合式的,能够根据任务动态选择最佳模型,并结合企业私有的定制化模型,形成既前沿又专属的AI能力。
然而,真正的挑战在于让AI理解物理世界。“一个小孩都懂的常识——物体恒存、重力、摩擦力——对AI来说完全陌生。”黄仁勋指出,这引出了演讲的核心主题:物理AI。为此,需要构建一个由三台计算机组成的完整系统:一台用于训练AI模型,一台用于在机器人或汽车上实时推理(“边缘计算”),而第三台则用于高精度物理模拟,以生成训练数据并评估AI行为的安全性。
世界模型Cosmos与自动驾驶系统AlphaMio
随后,黄仁勋隆重介绍了英伟达应对物理AI挑战的核心答案:NVIDIA Cosmos。这是一个开源的、“前沿级”的世界基础模型,它并非基于语言,而是基于对互联网规模视频、真实驾驶数据和3D模拟的学习,从而建立起对世界运作方式的统一表征。Cosmos能够根据单张图片生成逼真视频,或从3D场景描述中生成物理合理的运动轨迹。更重要的是,它能在交互式闭环模拟中响应AI的动作,并进行因果推理。
“Cosmos将计算转化为数据。”黄仁勋强调,这解决了在现实世界中收集海量、尤其是罕见“长尾”场景数据的成本与效率瓶颈。
基于Cosmos生成的海量合成数据与真实数据,英伟达训练并开源了其首个端到端自动驾驶系统——NVIDIA AlphaMio。黄仁勋宣称,这是“世界上第一个具备思考推理能力的自动驾驶汽车AI”。AlphaMio不仅能处理传感器输入并控制车辆,更能向乘客解释它即将采取的行动及其背后的推理过程。这种“可解释性”和应对未知场景的推理能力,是处理自动驾驶“长尾问题”的关键。他宣布,首款搭载AlphaMio的梅赛德斯-奔驰汽车将于2026年第一季度上路。
算力需求激增,生逢其时的Vera Rubin
演讲到后半程,黄仁勋终于拿出了主菜,重磅芯片新架构。
面对AI模型规模每年增长10倍、计算需求爆炸的挑战,黄仁勋说他们不得不重新设计每一款芯片,并现场正式揭示了英伟达的下一代AI芯片架构:NVIDIA Vera Rubin。其命名来源于发现暗物质的天文学家薇拉·鲁宾,寓意照亮AI计算的未知领域。

“Rubin 的到来恰逢其时,因为训练和推理的 AI 计算需求正在激增”,黄仁勋表示,他解释道,在摩尔定律放缓的当下,仅靠晶体管数量微增(Rubin GPU晶体管数仅为Blackwell的1.6倍)无法实现性能飞跃。Vera Rubin的秘诀在于 “极端协同设计” ——对公司内部所有芯片进行彻底重新设计,使其作为一个整体系统工作。并一次性展示了6款芯片:Vera CPU、Rubin GPU、NVLink 6 Switch、ConnectX-9(CX9)智能网卡、BlueField-4 DPU、Spectrum-X 102.4T CPO。黄仁勋评价其“每一颗都是革命性的”,都值得单独开一场发布会。

Vera CPU与Rubin GPU:新一代CPU性能功耗比提升2倍,GPU的AI浮点性能达到Blackwell的5倍。
革命性NVFP4张量核心:这是一个能动态自适应调整精度以优化Transformer模型吞吐量的专用处理器,黄仁誉其为“突破性工作”,并暗示可能成为未来行业标准。
全栈革新:从集成硅光子的Spectrum-X以太网交换机(512个200Gb/s端口),到为AI工作负载重塑的BlueField-4 DPU(用于管理爆炸式增长的KV缓存上下文内存),再到彻底简化、无电缆的DGX机箱设计, Vera Rubin是一次从芯片到系统的全面重构。
黄仁勋展示了一个包含1152个GPU的Vera Rubin POD,其机柜重达约2吨,内部包含2英里长的铜缆。尽管性能巨幅提升,其散热仍仅需45摄氏度温水,能效显著。他总结,Vera Rubin将使训练一个10万亿参数大模型所需的系统数量减少至Blackwell的四分之一,同时推理成本降低一个数量级,是“通往AI下一个前沿的巨大飞跃”。
黄仁勋还表示,“如果Vera Rubin要赶在今年,现在必须已经在生产中。今天我可以告诉大家,Vera Rubin正在全力生产中。”
生态与未来——机器人普及与工业数字化
最后,黄仁勋将视角扩展至更广阔的产业。他宣布与西门子达成重磅合作,将英伟达的物理AI模型与Omniverse数字孪生平台深度集成到西门子的工业软件与自动化系统中,共同推动从芯片设计、工厂规划到生产运维的全面数字化革命。
“最初是他们(EDA和工业软件公司)创造了英伟达,现在我们有幸用创造的技术去变革他们的行业。”黄仁勋说。
演讲在充满未来感的氛围中结束。黄仁勋总结道,自动驾驶汽车仅是物理AI的第一个主流市场,相同的技术栈(三台计算机、合成数据生成、模拟)正催生机器人革命的到来,从机械臂到人形机器人。他邀请多个机器人合作伙伴登场,并戏称:“机器人领域的‘ChatGPT时刻’即将到来。”
黄仁勋此次演讲已远超单一产品发布的范畴,而是一次对AI及计算产业未来十年的系统性宣言。通过开源关键模型(Cosmos, AlphaMio)与发布颠覆性硬件(Vera Rubin),英伟达正强势定义“物理AI”时代的技术标准与基础设施。其战略核心清晰无比:以全栈式的开放生态,牢牢占据从数据中心到机器人指尖的每一个计算节点。一个由AI驱动、虚实交融的物理世界,其基石正在今夜被英伟达一块块奠定。