近期,英伟达发布了其2027财年第一季度财报。凭借AI基础设施和Blackwell系统的强劲需求,该公司再次交出了一份超越市场预期的成绩单。财报显示,英伟达实现营收816亿美元,同比增幅达85%;GAAP净利润为583亿美元,同比激增211%;毛利率稳定维持在74.9%的区间。这些数据换算下来,英伟达平均每天净利润约6.5亿美元,相当于每小时收入2700万美元。
尽管业绩表现亮眼,但市场对于英伟达的反应却趋于冷静。有观点认为,由于投资者此前对英伟达的期望已被推至极高,即使强劲的业绩也需要更大的“超预期”幅度才能支撑其高估值和股价的持续上涨。市场开始追问:英伟达在AI算力领域已占据90%以上份额,其未来的增长空间究竟在哪里?
华尔街当前的关注焦点已转向新的AI叙事:CPU算力价值的重估、AI推理商业化的大规模爆发以及智能体AI的规模化落地。过去两年,资本市场主要围绕大模型训练和高端GPU算力展开竞赛,形成了“AI等同于GPU,算力越强价值越高”的认知。但在当前,行业主流顶级投行的研究报告和资金流向显示,纯粹的GPU训练红利已近尾声,AI产业正迈入下半场。
英伟达首席执行官黄仁勋在财报电话会议上指出,“AI工厂正在以惊人的速度加速建设,这是人类历史上最大规模的基础设施扩张。”他还提到,未来可能出现数十亿的AI智能体,这将显著增加推理硬件的需求。他解释说,“思考”发生在GPU上,而“编排”则主要运行在CPU上,暗示了CPU在AI未来发展中的重要性。
英伟达首席财务官科莱特·克雷斯表示,公司推出的Vera CPU有望为英伟达开启一个全新的2000亿美元服务市场,并预计今年CPU收入将接近200亿美元,为英伟达成为全球领先的CPU供应商奠定基础。
从技术底层来看,CPU在AI的“下半场”拥有GPU无法替代的三大核心优势:首先是复杂逻辑处理能力,智能体自主执行复杂任务时大量的条件判断、循环调度和分支流程,都是CPU的传统强项;其次是系统级调度能力,智能体的工作流程涉及多模型协作、外部工具调用、海量数据读写和跨平台系统联动,CPU是这一复杂体系的核心调度枢纽;最后是低延迟响应能力,金融交易、自动驾驶等场景对毫秒级响应速度有极高要求,CPU的缓存架构和指令集优化能完美适配。
摩根士丹利的最新研报指出,随着AI智能体的爆发,AI基础设施正从以GPU为主导的模式转向“CPU+内存+系统协同”架构。预计到2030年,全球服务器CPU市场规模将突破千亿级别,相较2025年实现翻倍增长,年复合增长率将保持在35%以上,成为AI算力领域增速最快的细分市场。
如果说CPU重构了AI算力的底层架构,那么AI推理的规模化爆发则是支撑此次产业叙事转变的核心商业基础。IDC预测,到2030年,全球活跃AI智能体将达到22.16亿个,年度Token消耗量将从2025年的0.0005 Peta Tokens飙升至15.2万 Peta Tokens,增长超过3亿倍,预示着算力需求的巨大潜力。
这一需求的爆发得益于AI应用的全面渗透,企业级智能体应用已大规模落地,超过四成的企业数字化系统嵌入了任务型自主智能体。同时,手机、汽车、智能家居等终端设备也全面搭载轻量级推理模型,加速了端侧智能的普及。AI辅助编程、智能办公和智能决策等场景已成为行业标配,全面拉动推理算力需求的井喷。
以往AI企业的成本主要集中在模型训练和高端GPU采购,而现在,推理环节的成本占比已提升至70%以上,成为企业AI商业化落地的主要开支。这标志着AI行业的竞争逻辑已转变为“谁能以更低成本、更高效率完成推理落地”。高效的推理能力已成为企业实现AI盈利的关键。
商业模式的成熟也使推理市场彻底打开了商业化空间。基于Token消耗量的计费模式已成为AI服务商的主流选择;办公智能体、企业数字化智能体的订阅制服务持续普及,带来了稳定的持续性收入;云端推理专属服务快速落地,为企业提供算力、优化、运维一体化的推理解决方案。推理正成为AI行业最稳定、最可观的盈利赛道。
2026年被全球资本市场普遍认为是“AI智能体商业化元年”。AI智能体已从实验室概念和资本市场热点转变为能够自主完成复杂工作、替代人工流程的“数字员工”,成为AI产业下半场最核心的落地载体。高盛行业分析显示,未来两年内,美国企业的智能体渗透率将突破50%,AI智能体将成为企业办公、生产、运营的标配工具。
技术的持续突破加速了智能体的规模化落地。行业已从早期的单智能体单点作业发展到多智能体协同工作体系。标准化交互协议的普及打通了不同平台、不同功能智能体之间的通信壁垒,实现了智能体之间的角色分工、自主协作和任务联动。
同时,具身智能技术也日益成熟,搭载多维度传感器的物理智能体能够适配工业复杂场景,自主完成巡检、操作、运维等高危复杂工作,使得AI智能体从虚拟数字场景走向真实的物理产业场景,赋能工业数字化转型。
受益于智能体AI时代的爆发,英伟达瞄准2000亿美元新市场的CPU战略,旨在向华尔街证明其高增长的持续性与广阔的想象空间。AI如今已不再是“锦上添花”,而是提高各行业和岗位生产力的必需品。这推动了能源、芯片、基础设施、模型和应用等AI资本支出的持续投入。公司预计,到2030年,AI基础设施支出有望达到每年3万亿至4万亿美元。
管理层在电话会议中指出,AI基础设施需求正以前所未有的速度扩张,“AI工厂”建设正在加速。推动这一轮建设的因素主要有两个:首先,超大规模云厂商的核心工作负载正从CPU转向GPU加速计算,覆盖从搜索、广告到推荐系统和内容理解的各个领域;其次,AI原生产品和服务的采用正迎来拐点,主流AI已从一次性推理发展到逻辑推理能力,并进一步进入智能体阶段。
投资者当前关注的焦点是代号为“Vera Rubin”的下一代AI架构能否在2026年下半年如期进入量产爬坡阶段。高盛在财报发布前维持英伟达“买入”评级,并明确将Vera Rubin的量产时程列为推动估值重估的核心催化剂之一。市场普遍认为,现有Blackwell架构的增长天花板已充分定价,真正的增量故事需要由下一代产品来接棒。
Vera Rubin平台以暗物质研究先驱、天文学家薇拉·鲁宾命名,定位高性能计算(HPC)与大规模AI训练场景。其目标是填补现有H100系列与未来超大规模模型需求之间的算力缺口,进一步巩固英伟达在数据中心AI芯片领域的主导地位。首批客户已锁定亚马逊AWS、微软Azure等北美头部云服务厂商。
目前,全球AI正加速迈入“千万亿Token时代”。今年3月,中国日均Token调用量已突破140万亿,全球年化推理用量已超过1千万亿Token,这标志着AI已从“交互工具”转向“持续运行的智能基础设施”。Vera Rubin平台并非传统意义上的通用计算平台,而是旨在成为智能体AI时代的Token生产基础设施。
Vera Rubin平台由七款核心芯片组成,包括Vera CPU、Rubin GPU、NVLink 6(第六代NVLink交换机芯片)、ConnectX-9 SuperNIC(超级网卡)、BlueField-4 DPU(存储芯片)、Spectrum-6(以太网交换机芯片,支持CPO技术)以及Groq 3 LPU(英伟达收购Groq后的首款芯片),共同构成了Blackwell的跨代接力者。
值得注意的是,Rubin GPU提供的推理算力是前一代Blackwell的五倍,训练大型MoE模型所需的GPU数量减少了四分之三,每Token推理成本降至十分之一,使得Token有望成为如同水电一样的普惠基础设施。
在技术层面,Vera Rubin采用台积电的先进封装工艺(推测为CoWoS-Lite或更高版本),将8个计算核心和4组HBM3e内存集成于单一封装内,内存总容量高达192GB,带宽突破2TB/s,相比H100的1.6TB/s提升了25%。其定制化架构针对Transformer模型的注意力机制进行了优化,支持FP8、FP16及BF16混合精度计算,单芯片FP8峰值算力可达512 TFLOPS,较H100的395 TFLOPS提升30%。同时,该芯片通过动态电压调节技术,将典型功耗控制在380W以内,能效比提升20%,符合数据中心绿色节能趋势。
对客户而言,Vera Rubin能将大模型训练时间缩短30%以上,降低训练成本约25%,助力云厂商快速部署下一代AI服务。它延续了英伟达的CUDA生态,现有AI框架如TensorFlow、PyTorch无需大幅修改即可适配,从而降低了客户的迁移成本。
相比AI算力基础设施,物理AI市场展现出更广阔的想象空间——数十亿个自主机器人系统将在物理世界中运行,涵盖工业机器人、服务机器人、自动驾驶汽车和无人机等。
在本季度的财报中,英伟达不仅强调了“AI工厂”的惊人扩张速度,还通过全新的财报框架,正式将“物理AI”(Physical AI)推向产业舞台的中心。随着“边缘计算”板块的独立披露,以及一系列针对自动驾驶与具身智能的技术发布,英伟达正全力打通AI进入物理世界的“最后一公里”。
英伟达在财报中明确提及,公司发布了NVIDIA Alpamayo 1.5开放模型和NVIDIA Omniverse NuRec技术,以支持大规模自动驾驶系统的开发。这一举措直指自动驾驶行业真实路测数据“不可交互、难以复用”的痛点。通过神经渲染技术,英伟达正在将“死数据”转化为可交互的“活场景”,为L4级自动驾驶的量产落地提供了强大的仿真与数据闭环能力。
在自动驾驶领域,全球科技企业和车企正加速突围,与英伟达的底层算力形成了紧密的产业共振。在GTC 2026大会上,英伟达宣布与比亚迪、吉利、日产、五十铃等国内外头部车企合作,基于NVIDIA DRIVE Hyperion平台共同打造L4级自动驾驶汽车,并推出了面向AI驱动型车辆的统一安全架构NVIDIA Halos OS。
同时,英伟达扩大与优步的合作,推出了搭载全栈NVIDIA DRIVE AV软件的自动驾驶车队。小马智行、文远知行、蘑菇车联等自动驾驶企业也围绕自动驾驶出租车和巴士业务在全球范围内持续落地。
针对具身智能,英伟达本季度推出了NVIDIA Isaac GR00T N模型及新的Isaac仿真框架,旨在为具身智能提供强大的物理AI算力底座。GR00T N采用类似于人类认知的“快思考+慢思考”双系统架构,将高级推理与低级运动控制分离。“慢思考”推理层基于视觉-语言模型(VLM)Cosmos-Reason-2B,负责处理图像和语言指令,进行场景理解、任务分解和多步骤规划(例如将“组装零件”拆解为“抓取”、“对准”、“拼接”)。“快思考”动作层基于扩散Transformer(DiT)或Flow Matching架构,接收推理层的高级令牌和机器人本体状态,通过去噪过程生成平滑、精确的连续动作向量,直接控制机器人关节。
随着NVIDIA IGX Thor平台的全面上市,英伟达正加速让机器人具备更强的环境感知与交互能力,推动具身智能从实验室走向真实的工业与商业场景。NVIDIA IGX Thor专为将实时物理AI直接部署于边缘端而设计,该平台将高速传感器处理、企业级可靠性和功能安全性整合到桌面级紧凑模块中,助力开发者构建感知、推理和行动快速、安全、智能的系统。
值得关注的是,英伟达首次将“边缘计算”作为独立板块进行披露。财报明确指出,该板块涵盖了用于代理式AI和物理AI的数据处理设备,具体包括PC、游戏主机、工作站、AI-RAN基站、机器人以及汽车。这直接印证了AI技术正从虚拟数字世界加速走向真实的物理世界。
对于投资者和行业从业者而言,固守旧有的GPU叙事已无法适应当前的产业节奏。与其纠结于英伟达当前的高估值,不如关注其在CPU、推理和智能体等领域的最新进展。毕竟,当一个最确定、最广阔的万亿级市场大门缓缓开启时,英伟达日赚6.5亿美元的业绩虽然惊人,但在AI革命的大背景下,这仅仅只是一个开始。
