英伟达与微软深度合作：AI智能体部署实现端到云统一加速，费尔沃特AI工厂提前启用

在今日拉开帷幕的Build 2026开发者大会上，身处台北的英伟达首席执行官黄仁勋通过在线视频方式，与微软首席执行官萨蒂亚·纳德拉共同发表了主题演讲。

两家科技巨头围绕RTX Spark、适用于Windows的DGX Station、Foundry平台上的NVIDIA开放模型、集成OpenShell安全运行时的GitHub Copilot，以及下一代AI工厂等多个关键领域，深入探讨并宣布了一系列深层次的合作。

微软与英伟达联合发布了一套全面统一的加速计算架构，该架构贯穿Windows设备、Azure云端服务以及本地部署环境，为开发者构建、运行和扩展AI智能体及物理AI应用提供了从硬件到软件的端到端支持。

针对Windows设备端，英伟达与微软正致力于重塑AI智能体时代的个人电脑。RTX Spark作为首批专为个人智能体设计的Windows PC平台，能够提供1 petaflop的AI算力，配备高达128GB的统一内存，并确保全天候续航，同时在电池供电模式下也能维持无损的AI与图形处理性能。

该平台融合了英伟达三十多年来的技术积累，包括CUDA、RTX、DLSS和TensorRT。首批搭载RTX Spark的笔记本电脑和小型台式机预计将于今年秋季由微软Surface、华硕、戴尔、惠普、联想和微星等领先制造商推出。

此外，DGX Station for Windows被誉为当前性能最卓越的桌面级AI超级计算机，它搭载了NVIDIA GB300 Grace Blackwell Ultra桌面超级芯片，具备最高748GB的统一内存以及20 petaflops的FP4性能，足以在本地环境高效运行高达万亿参数的先进模型。这款系统预计在第四季度由华硕、戴尔、技嘉、惠普、微星和超微等厂商推向市场。这两款产品都将预装NVIDIA OpenShell，一款专为自主智能体设计的安全运行时环境。

在模型与平台层面，NVIDIA的开放模型组合已全面进驻微软Foundry平台。Nemotron 3 Ultra作为一款面向编程、科研及企业工作流程中长期运行智能体的新型前沿推理开放模型，预计本月内将在Foundry的托管计算服务中上线。同时发布的还有用于语音识别的Nemotron 3.5 ASR和内容安全模型Nemotron 3.5。

值得一提的是，Anthropic的Claude模型现已在Azure云平台上基于NVIDIA GB300 Blackwell Ultra系统实现原生运行，并计划在未来几周内向客户开放使用。

英伟达智能体工具包（NVIDIA Agent Toolkit）和NVIDIA NemoClaw蓝图为开发者提供了在Foundry上构建生产级智能体的开源平台。同时，CUDA-X库，包含cuDF、cuOpt、AI-Q和NeMo等，现在已作为领域专用技能，可供智能体调用。

数据层方面，NVIDIA加速计算已深度整合进微软Fabric Data Warehouse。微软内部测试数据显示，SQL执行速度相较于CPU基线最高可提升6倍，在高并发负载下，性能甚至可比其他三家主流云数据仓库提供商快达7倍。两家公司强调，这是多年来从研究到生产环节深度工程协作的成果，旨在确保企业数据层能够跟上AI智能体持续查询和推理的速度。

在物理AI领域，微软正将NVIDIA的开源物理AI技能和工具与Azure及物理AI工具链进行集成。此举旨在为开发者提供一个基于Cosmos 3混合Transformer架构的统一平台，用于仿真、训练和部署机器人、自动驾驶车辆及工业系统等自主系统。Cosmos 3在视觉推理、世界生成和动作生成等关键基准测试中表现出色，位居开放模型之首。对于本地部署场景，微软将Azure Local上的Foundry Local引入NVIDIA RTX PRO 6000 Blackwell Server Edition平台。结合Nemotron开放模型家族，企业能够在本地、混合或主权环境中高效运行AI负载。Foundry Local on Azure Local目前已支持多节点部署和vLLM运行时。

安全开发方面，NVIDIA OpenShell已整合至GitHub Copilot。每个智能体都在其独立的沙箱容器中运行，每一次外部调用在访问文件、网络或凭证之前，都会根据预设策略进行评估。这些策略以代码形式编写，并在代码仓库中进行版本管理，支持即时更新。OpenShell基于Apache 2.0开源协议，不依赖特定模型，并全面覆盖本地、混合和云环境。

在AI基础设施建设方面，微软位于威斯康星州费尔沃特的AI工厂已提前投入运营，该工厂部署了数十万套NVIDIA Grace Blackwell系统，并与佐治亚州的一座同类AI工厂互联，共同构建了一个可扩展的分布式AI系统。黄仁勋先生亲自证实，微软是Blackwell芯片的最大部署者。

微软已完成对NVIDIA Vera Rubin平台的验证，该平台现已全面进入生产阶段，并将部署至Azure数据中心。Vera Rubin无需改造即可与Blackwell并行部署，能够将每兆瓦的推理吞吐量提升最高10倍，同时将每个智能体的token成本降低一个数量级，并内置NVIDIA机密计算功能，以确保模型和数据的安全性。