在今日拉开帷幕的Build 2026开发者大会上,身处台北的英伟达首席执行官黄仁勋通过在线视频方式,与微软首席执行官萨蒂亚·纳德拉共同发表了主题演讲。
两家科技巨头围绕RTX Spark、适用于Windows的DGX Station、Foundry平台上的NVIDIA开放模型、集成OpenShell安全运行时的GitHub Copilot,以及下一代AI工厂等多个关键领域,深入探讨并宣布了一系列深层次的合作。
微软与英伟达联合发布了一套全面统一的加速计算架构,该架构贯穿Windows设备、Azure云端服务以及本地部署环境,为开发者构建、运行和扩展AI智能体及物理AI应用提供了从硬件到软件的端到端支持。
针对Windows设备端,英伟达与微软正致力于重塑AI智能体时代的个人电脑。RTX Spark作为首批专为个人智能体设计的Windows PC平台,能够提供1 petaflop的AI算力,配备高达128GB的统一内存,并确保全天候续航,同时在电池供电模式下也能维持无损的AI与图形处理性能。
该平台融合了英伟达三十多年来的技术积累,包括CUDA、RTX、DLSS和TensorRT。首批搭载RTX Spark的笔记本电脑和小型台式机预计将于今年秋季由微软Surface、华硕、戴尔、惠普、联想和微星等领先制造商推出。
此外,DGX Station for Windows被誉为当前性能最卓越的桌面级AI超级计算机,它搭载了NVIDIA GB300 Grace Blackwell Ultra桌面超级芯片,具备最高748GB的统一内存以及20 petaflops的FP4性能,足以在本地环境高效运行高达万亿参数的先进模型。这款系统预计在第四季度由华硕、戴尔、技嘉、惠普、微星和超微等厂商推向市场。这两款产品都将预装NVIDIA OpenShell,一款专为自主智能体设计的安全运行时环境。
在模型与平台层面,NVIDIA的开放模型组合已全面进驻微软Foundry平台。Nemotron 3 Ultra作为一款面向编程、科研及企业工作流程中长期运行智能体的新型前沿推理开放模型,预计本月内将在Foundry的托管计算服务中上线。同时发布的还有用于语音识别的Nemotron 3.5 ASR和内容安全模型Nemotron 3.5。
值得一提的是,Anthropic的Claude模型现已在Azure云平台上基于NVIDIA GB300 Blackwell Ultra系统实现原生运行,并计划在未来几周内向客户开放使用。
英伟达智能体工具包(NVIDIA Agent Toolkit)和NVIDIA NemoClaw蓝图为开发者提供了在Foundry上构建生产级智能体的开源平台。同时,CUDA-X库,包含cuDF、cuOpt、AI-Q和NeMo等,现在已作为领域专用技能,可供智能体调用。
数据层方面,NVIDIA加速计算已深度整合进微软Fabric Data Warehouse。微软内部测试数据显示,SQL执行速度相较于CPU基线最高可提升6倍,在高并发负载下,性能甚至可比其他三家主流云数据仓库提供商快达7倍。两家公司强调,这是多年来从研究到生产环节深度工程协作的成果,旨在确保企业数据层能够跟上AI智能体持续查询和推理的速度。
在物理AI领域,微软正将NVIDIA的开源物理AI技能和工具与Azure及物理AI工具链进行集成。此举旨在为开发者提供一个基于Cosmos 3混合Transformer架构的统一平台,用于仿真、训练和部署机器人、自动驾驶车辆及工业系统等自主系统。Cosmos 3在视觉推理、世界生成和动作生成等关键基准测试中表现出色,位居开放模型之首。对于本地部署场景,微软将Azure Local上的Foundry Local引入NVIDIA RTX PRO 6000 Blackwell Server Edition平台。结合Nemotron开放模型家族,企业能够在本地、混合或主权环境中高效运行AI负载。Foundry Local on Azure Local目前已支持多节点部署和vLLM运行时。
安全开发方面,NVIDIA OpenShell已整合至GitHub Copilot。每个智能体都在其独立的沙箱容器中运行,每一次外部调用在访问文件、网络或凭证之前,都会根据预设策略进行评估。这些策略以代码形式编写,并在代码仓库中进行版本管理,支持即时更新。OpenShell基于Apache 2.0开源协议,不依赖特定模型,并全面覆盖本地、混合和云环境。
在AI基础设施建设方面,微软位于威斯康星州费尔沃特的AI工厂已提前投入运营,该工厂部署了数十万套NVIDIA Grace Blackwell系统,并与佐治亚州的一座同类AI工厂互联,共同构建了一个可扩展的分布式AI系统。黄仁勋先生亲自证实,微软是Blackwell芯片的最大部署者。
微软已完成对NVIDIA Vera Rubin平台的验证,该平台现已全面进入生产阶段,并将部署至Azure数据中心。Vera Rubin无需改造即可与Blackwell并行部署,能够将每兆瓦的推理吞吐量提升最高10倍,同时将每个智能体的token成本降低一个数量级,并内置NVIDIA机密计算功能,以确保模型和数据的安全性。
