英伟达重磅发布Alpamayo 2 Super模型赋能L4自动驾驶发展

英伟达于近期宣布推出Alpamayo 2 Super模型，作为其Alpamayo系列开源人工智能模型的最新成员。这款320亿参数的视觉-语言-动作（VLA）推理模型，旨在为L4级别自动驾驶出租车的安全开发提供强大支持。通过整合先进的仿真框架和物理人工智能数据集，英伟达致力于帮助企业显著提升自动驾驶技术的研发效率。

与Alpamayo 2 Super一同发布的，还有一系列全新的工具、模型及智能体技能。这些创新方案全面覆盖了自动驾驶的研发周期，包括真实场景数据采集、闭环训练以及车载系统部署等关键环节。其中 noteworthy 的新品包括NVIDIA AlpaGym、NVIDIA OmniDreams和NVIDIA Omniverse NuRec模型。

据官方介绍，Alpamayo 2 Super模型的推出，省却了企业从零开始构建自动驾驶核心基础设施的巨大投入，从而大幅缩短了自动驾驶车辆的研发周期。该模型不仅具备类似人类的感知、推理和行动能力，其固有的可解释性也为满足严苛的安全验证和合规监管要求提供了保障。

为了满足自动驾驶模型在实际道路部署前的严格训练需求，AlpaGym作为一个闭环强化学习平台应运而生。同时，NVIDIA OmniDreams作为一款能够生成高度仿真场景的世界模型，能够大规模模拟各种罕见且复杂的驾驶情境。

为进一步提高开发者的工作效率，英伟达为其所有自动驾驶开发工具集成了物理人工智能智能体能力。例如，借助NVIDIA Omniverse NuRec的神经重建功能，开发者可以基于真实车队行驶数据进行仿真，并批量生成合成训练数据。

英伟达创始人兼首席执行官黄仁勋强调：“Alpamayo模型的诞生，标志着汽车开始拥有自主推理能力，而不仅仅是简单的行驶工具。英伟达通过提供开源模型、仿真工具、真实场景数据和智能体能力的全方位支持，助力全球自动驾驶出租车生态系统实现L4级别自动驾驶。这将使车辆能够识别极端场景、解释决策逻辑、建立安全信任，并最终实现数百万辆汽车的规模化部署。”

Alpamayo 2 Super的发布，使得英伟达Alpamayo系列模型的参数规模从百亿级跃升至320亿。新模型的功能不再局限于轨迹生成，而是能够贯穿整个驾驶系统，完成推理、规划和执行的全过程。它支持多项任务，包括逻辑推理、自动化标注、场景理解、模型评估以及将大模型知识蒸馏到轻量化模型，为L4级别自动驾驶的研发和实际部署奠定了坚实基础。

Alpamayo 2 Super的核心创新体现在以下几个方面：

首先，参数规模实现三倍增长。新模型基于英伟达Cosmos架构，将参数从上一代的100亿提升至320亿，大幅增强了在长尾场景下的逻辑推理、三维空间感知和轨迹预测能力。

其次，实现了全车环视感知。感知范围从传统的前置摄像头扩展到360度全景环境，覆盖车辆前方、侧方和后方视野，为变道、并线、路口通行等操作提供了全面的环境信息，从而显著提升了行驶安全性。

再者，新增元动作输出能力。模型能够支持礼让、变道、停车等更高层级的驾驶动作预判。除了提供行驶轨迹和因果链溯源信息外，Alpamayo 2 Super还能输出高阶驾驶决策，为后续的规划模块提供有效依据。

此外，模型集成了推理式自动标注与二维目标定位功能。这款320亿参数的基础大模型能够生成高质量的推理标注数据，将标注周期从数月缩短至数日，极大地优化了自动驾驶数据链路的成本和效率。

最后，模型的因果链优化与轨迹输出能力得到显著提升。针对传统模仿学习自动驾驶系统难以处理的罕见、复杂及长尾场景，Alpamayo 2 Super的因果链溯源能力和轨迹生成质量均有了质的飞跃。

这些升级使Alpamayo 2 Super成为英伟达迄今为止功能最强大的开源驾驶基础大模型。该模型被定位为“教师模型”，其知识可以通过蒸馏技术压缩为轻量化模型，并最终部署在NVIDIA DRIVE Hyperion平台旗下的车载自动驾驶主控芯片DRIVE AGX Thor上运行。

从早期的NVIDIA Alpamayo 1 Nano和Alpamayo 1.5 Nano等百亿参数模型，到如今320亿参数的Alpamayo 2 Super，整个教师模型系列已完成迭代升级。基于这一系列模型构建的自动驾驶系统，能够直接继承高水准的推理和感知能力，使得各汽车制造商无需重复从头开发。

近期，Alpamayo系列在台北国际电脑展（COMPUTEX）上荣获最佳选择奖，成功摘得车载技术与智能座舱类别奖项。自发布以来，该系列模型的下载量已接近40万次。其开源平台还提供了后训练脚本，方便科研人员和开发者结合自有数据集、行驶场景及驾驶策略对模型进行二次适配。

Alpamayo 2 Super的推理代码预计于今年夏季在GitHub平台上线，同时其模型权重也将同步发布在Hugging Face平台。

英伟达同步推出的NVIDIA AlpaGym，是一款开源、高算力吞吐的闭环强化学习框架。相较于开环训练仅依赖历史录制数据评估模型并输出单次动作，AlpaGym能在英伟达AlpaSim环境中，让模型持续循环完成“决策-感知”流程。每一次制动、转向、导航操作都会实时改变仿真环境，从而揭示静态数据集中难以发现的累积误差和极端场景故障，促使模型在实战模拟中持续学习。

AlpaGym基于AlpaSim微服务架构和英伟达Omniverse NuRec构建，能够高效、规模化地开展闭环强化学习，持续突破自动驾驶的性能上限。结合物理人工智能自动驾驶数据集，Alpamayo系列模型可以实现从开环预训练到闭环精细化调优的完整训练链路。

此外，英伟达还在GitHub上开源了因果链自动标注流程。该工具能够基于原始行车视频，全自动生成具备决策依据和因果关联的标注数据，无需人工参与，为大规模训练具身推理模型提供了核心的因果训练数据。

为助力推理型自动驾驶技术研发，英伟达依托NVIDIA Agent Toolkit推出了多款全新的物理人工智能智能体能力，辅助开发者和智能编码程序完成仿真、数据生成、闭环训练等全流程工作，以支持自动驾驶系统的大规模研发和验证。其中包括：基于英伟达Omniverse NuRec组件的神经重建能力、用于生成逼真驾驶场景的OmniDreams能力，以及面向闭环强化学习的AlpaGym能力。

英伟达表示，包括比亚迪、吉利、极氪、小米以及小马智行在内，众多中国主流汽车厂商和自动驾驶公司均已采用或正在基于NVIDIA Hyperion平台进行智能驾驶开发。