英伟达推出5500亿参数开源模型Nemotron 3 Ultra，智能体推理速度大幅提升

英伟达近日发布了多项开源模型与数据集，旨在全面提升自主智能体的智能化水平，这些成果由英伟达Nemotron联盟共同研发。

Nemotron 3 Ultra是一款由5500亿个参数构成的混合专家模型，专为需要长时间运行的智能体提供顶尖的智能支持，涵盖代码编程、科学研究及企业级业务流程。据官方信息，该模型在推理速度上能实现最高五倍的提升，相较于同等级别的领先开源模型，其运营成本最多可降低三成，从而帮助智能体以更高的效率和更低的成本完成各项任务。

该模型已经过优化，能够无缝集成到主流的智能体平台和调度框架中，例如Hermes Agent、LangChain Deep Agents、OpenClaw、OpenHands和OpenCode，企业可以利用这些框架来部署和管理智能体。

为了进一步丰富Nemotron系列的能力，英伟达还推出了针对安全防护和语音识别功能的新模型，助力构建高性能、专业化的企业级智能体解决方案。

目前，新一代的长效人工智能智能体已借助英伟达Nemotron模型，成功应用于多家企业平台，包括CrowdStrike和Palantir。这些智能体在协助团队分析复杂数据、协调工作任务以及优化网络安全和企业整体运营效率方面发挥了关键作用。

以CrowdStrike为例，他们在其定制智能体中集成了Nemotron模型，以实现对漏洞的持续检测、风险分级和配置错误修复，这不仅加快了网络攻击的响应速度，也有效减轻了安全团队的日常运维负担。

Palantir则将Nemotron模型整合进其前线部署工程师（AI FDE）人工智能平台，使其能够自主执行复杂的任务。通过智能体交互数据的持续迭代与优化，Palantir成功构建了适应特定业务领域且物理隔离的企业系统。

Nemotron 3 Ultra预计将于6月4日通过Hugging Face、ModelScope、OpenRouter以及build.nvidia.com以NVIDIA NIM™微服务的形式上线。此外，它也将通过广泛的NVIDIA云合作伙伴网络、推理平台和云服务提供商对外提供。