阶跃星辰于5月29日隆重推出了其创新成果——Step 3.7 Flash模型。这款模型主要面向Agent的实际应用生产阶段,对Agent功能、代码生成、信息检索以及多模态工作流程进行了深度优化。
新发布的Step 3.7 Flash模型采用了先进的稀疏MoE架构,其总参数量达到196B,并辅以1.8B的视觉Transformer(ViT)参数,激活参数共计11B。卓越的架构使其最大生成速度可达到每秒400 Tokens,极大地满足了对响应时间有高要求、互动频繁且需多轮次交互的Agent应用场景需求。
据介绍,Step 3.7 Flash模型具备以下多项核心能力:
首先是原生的多模态理解与执行能力,能够直接理解用户界面、各类图表、文档、图像以及各类应用程序界面。它能将复杂的视觉信息转化为结构化的结果,并支持代码的自动生成和任务的直接执行。
其次,该模型显著增强了联网与视觉搜索功能,使其能够在开放的信息环境中,主动地获取并交叉比对来自文本和图像的多元证据。
此外,Step 3.7 Flash提供了高度可靠的工具调用与编排能力。在需要长时间、多轮次执行的Agent工作流程中,模型能够稳定地调用API接口、浏览器功能、终端命令、Office工具及其他外部系统,确保任务执行的连贯性,有效避免任务偏离或执行失败的情况。
最后,模型在Agent生态系统兼容性方面也进行了优化,它针对主流的Agent框架如Claude Code、KiloCode、RooCode、OpenCode、Hermes Agent、OpenClaw等,以及MCP、Skills等工具调用协议和开发流程进行了深度兼容性调整,从而大幅降低了模型接入和工作流编排的难度和成本。
