Agent定义大模型，Flash模型推动AI新范式

生成式AI浪潮之下，大模型曾因其“飘”在云端、难以落地实际经济价值而受到质疑。然而，今年以来，以“龙虾OpenClaw”为代表的Agent智能体迅速崛起，其主动规划和执行任务的能力，为大模型注入了强大的“手和脚”。

顶级大模型厂商如Anthropic迅速调整战略，将大模型研究重点从AI编码等特定领域，扩展至Agent能力的开发与应用。Anthropic作为OpenAI的衍生公司，一开始便专注于B端市场，注重实用性和生产力。其精准把握Coding和Agent潮流，使其业绩和估值实现飞跃，5月底完成巨额融资后，估值高达9650亿美元，并传出计划先行一步提交IPO招股书。

在国内，大模型与Agent的融合也在深入。近期，国产AI大模型领军企业阶跃星辰发布并开源了Step 3.7 Flash模型，该模型专为真实Agent工作流设计，致力于提升Agent、多模态、搜索和编码任务的效率。阶跃星辰在今年初完成50亿人民币B+轮融资后，5月又传出即将完成新一轮25亿美金融资的消息，赴港上市步伐加快，有望成为继智谱、MiniMax之后第三家登陆港交所的国产大模型公司。

业内观察家指出，在IPO预期下，阶跃星辰近期可能会集中展示其在Agent方向上的“硬核”成果。据悉，Step 3.7 Flash模型特别适用于高频、多轮的Agent应用场景，并针对生产级Agent需求，优化了原生多模态理解与执行、联网与视觉搜索增强、高可靠工具调用与编排等功能，显著提升了任务完成效率。

Artificial Analysis最新Output Speed榜单显示，Step 3.7 Flash模型以409 tokens/s的输出速度位居主流模型之首，其端到端响应时长、智能效率、速度价格比等指标也表现出色。这意味着Agentic AI时代的大模型竞争，正从单纯比拼“智能”向真实场景中的任务完成效率转移。

业内人士认为，在新的行业叙事中，单一性能指标的重要性将让位于对整个Agent循环的优化。能够平衡速度、智能、成本和任务完成率的大模型，将更贴近应用，更容易实现经济价值。

Flash类模型在Agent落地中扮演的角色也在发生变化。此前，Flash版模型常被视为Pro版或Ultra版的轻量级替代品。然而，随着Agent应用导致Token消耗量和成本大幅增加，如何在低延迟、低成本、高吞吐的前提下完成更多真实任务，已成为关键。Flash模型作为效率的代表，正逐步成为支撑生产级Agent规模化落地的基础设施。

尽管如此，大模型在释放Agent生产力、激活Flash价值方面仍有进步空间。阶跃星辰也表示，将围绕Step 3.7 Flash推出生态共建计划和限时体验活动，与开发者共同探索Agent效率的评估和工程化路径。

Step 3.7 Flash发布后，迅速在OpenRouter全球热榜中占据前列，并在Artificial Analysis Output Speed榜单中表现突出。同时，在端到端响应时长、智能效率以及速度价格比等多个关键维度上均处于领先地位。

阶跃星辰在大力布局Agentic模型和AI+终端应用场景方面展现出显著的差异化。其被誉为“多模态卷王”，在发布的40余款大模型中，超过八成是多模态模型，涵盖了视觉理解、图像生成、语音推理等多个方向，是国内少数坚持“原生多模”路径的厂商。

多模态能力是终端Agent实现规模化应用落地的核心。在AI+终端布局上，阶跃星辰是国内与手机厂商合作最多的独立大模型厂商之一，并已覆盖汽车、IoT及具身智能等端侧场景。智能终端Agent正日益成为其商业化的重要组成部分。

随着Agent的兴起，新的AI硬件不断涌现，终端Agent被普遍视为未来趋势。有端侧芯片从业者预测，端侧市场已进入爆发“元年”，未来80%以上的大模型推理可能在终端完成。然而，终端AI产业链和端侧大模型的能力仍需完善，尤其在多模态、全模态等交互方面，对实时性产品的需求迫切。

这正成为众多大模型的发力方向。Step 3.7 Flash的测试Demo和用户反馈集中于终端界面，凸显了多模态的作用。例如，识别产品界面设计、理解飞机驾驶舱环境并生成操作说明、处理多张手机拍摄的发票照片并导出表格等。这些案例表明模型能理解以往更为复杂的场景和真实世界工作流，具备更强的端到端任务完成能力和跨场景泛化能力。

阶跃星辰强调，在Agentic时代，多模态能力是模型理解的扩展，是接入真实世界任务、参与决策和执行流程的关键接口，也将成为大模型的标配。多模态能力的跃升将加速Agent的落地和端侧AI的爆发。

当大模型日益专注于让Agent融入任务和生活的现场时，AI的故事必将开启全新的篇章。