生成式AI浪潮之下,大模型曾因其“飘”在云端、难以落地实际经济价值而受到质疑。然而,今年以来,以“龙虾OpenClaw”为代表的Agent智能体迅速崛起,其主动规划和执行任务的能力,为大模型注入了强大的“手和脚”。
顶级大模型厂商如Anthropic迅速调整战略,将大模型研究重点从AI编码等特定领域,扩展至Agent能力的开发与应用。Anthropic作为OpenAI的衍生公司,一开始便专注于B端市场,注重实用性和生产力。其精准把握Coding和Agent潮流,使其业绩和估值实现飞跃,5月底完成巨额融资后,估值高达9650亿美元,并传出计划先行一步提交IPO招股书。
在国内,大模型与Agent的融合也在深入。近期,国产AI大模型领军企业阶跃星辰发布并开源了Step 3.7 Flash模型,该模型专为真实Agent工作流设计,致力于提升Agent、多模态、搜索和编码任务的效率。阶跃星辰在今年初完成50亿人民币B+轮融资后,5月又传出即将完成新一轮25亿美金融资的消息,赴港上市步伐加快,有望成为继智谱、MiniMax之后第三家登陆港交所的国产大模型公司。
业内观察家指出,在IPO预期下,阶跃星辰近期可能会集中展示其在Agent方向上的“硬核”成果。据悉,Step 3.7 Flash模型特别适用于高频、多轮的Agent应用场景,并针对生产级Agent需求,优化了原生多模态理解与执行、联网与视觉搜索增强、高可靠工具调用与编排等功能,显著提升了任务完成效率。
Artificial Analysis最新Output Speed榜单显示,Step 3.7 Flash模型以409 tokens/s的输出速度位居主流模型之首,其端到端响应时长、智能效率、速度价格比等指标也表现出色。这意味着Agentic AI时代的大模型竞争,正从单纯比拼“智能”向真实场景中的任务完成效率转移。
业内人士认为,在新的行业叙事中,单一性能指标的重要性将让位于对整个Agent循环的优化。能够平衡速度、智能、成本和任务完成率的大模型,将更贴近应用,更容易实现经济价值。
Flash类模型在Agent落地中扮演的角色也在发生变化。此前,Flash版模型常被视为Pro版或Ultra版的轻量级替代品。然而,随着Agent应用导致Token消耗量和成本大幅增加,如何在低延迟、低成本、高吞吐的前提下完成更多真实任务,已成为关键。Flash模型作为效率的代表,正逐步成为支撑生产级Agent规模化落地的基础设施。
尽管如此,大模型在释放Agent生产力、激活Flash价值方面仍有进步空间。阶跃星辰也表示,将围绕Step 3.7 Flash推出生态共建计划和限时体验活动,与开发者共同探索Agent效率的评估和工程化路径。
Step 3.7 Flash发布后,迅速在OpenRouter全球热榜中占据前列,并在Artificial Analysis Output Speed榜单中表现突出。同时,在端到端响应时长、智能效率以及速度价格比等多个关键维度上均处于领先地位。
阶跃星辰在大力布局Agentic模型和AI+终端应用场景方面展现出显著的差异化。其被誉为“多模态卷王”,在发布的40余款大模型中,超过八成是多模态模型,涵盖了视觉理解、图像生成、语音推理等多个方向,是国内少数坚持“原生多模”路径的厂商。
多模态能力是终端Agent实现规模化应用落地的核心。在AI+终端布局上,阶跃星辰是国内与手机厂商合作最多的独立大模型厂商之一,并已覆盖汽车、IoT及具身智能等端侧场景。智能终端Agent正日益成为其商业化的重要组成部分。
随着Agent的兴起,新的AI硬件不断涌现,终端Agent被普遍视为未来趋势。有端侧芯片从业者预测,端侧市场已进入爆发“元年”,未来80%以上的大模型推理可能在终端完成。然而,终端AI产业链和端侧大模型的能力仍需完善,尤其在多模态、全模态等交互方面,对实时性产品的需求迫切。
这正成为众多大模型的发力方向。Step 3.7 Flash的测试Demo和用户反馈集中于终端界面,凸显了多模态的作用。例如,识别产品界面设计、理解飞机驾驶舱环境并生成操作说明、处理多张手机拍摄的发票照片并导出表格等。这些案例表明模型能理解以往更为复杂的场景和真实世界工作流,具备更强的端到端任务完成能力和跨场景泛化能力。
阶跃星辰强调,在Agentic时代,多模态能力是模型理解的扩展,是接入真实世界任务、参与决策和执行流程的关键接口,也将成为大模型的标配。多模态能力的跃升将加速Agent的落地和端侧AI的爆发。
当大模型日益专注于让Agent融入任务和生活的现场时,AI的故事必将开启全新的篇章。
