Anthropic近日公布了一项重大进展,公司已成功进行了H轮融资,筹集了650亿美元的资金,使其投后估值飙升至9650亿美元。这笔巨额资金将主要用于推动核心技术研发,并扩充其计算能力,以应对市场对其AI产品Claude不断增长的需求。
在完成融资的同时,Anthropic也意外地提前推出了其最新一代模型——Claude Opus 4.8,令业界颇感惊喜,此前市场普遍预计该版本将在六月份面世。
目前,Claude Code 2.1.154版本中,Opus的模型选择菜单已更新至4.8。应用程序用户和桌面端用户已可先行体验新模型,而API接口的更新则会稍晚推出。值得注意的是,前一代Opus 4.6模型已从列表中移除。
根据Anthropic官方介绍,Opus 4.8在判断力上更为敏锐,对待自身能力进步的态度更加真诚,并且能够更长时间地独立执行任务。令人欣喜的是,新模型的定价策略保持不变,常规模式下,输入每百万token收费5美元,输出每百万token收费25美元;快速模式下,输入每百万token收费10美元,输出每百万token收费50美元。
Opus 4.8的快速模式相比标准模式速度提升了约2.5倍,并且此次降价使快速模式的费用约为之前的三分之一。Anthropic坦言,Opus 4.8并非一次颠覆性的模型代际更新,其提升更多体现在用户实际使用过程中才能察觉的细节优化上。官方新闻稿指出,相较于Opus 4.7,4.8的提升并非“夸张”,而是“更多的细节升级”。
此外,Anthropic透露正在开发一种成本更低但能力接近Opus的模型,并计划推出比Opus更为强大的新型模型,代号为“Mythos”。这表明Opus 4.8更侧重于真实工作场景的应用打磨,旨在提升模型在复杂任务中的可靠性、协作能力和减少误判。
Anthropic特别强调了Opus 4.8的“诚实性”提升。这意味着模型在不确定时更倾向于表达其不确定性,在缺乏足够证据的情况下,不再强行给出看似确凿的结论。内部评估显示,Opus 4.8在生成有问题代码时,主动识别并指出问题的可能性显著增加,相比上一代,其“发现代码缺陷却不指出”的情况减少了约四分之三。
在安全方面,Anthropic的安全团队认为Opus 4.8在尊重用户判断和维护用户利益方面表现更佳,欺骗、迎合滥用请求等非对齐行为明显少于Opus 4.7,已接近Claude Mythos Preview的水平。这一系列改进旨在增强用户对Anthropic模型的信任,促进企业合作,并为公司未来可能的首次公开募股(IPO)铺平道路。
随Opus 4.8一同发布的还有多项功能更新,其中最重要的是动态工作流,Anthropic为此专门发布了详细介绍。该功能目前处于研究预览阶段,将逐步面向Enterprise、Team和Max计划开放。
动态工作流允许Claude Code处理更大规模的问题。它通过先规划工作,然后在一个会话中并行运行数百个子代理来实现,最终在向用户汇报前进行输出验证。与Opus 4.8协同工作时,这些代理能够持续运行更长时间,特别适用于代码迁移、全库排查和长期重构等需要持续推进的异步工作流。例如,Claude Code现在能够完成跨数十万行代码库的迁移任务,从启动到合并,并利用项目原有的测试套件检查结果。
此外,响应力度控制(effort control)功能也从Claude Code等开发者场景扩展到了claude.ai(网页版Claude)和Claude Cowork。用户现在可以直接在模型选择器旁边调整Claude对一次回答的“投入程度”。在低“effort”模式下,Claude响应更快,消耗更少资源;而在高“effort”模式下,它将投入更多token,更深入地思考问题,适用于复杂的任务。在Claude Code中,Opus 4.8默认使用高“effort”模式,旨在质量和速度之间取得平衡,其token消耗与Opus 4.7默认模式相近,但完成效果更佳。
另一个面向开发者的小更新是,Messages API现在支持在messages数组中插入system条目。这意味着用户可以在任务执行过程中更新Claude的系统指令,而无需中断prompt缓存,极大地方便了长流程任务的开发。
回顾此次更新的重中之重,无疑是Claude Code的动态工作流。其核心理念类似于“东市买骏马,西市买鞍鞯,南市买辔头,北市买长鞭”的《木兰辞》意境,即通过精细的调度而非单一智能体的强大。
以往,当用户要求Claude Code执行复杂任务时,它通常依赖一个主代理逐步读取、修改代码并运行测试。然而,大型工程任务往往涉及庞大的代码库,单个bug可能关联几十个文件,一次迁移可能波及数百个文件。单一代理的线性工作方式容易遗漏关键信息或偏离方向。动态工作流的核心在于调度:它不亲自执行具体任务,而是像项目经理一样,将用户任务拆解成一套工作流,随后自动启动几十到几百个并行的子代理。每个子代理负责一个特定的子任务,例如扫描特定模块、验证某个结论、寻找反例或运行测试。最终,Claude将这些子代理的结果汇总并交叉验证,提供统一的解决方案。其核心并非让单个代理变得更聪明,而是让Claude能够自动组织一群代理协同工作。
官方举例指出,通过动态工作流,Claude Code参与了Bun从Zig到Rust约75万行代码的迁移试验,在11天内从首次提交推进到合并,并确保了99.8%的现有测试套件通过。然而,随之而来的是成本的增加。官方特别提醒,动态工作流会显著消耗更多token,首次触发时会要求用户确认;企业管理员也可以选择直接禁用。
从发布时间来看,Opus 4.8的更新速度惊人。Opus 4.5于2025年11月24日发布,Opus 4.6于2026年2月5日发布,两者相隔73天;Opus 4.7于2026年4月16日发布,距离4.6相隔70天;而Opus 4.8则于2026年5月28日发布,距离4.7仅有42天。
业界普遍猜测,此次快速迭代的部分原因可能在于Opus 4.7未能完全达到用户的预期。Anthropic发布4.7时曾表示,该版本能处理更复杂的编程任务,并在汇报前进行结果验证。但许多用户反映,4.7有时只是简单搜索后便得出结论,并未进行真正的交叉验证。AMD人工智能负责人丝黛拉·劳伦佐曾指出,Claude Code在使用4.7执行大型工程任务时,容易出现偏差。
除了性能问题,官方也承认4.7的tokenizer会导致相同输入消耗约1.0至1.35倍的token,且高“effort”模式下会消耗更多token。这意味着用户花费更多成本却未能获得相应的性能提升,甚至可能有所下降。从官方描述和早期测试者的反馈来看,Opus 4.8至少瞄准了4.7的几个痛点,包括工具调用、长任务稳定性、代码缺陷自检、回复冗余以及在不确定时强行下结论的问题。然而,要判断其是否“完全解决”这些问题,尚需等待后续大型工程项目的实际反馈。
值得注意的是,Anthropic目前已从追赶者转变为领跑者。在Opus 4.8发布前夕,外媒报道称Anthropic的收入可能已比OpenAI高出至少35%。据称,Anthropic的年化收入接近450亿美元,而OpenAI约为330亿美元。尽管年化经常性收入不完全等同于最终利润,但这足以改变市场对两家公司的叙事。
两家公司均计划于2026年下半年进行首次公开募股。如果Anthropic能抢先通过审批,无疑会对OpenAI的上市进程产生影响。因此,Opus 4.8的发布也承载着向资本市场证明其持续创新能力,以支撑其超高估值和收入的含义,尤其是在4.7表现不尽如人意之后,新版本及时推出显得更为关键。
