5月29日凌晨,人工智能公司Anthropic正式推出其最先进的大型模型Claude Opus 4.8。与此同时,该公司还宣布完成高达650亿美元的H轮融资,使其投后估值飙升至9650亿美元,距万亿美元大关仅一步之遥。
然而,模型发布不久,各平台用户纷纷报告,在通过API接口测试时,Opus 4.8在回答关于自身身份的问题时,竟出现了自称为阿里巴巴通义千问(Qwen)或DeepSeek模型的情况,这一发现迅速在业界引发广泛关注。
这一异常现象并非孤立存在,从Linux do等技术论坛到微博和X(原Twitter)等社交媒体,众多网友的验证结果均能重现此问题。
值得注意的是,部分用户在直接通过claude.ai网页端询问模型身份时,得到的回答是正常的,他们以此反驳了“蒸馏”的说法。但最初发现问题的网友则强调,这种异常仅出现在API测试环境中,网页端的对话因受到系统预设提示词的限制,因此未能暴露上述“身份混淆”的问题。
“蒸馏”是人工智能大模型训练中常用的一种技术,其原理是利用参数更多、能力更强的“教师模型”的输出结果,来指导并训练一个参数更少、成本更低的“学生模型”,旨在以较小的代价复制相似的模型能力。通义千问和DeepSeek均是中国主流的开源大模型,两者均遵循MIT或Apache 2.0等开放许可协议,允许在学术研究和商业应用场景中自由使用、修改和再分发。值得注意的是,Anthropic自2025年起已明确禁止中国大陆用户使用其商业版Claude服务,并且在其服务条款中严格禁止用户利用通过其模型生成的内容来开发竞争性产品。
在本次事件之前,Anthropic对于“蒸馏”问题一直保持着明确而强硬的立场。早在2026年2月23日,Anthropic便曾公开发布声明,指控中国的DeepSeek、月之暗面和MiniMax三家人工智能公司,利用约2.4万个虚假账户与Claude进行了超过1600万次交互,声称这些行为构成了一场“工业规模的蒸馏攻击”。
然而,Anthropic、OpenAI、xAI和谷歌等美国AI巨头之间也曾多次互相指责对方进行模型“蒸馏”。此外,Anthropic自身也曾因“蒸馏”盗版书籍内容而面临法律诉讼,并被法院判决赔偿高达15亿美元(按当前汇率约合101.88亿元人民币)。
在商业策略和资本运作方面,Anthropic此次推出的Claude Opus 4.8是基于前代Opus 4.7的一次小幅度性能迭代升级,其定价策略保持不变:标准模式下,每百万输入token收费5美元,每百万输出token收费25美元。
新版本在编程、智能体任务、逻辑推理和知识处理等多个核心领域均取得了显著提升,据称其代码缺陷检测的漏报率仅为前代的四分之一。此外,新模型还引入了“思考强度控制”功能,允许用户调节模型的推理强度。
在资本市场上,完成650亿美元(按当前汇率约合4414.71亿元人民币)的H轮融资后,Anthropic公司的估值一举攀升至9650亿美元(按当前汇率约合6.55万亿元人民币),成功超越了OpenAI最新的约8520亿美元估值。 Anthropic已与亚马逊、谷歌、博通等多家科技巨头签订了基础设施合作协议,并宣布Claude成为首个同时在亚马逊AWS、谷歌云和微软Azure三大主流云计算平台部署的前沿大模型。
