人工智能(AI)领域的较量并非始自ChatGPT。早在2017年,Google的研究团队发表了论文《Attention Is All You Need》,其中提出的Transformer架构为后来大模型时代的崛起奠定了核心基础。当时,这项技术仍停留在实验室层面,尚未触及大众的日常生活,没有人预料到它将引发一场科技革命。
尽管Google拥有技术论文、顶尖人才、计算资源、搜索霸权以及广泛的平台优势,但OpenAI的资源远不及它,甚至连自有的云服务都没有。然而,历史有时更青睐那些没有沉重旧资产包袱的颠覆者。Google需要守护其既有的搜索帝国,而OpenAI则只需证明自身存在的价值。这便是两者之间最初的裂痕。
在ChatGPT问世之前,AI主要作为后台技术发挥作用,默默地影响着推荐系统、广告算法、搜索排名、图像识别、语音交互和风险控制等领域。人们每天都在被AI塑造,却鲜少意识到其存在。技术在幕后运作,社会在前台维持着表面的平静。直到一个对话框的出现,彻底改变了这一切。
2022年11月30日,OpenAI向公众发布了ChatGPT。这一事件的意义并非在于其技术的完美或智能的卓越,而在于它首次让普遍用户真切感受到智能可以被直接调用。用户无需理解复杂的模型理论,只需输入一段话,就能得到一段反馈。它既像搜索引擎,却超越了简单的链接呈现;它既像智能助手,却摆脱了基础功能的限制;它拥有像人的特质,却又恰好不是人类。
正是这种奇特又危险的亲近感,促成了OpenAI的首次胜利:入口的胜利。它将AI从深奥的基础设施转化为触手可及的界面,从学术研究课题变为普罗大众的日常体验,从高额资本支出升格为社会热议焦点。硅谷看到了新兴平台,华尔街看到了增长曲线,学生看到了作业捷径,白领看到了加班解脱,创业者看到了融资新叙事,媒体看到了流量密码。每个人都从中找到了自己所需之物,使之迅速成为科技神话。
然而,所有神话都带有其昂贵的一面,OpenAI所面对的账单尤为庞大。它从创立伊始就将自己置于一个几乎矛盾的位置:既要宣称其非传统商业公司,又要像最激进的企业那样融资、招聘、采购算力、争夺用户、销售订阅并发展企业客户。它在宣称通用人工智能(AGI)应造福全人类的同时,又必须向微软、开发者、企业和资本市场解释为何值得持续投入巨资。它需要道德高地,也需要商业速度;它需要圣徒的面孔,也需要雇佣兵的纪律。
这并非虚伪,而是结构使然。2015年,Sam Altman、Greg Brockman、Ilya Sutskever、Elon Musk等一批研究人员、创业者和投资者共同创立OpenAI时,其理念更像一份硅谷式的反硅谷宣言:开放、安全、非营利,旨在防止通用人工智能被少数巨头垄断。这种姿态既充满力量,也显露天真。因为AGI并非一篇论文或一个公益项目,它是一座需要GPU、电力、数据中心、工程师和资本耐心共同滋养的庞大机器。理想主义先行,而现实的账单随之而来。
2019年,OpenAI引入了“限制利润”(capped-profit)结构,这本身就是一种妥协:既追求利润,又对其进行限制;既吸引资本,又保留使命;既向世界宣告其非寻常企业,又承认若继续以传统非营利组织模式运作,将无法获取足够的算力或留住顶尖人才。同年,微软伸出援手。微软首席执行官萨提亚·纳德拉无需像阿尔特曼那样将AGI描述为人类命运的宏大辩论,他只看到了一个更朴素的事实:下一代软件可能需要一个新的引擎。
于是,革命军有了军火商。没有Azure云服务,OpenAI难以发展到今天的规模;没有OpenAI,微软也难以在云服务、办公软件和搜索等传统领域重拾攻势。两家公司相互依存,却又各不相同。OpenAI需要微软的资金、算力和企业入口;微软则需要OpenAI的速度、故事和那种创新带来的危险感。一方提供使命,一方提供机器。现代技术革命往往如此:先有宣言,再有账单,最终是数据中心的建立。
马斯克从中退出,纳德拉则加入其中。恐惧退让,部署展开。这便是OpenAI的早期宿命。它并非在背叛理想之后才走向商业化,而是因为理想过于昂贵,不得不选择商业化之路。它宣称要让AGI造福全人类,但全人类并非GPU账单的支付者,微软才是。这个细节虽小,却极具决定性。许多宏大的历史,最终都系于这样一张发票。随之,这场战争演变成了大众事件。
2023年初,微软将OpenAI的能力整合进Bing搜索引擎,将Google最肥沃的搜索领地变为前沿战场。二十年来,Google几乎定义了互联网的公共秩序:人们提问,Google排序;网站创造内容,Google分配流量;广告商付费,用户免费获取答案入口。这个秩序虽非完美,却足够稳定,以至于人们几乎忘记了它本身是一种秩序。直到ChatGPT的出现,旧问题重新浮现:如果答案可以直接生成,链接的价值几何?
Google被迫应战。这场反击起初并不顺利。Bard匆忙上线,演示中出现错误,市场予以惩罚,舆论嘲讽不断,这个老牌帝国在自己最熟悉的领地突然显得笨拙。它并非缺乏技术,而是拥有太多的历史包袱。搜索广告、品牌信誉、监管压力、内部流程、产品矩阵、研究文化和商业惯性共同拖慢了它的脚步。创业公司可以把未来视为唯一的资产,但帝国不能。帝国每向前一步,都必须计算旧世界会因此坍塌多少。
这既是Google的困境,也是其合理性所在。一个没有搜索广告包袱的Google,无疑会跑得更快;但那样的Google也就不再是Google。它的迟疑并非简单的官僚麻木,而是既得利益者进行自我革命时必然产生的犹豫。OpenAI可以高呼新世界万岁,因为它没有旧大陆需要守护。Google则不能,它脚下便是旧大陆。因此,大模型战争的第一阶段呈现出清晰的戏剧性结构:OpenAI如同革命军,微软扮演军火商兼后勤官,Google则像被炮火惊醒的帝国。革命军赢得了民众,军火商赢得了战略地位,帝国失去了从容。
然而,历史不会让革命者独享纯粹。2023年11月,OpenAI的“宫廷政变”将其内部深层矛盾暴露于众。董事会突然罢免Sam Altman,Mira Murati短暂接任,Greg Brockman随即离职,Ilya Sutskever被推向风暴中心。几天之内,员工威胁集体出走,微软敞开接纳大门,外部投资者施压,Altman最终回归,Bret Taylor和Larry Summers进入新的治理架构。那一周,硅谷前所未有地清楚看到:一个声称守护全人类的组织,其真正的权力掌控在谁手中。
答案并不美好。董事会可以罢免首席执行官,但无法消除对算力的依赖;非营利结构可以保留使命宣言,但无法为员工提供股权激励的想象;安全派可以提出警告,但很难对抗已形成的产品惯性、资本承诺和用户期望。OpenAI的危机并非简单的权力斗争,它更像一次制度性的血液测试。这血液中既有使命感,也有恐惧,既有公司治理问题,也有微软的影子,既有员工财富,也有人类未来,还有非常普通的职业安全感。最终存活下来的是公司。
这并非肯定董事会一定正确,也非否定Altman一定错误。更重要的是,这场危机让一个古典问题重新回到科技界的核心:谁有权决定一项可能改变社会结构的技术如何发展?是研究人员?是董事会?是CEO?是投资者?是云平台?是员工?是用户?还是那个被反复提及,但从未真正参与决策的“全人类”?没人能给出令人满意的答案。于是,公司继续前行。
这便是第二幕的序章:Anthropic的崛起。Anthropic并非OpenAI的寻常竞争者,它更像是OpenAI的镜像,从同样的理想主义与加速主义的冲突中分裂出来的另一种答案。Dario Amodei和Daniela Amodei并非外部杀入大模型战争的陌生人,他们汲取自同一基因库,熟悉同样的扩展定律,也深知一个组织如何在使命与商业之间迅速变质。Anthropic的成立,并非简单地另起炉灶,它更像一场宗教改革:并非否认原有的神祇,而是认为原有的教会已过于靠近权力。
因此,Claude从一开始就散发着某种克制的气息。OpenAI将模型打造成无所不能的公共入口,而Anthropic则致力于让Claude成为一个懂得边界的专业助手。“有助益、诚实、无害”(helpful, honest, harmless)这三个词被反复引用,甚至有些口号化,但它们的商业含义却极其明确:我们并非最善于制造轰动的公司,我们是你可以放心融入组织流程的公司。它的目标受众并非广场上的大众,而是办公室里的经理、法务、工程师和采购委员会。这是一种更静默的攻势。
Claude的优势不仅在于回答能力,更在于其“可托付性”。长上下文处理、代码能力、文档分析、企业安全、可控风格——这些特性听起来或许不如ChatGPT初现时那般震撼,却更接近资金真正流动的领域。当大模型战争进入企业级市场,问题不再是一个学生能否用它写论文,而是一家咨询公司能否用它总结客户材料,一家律师事务所能否用它处理案卷,一家软件公司能否让它接触代码库,一家金融机构能否相信它在关键时刻不会胡说八道。能力不再是决定采用的唯一因素,信任开始定价。
Anthropic深谙此道。因此,它的道德语言也具有双重作用。一方面,安全确实是大模型时代无法回避的问题;另一方面,安全也是企业采购时最容易在内部找到合理化理由的因素。当Dario Amodei谈论风险时,他不仅在哲学层面忧虑,也在为一种商业定位辩护。Claude无需成为最热门的消费入口,它只需成为最能被组织信任的智能同事。这便是Anthropic的悖论:它越成功,越难以仅作为一位警告者存在。
因为当安全成为竞争优势时,它就不再仅仅是刹车,也成了油门。Anthropic可以声称自己比OpenAI更谨慎,但它同样需要融资、采购算力、追赶模型能力,同样需要进入企业核心流程,同样需要证明自己值得更高的估值。它从革命军中分裂出来,批判其速度,最终却也必须奔跑。现代技术产业最擅长的事情,就是将反思转化为产品,将限制转化为卖点,将道德焦虑转化为商业护城河。叛教者也需要支付军费。
如果说OpenAI是革命军,Anthropic是宗教改革者,那么Google就是旧帝国。旧帝国并非愚蠢。相反,它太过聪明、富裕,对自己的地图了如指掌,也深知一次真正的自我革新意味着什么。桑达尔·皮查伊当然知道生成式AI的重要性,戴米斯·哈萨比斯当然清楚模型能力的上限,谢尔盖·布林当然明白Google不能将未来拱手让人。问题从来不是知不知道,而是当新答案威胁到旧业务时,知晓本身并不能构成行动。
Google的第一次公开反击是Bard。那是一场缺乏从容的亮相。2023年2月,Bard在演示中给出错误信息,Alphabet市值在一天内蒸发约1000亿美元。这个数字后来被反复引用,仿佛它只是一个资本市场的笑话。实际上,它更像一次政治上的羞辱。一个以整理世界信息为使命的公司,在回答事实问题时失手;一个统治搜索领域二十年的公司,在“答案时代”被质疑不会回答。市场惩罚的并非一个错误,而是帝国失态。
Google终于意识到,旧的组织架构需要新的核心。2023年,Google Brain和DeepMind合并,Demis Hassabis被推到更核心的位置。这一举动的象征意义大于组织架构本身。Hassabis不只是一位AI高管,他代表了Google内部更悠久的科学传统:AlphaGo、强化学习、神经科学以及对通用智能的设想。皮查伊需要他,不仅是为了技术路线,也是为了向内部和外部表明:Google的AI并非仓促补课,它拥有血统、论文、胜利和帝国自身的先辈。
但先辈不能替后代打仗。Gemini的推出,正是Google尝试将科学血统重新包装成产品秩序的体现。Bard改名为Gemini,不仅是品牌清理,它更意味着Google不再将AI视为搜索旁边的聊天功能,而是要将其转化为横跨模型、助手、云服务、移动端、办公套件和开发平台的统一标识。OpenAI希望用户打开ChatGPT;Anthropic希望企业雇用Claude;而Google则希望Gemini像空气一样无处不在。空气无需被打开,它只需存在。
这正是Google的可怕之处。它未必最擅长制造单点震撼,但却有能力让AI出现在Android、搜索、Gmail、Docs、Chrome、YouTube、Pixel、Workspace和Cloud等所有产品中。它的战略并非让你每天记住Gemini,而是让你最终忘记自己正在使用Gemini。最深层次的统治并非入口,而是默认设置。默认搜索、默认邮箱、默认地图、默认浏览器、默认系统助手。Google过去二十年的成功,本身就是默认的胜利。
然而,默认也可能带来新的丑闻。2024年,Gemini的人物图像生成功能因历史准确性和身份呈现问题被迫暂停。这一事件比表面看起来更有深意。OpenAI的风险常源于速度过快,Anthropic的风险常源于安全语言与商业扩张的冲突,而Google的风险则源于一种帝国式的制度焦虑:它深知偏见的危险,深知全球用户的复杂性,深知监管机构会追问,深知舆论会审判。于是,系统试图将“正确”预先写入输出,结果却使得正确本身变得荒谬。帝国害怕犯错,于是犯了另一种错误。
这便是Gemini的宿命。它并非缺乏能力,而是其每一次能力释放都承载着过多的制度压力:广告商业模式、搜索生态、版权关系、全球政治、组织审查、品牌安全、监管风险。OpenAI的错误可以解释为创业公司的冒进,Anthropic的迟疑可以解释为安全公司的谨慎,而Google的错误却总是被解读为帝国的失能。人们对旧统治者没有耐心,旧统治者也没有犯小错误的权利。
然而,历史并未停留在2024年。到了2025年,特别是Gemini 3发布之后,Google的故事开始被重写。它不再仅仅是补课,不再仅仅是给Bard改名,也不再仅仅是将Gemini塞进搜索框。它开始拆解自己的旧帝国,并重新连接线路。真正的质变发生在Gemini 3。
如果说Gemini 1.0是Google承认必须应战,Gemini 2.5是Google将推理和多模态能力推向台前,那么Gemini 3则更像一次迟来的帝国总动员。它不再仅仅是一个更强大的模型,而是一个系统重组的信号:推理模型、图像生成、视频创作、搜索入口、Workspace、NotebookLM、AI Studio、Android、Chrome和Cloud,被重新纳入到统一的Gemini叙事之中。Google终于不再仅仅追赶ChatGPT,它开始利用自己最古老的优势——分发。
这正是Gemini 3的意义所在。它的质变不仅在于能力,更在于定位。OpenAI发布一个强大模型,首先改变的是ChatGPT;Anthropic发布一个强大模型,首先改变的是Claude和企业工作流;而Google发布Gemini 3,改变的却可能是搜索结果页、邮箱、文档、手机系统、开发者控制台、图片工具和视频工作台。它并非将用户带到一个新的入口,而是将旧入口逐一改造为AI入口。帝国最有效的反击,从来不是夺回广场,而是重新铺设道路。
Nano Banana Pro正是这一质变中一个虽小但引人注目的例子。这个名字听起来有些玩笑意味,却揭示了Google反击的真实方向。它并非将图像生成视为一个独立的玩具,而是将其构建在Gemini 3 Pro之上,让图像编辑、文字排版、多语言视觉生成、广告素材、设计原型和信息图制作,融入同一条多模态生产线。过去,多模态常在发布会上作为炫技之用:模型能够看懂一张图,描述一段视频,回答几个视觉问题。Gemini 3之后,多模态开始演变为工作台:修改图片、制作视频、整理资料、编写代码、生成界面、搭建应用。
能力不再停留在“模型会什么”的层面,而开始转化为“工作台在哪里”的问题。这正是Google与OpenAI、Anthropic的真正区别。OpenAI更擅长制造中心化入口,让用户将问题带到ChatGPT面前;Anthropic更擅长制造可信赖的专业协作,让Claude进入代码、文档和企业流程;而Google则试图让Gemini散布到所有现有工作台上。你在搜索时,它在那里;你在写邮件时,它在那里;你在剪视频、做图片、写代码、整理资料、构建应用时,它也无处不在。它不一定要求用户改变习惯,它只是逐渐改写旧习惯。
因此,Gemini 3是Google将“模型能力”转化为“系统默认”的关键转折点。帝国终于学会了用新的语言说话。至此,AI三大巨头的战局形成了真正的三角态势。
OpenAI争夺的是人们的第一反应。当问题出现时,你不再搜索,而是提问ChatGPT;当需要撰写文本时,你不再打开空白文档,而是先让模型起草;当需要理解陌生领域时,你不再从十个网页中拼凑答案,而是让它先为你绘制一幅地图。这并非工具之争,而是认知入口的迁移。
Anthropic争夺的是组织的信任。它无需让每个普通人每天都打开Claude,只需让足够多的公司相信Claude可以融入代码、文档、客服、咨询、法律和金融流程。它争夺的并非注意力,而是责任链。一个模型一旦进入责任链,它就不再仅仅是助手,而是开始参与组织的决策判断。
Google的Gemini争夺的则是系统的默认。Gemini 3之后,这一点变得更加清晰:它可以在搜索中给出答案,在Gmail中总结邮件,在Docs中编写文档,在NotebookLM中组织知识,在AI Studio中帮助开发者构建应用,在Nano Banana Pro中生成和修改图片,在Flow与Veo中融入视频创作,并在Android和Chrome中成为入口本身。它无需每一次都被明确命名,系统级的权力往往无声无息。
这三家公司看似都在追逐更强大的模型,实则都在争夺三种不同的合法性:OpenAI以技术突破证明其领先地位的合理性,Anthropic以安全可靠证明其受托重任的合理性,Google则以规模化证明其不可替代的合理性。突破、托付、默认,构成了大模型时代的新三权分立。
然而,这三种合法性都并非毫无代价。OpenAI的突破,常常需要以治理脆弱性来付出代价;Anthropic的托付,常常需要以安全叙事的商业化来付出代价;Google的默认,常常需要以开放网络和用户选择权的萎缩来付出代价。每家公司都能阐述自身的合理性,但也各自承担着不同层面的代价。
