(本文作者为 字母AI,钛媒体经授权发布)
文 | 字母AI
在《纽约时报》旗下播客的采访中,谷歌CEO桑达尔·皮查伊承认,谷歌在Coding上确实落后了。
谷歌做AI完全算得上强势,它有Gemini,有非常庞大的谷歌生态,还有自研TPU。在最近的I/O大会上,谷歌几乎把AI塞进了所有核心入口。
它不是没做AI Coding,Antigravity已经被推到台前,Gemini CLI和Gemini Code Assist也一直在服务开发者。但做了,不等于做成了;生态全面,不代表自动拿下市场。
提到AI Coding,最先被想起的往往还是Claude Code、Codex和Cursor。
Coding已经成为AI Agent最早跑通的战场,几乎所有前沿AI公司都在往这个方向进军。就连并不靠编程出圈的DeepSeek,也开始围绕Agent Harness招人。
可以说,AI Coding未必是每家AI公司的起点,却正在成为前沿AI公司的共同落点。
在国内,字节的尴尬和谷歌很相似。它们都拥有完整的AI生态,但到了AI Coding领域,Trae和Antigravity一样,只是众多可替换的开发工具中的一个名字。
如果它们想在Agent时代继续做巨头全家桶,这块短板还是要抓紧补全。
没拿下程序员
谷歌在AI Coding上的问题,不是缺产品,是缺用户。
Codex有超过400万周活跃用户,Claude Code则取得了开发者心智的胜利。The Pragmatic Engineer今年2月面向软件工程师的AI工具调查显示,Claude Code是最受喜爱的工具,占比46%。Business Insider 5月23日报道,在创业公司内部,Claude Code已成为复杂工程任务里的首选工具。
相比之下,Antigravity没有什么值得拿来说道的地方,仅仅是一个背靠谷歌生态大厦的AI Coding产品。
就体感方面,Antigravity也没能获得开发者的信任。
5个月前,有人专门整理了100多条Antigravity相关帖子,把Reddit社群里最常见的痛点归成几类:额度混乱、性能吃资源、安全担忧、模型选择问题,以及Agent删除或改坏代码。
这些痛点本应在更新后得到解决,Antigravity 2.0的发布按理是谷歌追赶AI Coding的一个重要节点。但更新之后,社群反响也并不算好。
目前最大的争议是,Antigravity 2.0把原本偏IDE的体验,突然改成了一个更偏Agent Manager的界面。用户找不到熟悉的编辑器、文件树、终端、版本控制和扩展环境,不得不被迫适应新的界面。
或许谷歌觉得这样做是在往更智能的方向进步,但事实是,谷歌在没有充分建立信任之前,就试图让开发者从“可控的IDE协作”跳到“黑盒式Agent调度”,约等于完全放弃了之前的那套模式,连带着放弃了原先的那群用户。
额度混乱的问题依然存在,并且变本加厉。
从5月20号开始,Gemini的限额机制从按条数,转向更接近算力消耗的口径。 Antigravity官方说Pro用户有5小时刷新机制,但同时又有周限制;用户不知道一次Agent任务会消耗多少,也不知道自己什么时候会撞上周上限。一旦中途限额,就可能直接打断开发流程。
更要命的是,谷歌最新发布的Gemini 3.5 Flash虽然速度很快,但在编程上表现不够稳定。
有用户吐槽,自己只是让Gemini 3.5 Flash给一个重构计划,它却直接开始改代码,之后还声称重构成功,但核心目标基本没完成,最后甚至在没有许可的情况下恢复了一个无关文件。
还有用户抱怨,3.5 Flash在明确给出目标文件、行号和修改要求后,仍然会反复探索同一批文件,而不是直接完成代码改动。而token在这个过程中不要钱似地烧。
一边是产品形态突然从IDE协作转向Agent Manager,用户觉得原来的工作台被拆掉了;一边是额度规则不透明,长任务可能跑到一半被中断;再加上Gemini 3.5 Flash在真实代码库里的执行稳定性仍然被质疑,Antigravity并没做到向开发者证明,自己值得相信。
谷歌已经开始补课
但谷歌也不是没有意识到问题。
在最新的采访里,谷歌CEO皮查伊其实把谷歌的短板说得很清楚:如果看文本、多模态、语音、音频、推理和整体智能,谷歌仍然很有竞争力;但到了AI Coding、工具使用、指令遵循和长周期任务,谷歌确实有点落后。
皮查伊专门提到, 谷歌过去在Coding上可能缺少类似Claude Code或Cursor那样的数据流和产品。
这也是谷歌现在追赶动作的逻辑。
过去很长一段时间,谷歌面向开发者的AI工具比较分散:Gemini Code Assist、Gemini CLI、Antigravity、Firebase相关工具,各自都在,但很难形成一个清晰的主入口。I/O大会之后,谷歌开始把这条线往Antigravity上收,Gemini CLI和Gemini Code Assist面向个人用户的相关能力,将逐步转向Antigravity CLI和Antigravity 2.0。
谷歌需要一个统一入口,把Gemini真正放进复杂软件工程流程里,拿到足够多的真实任务、失败案例、工具调用和长任务数据。
但同样是进入真实工作流,Claude Code的做法是让Agent贴着开发者原来的终端和代码库工作,Cursor的做法是把AI塞进IDE,让人随时能看、能改、能接管。Antigravity 2.0的产品形态却难免有些过于激进,直接把开发者往上推了一层,推到一个Agent Manager里去看任务进度、等结果交付。
这不是不能做,甚至可能是未来方向之一。可前提是,用户已经足够信任这个Agent,而Antigravity还没有建立起这种信任,就先把熟悉的IDE协作体验削弱了。
只能说不破不立,可能还需要一段时间来过渡。
除了把产品入口往Antigravity上收,谷歌也在补它背后的Agent底座。官方已经开放Antigravity SDK预览版,开发者可以基于这套框架搭自己的Agent。
这背后多少能看到Claude Code的“他山之石”。
Claude Code做得好的地方不只是Claude模型本身,还有Anthropic把模型放进了一套成熟的Agent Harness里。很多开发者喜欢Claude Code,在于它足够贴近真实开发现场,终端、代码库、Git、测试、报错都在眼前。谷歌显然也在吸收这套经验。
组织层面,据The Information报道,Google DeepMind已经组建了一支针对AI Coding模型能力的专责行动小组,由研究员和工程师集中改善Gemini的代码能力。这支团队由Google DeepMind研究工程师Sebastian Borgeaud牵头,DeepMind CTO Koray Kavukcuoglu 和Google联合创始人Sergey Brin据称也参与其中。
这些动作证明谷歌已经开始补课,但还不能证明它可以追上。
谷歌历史上并不缺“集中力量补短板”的时刻。社交网络时代,它曾经用Google+追赶Facebook;移动通讯时代,它也试过用Allo追赶WhatsApp、iMessage和Messenger。它们背后同样有谷歌账号体系、搜索流量、Android入口和强大的工程资源,但最后都没有真正改变市场格局。
不是说Antigravity会重演这些失败,AI Coding和社交、通讯不是同一个市场,谷歌手里也确实有Gemini、云、开发者工具和企业客户这些更贴近软件工程的资产。但它提醒了一件事:巨头资源只能把产品推到用户面前,不能替产品赢得用户习惯。
现在的Antigravity,已经被谷歌推到了更重要的位置。但它还需要证明自己不是一个被强行整合出来的入口,是一个真正能接住开发者日常工作的工具。
皮查伊对此倒是很有信心。他在采访里说,自己“非常、非常乐观”,也相信谷歌会“突破这一关”。
全家桶救不了不稳定的Agent
字节的境遇和谷歌很像。
字节手里同样是一套相当完整的AI全家桶:豆包、即梦、剪映、CapCut、飞书、火山引擎、扣子,再加上Trae,从普通用户到内容生产,从企业协作到云服务,从Agent平台到AI编程工具,字节几乎每一层都已经落子。
但到了AI Coding上,Trae和Antigravity一样,都没能成为开发者绕不开的名字。
字节当然也在追。
Trae早已不只是一个AI IDE,它有Trae SOLO,试图切入用户的真实工作流;也有开源的Trae Agent,用来补开发者心智和技术信任。从招聘和产品动作看,Trae已经被字节做成一条完整的产品线,覆盖Agent基础架构、AI Coding环境、模型算法、开发者运营和企业客户等方向。
谷歌有Gemini、Antigravity、Google Cloud、Firebase、Android、Workspace;字节有豆包、Trae、飞书、火山引擎、扣子和内容生态。它们都不是单点工具公司,而是平台型公司。
谷歌财报里,Google Services仍然是绝对大头,搜索、YouTube、订阅和平台业务支撑了主要收入;Google Cloud则是增长最快的关键业务之一。
字节虽然没有公开上市财报,但据路透社和第三方机构披露,它的主要收入仍来自抖音/TikTok等内容平台上的广告、电商、直播和本地生活变现。
AI Coding对它们来说,更像一个入口:开发者入口,云服务入口,企业研发入口。
从业务收入看,谷歌不靠Antigravity也能活得很好,字节不靠Trae也不会伤筋动骨。但如果它们想在Agent时代继续做平台级公司,就不能长期缺这个入口。
微软已经证明,开发工具的价值不一定体现在直接收入上。VS Code免费,GitHub长期也不靠单点软件授权赚钱,但它们让微软锁住了开发者工作流。一个工程师在哪里写代码,在哪里管理代码,在哪里调用AI,最后很可能就在哪里部署应用、采购云服务、接入企业工具。
AI Coding也是同样的逻辑。谁拿下开发者每天打开的工作台,谁就更容易往后接云、模型、数据库、部署、监控、安全和企业协作。
谷歌和字节都拥有非常强大的生态,但AI Coding不是一个简单靠生态导流就能做起来的市场。对开发者来说,重要的是模型在真实代码库里到底能不能干活。
一个Coding Agent要解决的,不只是“生成一段代码”(这种工作Chatbot也能做)。它要知道应该看哪些文件,哪些文件不用看;要理解用户真正想改什么,而不是反复探索;要能根据报错继续修;要知道什么时候应该动手,什么时候应该先问;要能少制造垃圾文件,少误改生产代码,少把token烧在无效搜索上。
而这些能力,最终都回到底层模型。
Antigravity的很多问题,表面上看是产品问题:Agent Manager太黑盒、额度不透明、任务容易中断、文件改动不可控。但往深处看,很多也是模型问题:如果模型足够强,知道该看哪里、该改哪里、什么时候该停,用户就不会那么强烈地感受到“不可靠”
这也是为什么Claude Code和Codex能先跑出来。Claude Code的成功,最最重要是Claude模型本身在代码理解、长上下文、工具调用和复杂任务规划上足够强;Codex也一样,OpenAI能把它做成大规模开发者入口,靠的是模型在软件工程任务上的持续迭代。
产品设计当然重要,Harness、权限、回滚、插件、移动端审批、第三方工具接入,这些都很关键。但它们都是为了给模型更好的发挥空间,如果模型本身不够稳,再好的生态也只是把不稳定放大;只有模型足够强,产品和生态才有机会把能力变成工作流。
AI Coding拼到最后,第一层是模型,第二层是工具,第三层才是生态。
谷歌和字节都不缺生态。真正的问题是,它们能不能把模型、Agent框架和开发者工作流做成一个稳定系统。
谷歌和字节都可以把入口铺得很满,但要是模型撑不住复杂软件工程任务,这块软肋就会一直露在外面。
生态可以把人带到门口,模型和产品稳定性才决定他们会不会留下来。
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App
