在《纽约时报》的播客访谈中,谷歌首席执行官桑达尔·皮查伊明确指出,谷歌在代码编写(Coding)能力方面确实有所滞后。
尽管谷歌在人工智能领域表现强势,拥有Gemini大模型、庞大的生态系统以及自研的TPU芯片,并在最近的I/O大会上将AI深度整合至各项核心产品中。虽然谷歌推出了Antigravity等AI编程工具,并为开发者提供了Gemini CLI和Gemini Code Assist,但产品推出不代表市场成功,全面的生态也无法自动转换为市场份额。
谈及AI编程,人们通常首先想到的是Claude Code、Codex和Cursor。编程已成为AI Agent技术率先实现落地的应用场景,几乎所有领先的AI公司都在积极布局。即使是以非编程见长的DeepSeek,也开始围绕Agent Harness招聘人才。
可以说,AI编程并非每家AI公司的最初重心,却正逐渐成为前沿AI公司的共同发力点。
在中国,字节跳动面临的困境与谷歌颇为相似。两家企业均拥有完善的AI生态,但在AI编程领域,字节的Trae和谷歌的Antigravity一样,仅是众多可替代开发工具中的一员。
若想在Agent时代继续保持巨头地位,它们必须尽快弥补这一短板。
谷歌在AI编程方面的主要问题并非缺乏产品,而是缺乏用户。Codex已拥有超过400万周活跃用户,而Claude Code则在开发者心中占据了主导地位。今年2月,一项针对软件工程师AI工具的调查显示,Claude Code以46%的支持率成为最受欢迎的工具,Business Insider在5月23日的报道中指出,Claude Code已成为创业公司内处理复杂工程任务的首选。
与此形成对比的是,Antigravity未能展现出令人瞩目的成绩,它目前仅是一款依附于谷歌庞大生态的AI编程产品。
从实际体验来看,Antigravity未能赢得开发者的信任。五个月前,有用户详细整理了Reddit社区中超过百条关于Antigravity的帖子,总结出主要痛点:额度混乱、性能资源消耗大、安全隐患、模型选择问题以及Agent可能删除或损坏代码。
这些问题本应在产品更新后得到解决。Antigravity 2.0的发布原本是谷歌追赶AI编程市场的一个重要节点,但更新后的社区反馈并不理想。
当前最大的争议在于,Antigravity 2.0将原先偏向IDE(集成开发环境)的体验,突然转变为更像Agent Manager的界面。用户无法找到熟悉的编辑器、文件树、终端、版本控制和扩展环境,不得不适应新的界面。
谷歌或许认为这是向更智能方向的进步,但现实是,在尚未充分建立信任的前提下,谷歌试图让开发者从“可控的IDE协作”模式直接跳入“黑盒式Agent调度”,这几乎等同于完全放弃了之前的模式,也因此流失了一部分原有用户。
额度混乱的问题依然存在,甚至愈演愈烈。自5月20日起,Gemini的限额机制从按请求次数转变为更侧重计算资源消耗。Antigravity官方声称专业版用户享有5小时刷新机制,但同时又设有每周上限;用户不清楚每次Agent任务会消耗多少资源,也不确定何时会触及每周上限。一旦中途达到限额,开发流程可能被迫中断。
更严重的是,谷歌最新发布的Gemini 3.5 Flash模型虽然速度快,但在编程方面的稳定性不足。有用户抱怨,当他要求Gemini 3.5 Flash仅提供一份重构计划时,模型却直接开始修改代码,并声称重构成功,但核心目标基本未实现,甚至在未经许可的情况下恢复了不相关的文件。
还有用户反映,即使明确告知目标文件、行号和修改要求,3.5 Flash仍会反复探索同一批文件,而非直接完成代码修改,在此过程中,token消耗巨大。
一边是产品形态从IDE协作突变为Agent Manager,让用户感到原有工作台被拆解;另一边是额度规则不透明,导致长时间任务可能中途被中断;再加上Gemini 3.5 Flash在真实代码库中的执行稳定性仍受质疑,Antigravity未能向开发者证明其值得信赖。
谷歌已经开始着手解决这些问题。在最近的采访中,皮查伊明确指出了谷歌的短板:在文本、多模态、语音、音频、推理和整体智能方面,谷歌仍具竞争力;但在AI编程、工具使用、指令遵循和长周期任务处理上,谷歌确实有所落后。
皮查伊特别提到,谷歌过去在编程方面可能缺少类似于Claude Code或Cursor的数据流和产品。
这也解释了谷歌目前一系列的追赶动作。过去很长一段时间,谷歌面向开发者的AI工具较为分散,包括Gemini Code Assist、Gemini CLI、Antigravity和Firebase相关工具,它们各自独立,缺乏清晰的主入口。I/O大会之后,谷歌开始将这些功能整合至Antigravity平台,Gemini CLI和Gemini Code Assist面向个人用户的功能将逐步转向Antigravity CLI和Antigravity 2.0。
谷歌需要一个统一的入口,将Gemini真正融入复杂的软件工程流程中,从而获取足够多的真实任务数据、失败案例、工具调用和长时间任务数据。
然而,同样是进入真实工作流,Claude Code的做法是让Agent紧密配合开发者的终端和代码库工作;Cursor则将AI嵌入IDE,方便用户随时查看、修改和接管。Antigravity 2.0的产品形态却显得过于激进,它直接将开发者提升一层,置于一个Agent Manager界面中,让用户查看任务进度、等待结果交付。
这种做法并非不可行,甚至可能是未来的趋势之一。但前提是用户对Agent已经足够信任,而Antigravity在尚未建立这种信任之前,就削弱了开发者熟悉的IDE协作体验。
可以说,不破不立,这可能需要一个过渡期。
除了整合产品入口至Antigravity,谷歌也在强化其背后的Agent底层架构。官方已开放Antigravity SDK预览版,开发者可以基于此框架构建自己的Agent。
这其中多少借鉴了Claude Code的成功经验。Claude Code之所以表现出色,不仅在于Claude模型本身,还在于Anthropic将其模型集成到一个成熟的Agent Harness中。许多开发者青睐Claude Code,因为它高度贴近真实的开发场景,终端、代码库、Git、测试、报错都一目了然。谷歌显然也在吸收这方面的经验。
在组织层面,据The Information报道,Google DeepMind已组建一支专门针对AI编程模型能力的工作小组,由研究员和工程师集中力量提升Gemini的代码能力。该团队由Google DeepMind研究工程师Sebastian Borgeaud领导,DeepMind首席技术官Koray Kavcuoglu和谷歌联合创始人谢尔盖·布林也据称参与其中。
这些举措表明谷歌已开始弥补短板,但这并不能保证它能迎头赶上。
谷歌历史上不乏“集中力量补短板”的时刻。在社交网络时代,它曾通过Google+试图追赶Facebook;在移动通信时代,它也尝试用Allo挑战WhatsApp、iMessage和Messenger。这些产品背后同样拥有谷歌账号体系、搜索流量、Android生态入口及强大的工程资源,但最终未能真正改变市场格局。
这并非预示Antigravity会重蹈覆辙,AI编程与社交、通信市场有所不同,谷歌也确实拥有Gemini、云服务、开发者工具和企业客户等更贴近软件工程领域的资产。但这提醒我们一点:巨头的资源只能将产品推到用户面前,却不能代替产品赢得用户习惯。
当前的Antigravity已被谷歌置于更重要的位置。但它仍需证明自己不是一个被强行整合的入口,而是一个真正能承接开发者日常工作的工具。
皮查伊对此充满信心。他在采访中表示,自己“非常、非常乐观”,并相信谷歌将“突破这一关”。
字节跳动的境遇与谷歌颇为相似,同样手握一套完整的AI全家桶:豆包、即梦、剪映、CapCut、飞书、火山引擎和扣子,再加上Trae,覆盖从普通用户到内容生产,从企业协作到云服务,从Agent平台到AI编程工具,字节几乎在每个层面都进行了布局。
然而,在AI编程领域,Trae和Antigravity一样,未能成为开发者不可或缺的工具。
字节当然也在积极追赶。Trae早已超越了单纯的AI IDE,它通过Trae SOLO试图切入用户的真实工作流;并通过开源的Trae Agent来建立开发者信任和技术认可。从招聘和产品动态来看,Trae已被字节打造为一条完整的产品线,涵盖Agent基础架构、AI编程环境、模型算法、开发者运营和企业客户等方向。
谷歌拥有Gemini、Antigravity、Google Cloud、Firebase、Android和Workspace;字节则有豆包、Trae、飞书、火山引擎、扣子和内容生态。它们并非单一工具公司,而是平台型企业。
谷歌的财报显示,Google Services仍是收入的绝对大头,搜索、YouTube、订阅和平台业务贡献了主要营收;Google Cloud则是增长最快的关键业务之一。
字节跳动虽未公开上市财报,但据路透社和第三方机构披露,其主要收入仍来自抖音/TikTok等内容平台上的广告、电商、直播和本地生活服务。
对这两家巨头而言,AI编程更像是一个入口:开发者入口、云服务入口、企业研发入口。
从业务收入来看,谷歌即使没有Antigravity也能运行良好,字节即使没有Trae也不会伤筋动骨。但若想在Agent时代继续保持平台级公司的地位,它们就不能长期缺少这个关键入口。
微软已经证明,开发工具的价值不一定体现在直接收入上。VS Code免费,GitHub长期以来也并非依靠单一软件授权盈利,但它们帮助微软锁定了开发者工作流。一位工程师在哪里编写代码、管理代码、调用AI,最终很可能就在哪里部署应用、采购云服务、接入企业工具。
AI编程也遵循同样的逻辑。谁能占据开发者每天使用的工具台,谁就更容易在后端接入云服务、模型、数据库、部署、监控、安全和企业协作。
谷歌和字节都拥有极其强大的生态系统,但AI编程不是一个简单依靠生态导流就能成功的市场。对开发者而言,最重要的是模型在真实代码库中的实际工作能力。
一个AI编程Agent需要解决的,不仅仅是“生成一段代码”(这种工作聊天机器人也能做)。它需要知道哪些文件应该查看、哪些不需要;需要理解用户真正意图的修改,而不是反复探索;需要能够根据错误信息继续修复;需要知道何时自动执行,何时先征求用户意见;需要尽量减少生成垃圾文件,避免误改生产代码,减少在无效搜索上消耗token。
这些能力的最终体现,都回归到底层模型。
Antigravity的许多问题,表面上是产品设计缺陷:Agent Manager过于“黑盒”、额度不透明、任务容易中断、文件修改不可控。但深入来看,许多问题也源于模型:如果模型足够强大,能够知道该看哪里、该改哪里、何时停止,用户就不会强烈感受到“不可靠”。
这也是Claude Code和Codex能够率先脱颖而出的原因。Claude Code的成功,最重要的是Claude模型在代码理解、长上下文处理、工具调用和复杂任务规划方面的强大能力;Codex也一样,OpenAI能够将其打造成大规模开发者入口,有赖于模型在软件工程任务上的持续迭代。
产品设计固然重要,Harness、权限管理、回滚机制、插件系统、移动端审批、第三方工具接入,这些都至关重要。但它们都是为了给模型提供更好的发挥空间,如果模型本身不够稳定,再好的生态也只会放大其不稳定性;只有模型足够强大,产品和生态才有机会将能力转化为有效的工作流。
AI编程的竞争,第一层是模型,第二层是工具,第三层才是生态。
谷歌和字节都不缺乏生态。真正的问题在于,它们能否将模型、Agent框架和开发者工作流整合为一个稳定的系统。
谷歌和字节能够将入口铺设得非常广泛,但如果模型无法支撑复杂的软件工程任务,这一短板将始终暴露在外。
生态可以将用户带到门前,但模型和产品的稳定性才能决定他们是否会留下。
