手握AI生态巨头谷歌与字节，编程能力为何仍是短板？

在《纽约时报》的播客访谈中，谷歌首席执行官桑达尔·皮查伊明确指出，谷歌在代码编写（Coding）能力方面确实有所滞后。

尽管谷歌在人工智能领域表现强势，拥有Gemini大模型、庞大的生态系统以及自研的TPU芯片，并在最近的I/O大会上将AI深度整合至各项核心产品中。虽然谷歌推出了Antigravity等AI编程工具，并为开发者提供了Gemini CLI和Gemini Code Assist，但产品推出不代表市场成功，全面的生态也无法自动转换为市场份额。

谈及AI编程，人们通常首先想到的是Claude Code、Codex和Cursor。编程已成为AI Agent技术率先实现落地的应用场景，几乎所有领先的AI公司都在积极布局。即使是以非编程见长的DeepSeek，也开始围绕Agent Harness招聘人才。

可以说，AI编程并非每家AI公司的最初重心，却正逐渐成为前沿AI公司的共同发力点。

在中国，字节跳动面临的困境与谷歌颇为相似。两家企业均拥有完善的AI生态，但在AI编程领域，字节的Trae和谷歌的Antigravity一样，仅是众多可替代开发工具中的一员。

若想在Agent时代继续保持巨头地位，它们必须尽快弥补这一短板。

谷歌在AI编程方面的主要问题并非缺乏产品，而是缺乏用户。Codex已拥有超过400万周活跃用户，而Claude Code则在开发者心中占据了主导地位。今年2月，一项针对软件工程师AI工具的调查显示，Claude Code以46%的支持率成为最受欢迎的工具，Business Insider在5月23日的报道中指出，Claude Code已成为创业公司内处理复杂工程任务的首选。

与此形成对比的是，Antigravity未能展现出令人瞩目的成绩，它目前仅是一款依附于谷歌庞大生态的AI编程产品。

从实际体验来看，Antigravity未能赢得开发者的信任。五个月前，有用户详细整理了Reddit社区中超过百条关于Antigravity的帖子，总结出主要痛点：额度混乱、性能资源消耗大、安全隐患、模型选择问题以及Agent可能删除或损坏代码。

这些问题本应在产品更新后得到解决。Antigravity 2.0的发布原本是谷歌追赶AI编程市场的一个重要节点，但更新后的社区反馈并不理想。

当前最大的争议在于，Antigravity 2.0将原先偏向IDE（集成开发环境）的体验，突然转变为更像Agent Manager的界面。用户无法找到熟悉的编辑器、文件树、终端、版本控制和扩展环境，不得不适应新的界面。

谷歌或许认为这是向更智能方向的进步，但现实是，在尚未充分建立信任的前提下，谷歌试图让开发者从“可控的IDE协作”模式直接跳入“黑盒式Agent调度”，这几乎等同于完全放弃了之前的模式，也因此流失了一部分原有用户。

额度混乱的问题依然存在，甚至愈演愈烈。自5月20日起，Gemini的限额机制从按请求次数转变为更侧重计算资源消耗。Antigravity官方声称专业版用户享有5小时刷新机制，但同时又设有每周上限；用户不清楚每次Agent任务会消耗多少资源，也不确定何时会触及每周上限。一旦中途达到限额，开发流程可能被迫中断。

更严重的是，谷歌最新发布的Gemini 3.5 Flash模型虽然速度快，但在编程方面的稳定性不足。有用户抱怨，当他要求Gemini 3.5 Flash仅提供一份重构计划时，模型却直接开始修改代码，并声称重构成功，但核心目标基本未实现，甚至在未经许可的情况下恢复了不相关的文件。

还有用户反映，即使明确告知目标文件、行号和修改要求，3.5 Flash仍会反复探索同一批文件，而非直接完成代码修改，在此过程中，token消耗巨大。

一边是产品形态从IDE协作突变为Agent Manager，让用户感到原有工作台被拆解；另一边是额度规则不透明，导致长时间任务可能中途被中断；再加上Gemini 3.5 Flash在真实代码库中的执行稳定性仍受质疑，Antigravity未能向开发者证明其值得信赖。

谷歌已经开始着手解决这些问题。在最近的采访中，皮查伊明确指出了谷歌的短板：在文本、多模态、语音、音频、推理和整体智能方面，谷歌仍具竞争力；但在AI编程、工具使用、指令遵循和长周期任务处理上，谷歌确实有所落后。

皮查伊特别提到，谷歌过去在编程方面可能缺少类似于Claude Code或Cursor的数据流和产品。

这也解释了谷歌目前一系列的追赶动作。过去很长一段时间，谷歌面向开发者的AI工具较为分散，包括Gemini Code Assist、Gemini CLI、Antigravity和Firebase相关工具，它们各自独立，缺乏清晰的主入口。I/O大会之后，谷歌开始将这些功能整合至Antigravity平台，Gemini CLI和Gemini Code Assist面向个人用户的功能将逐步转向Antigravity CLI和Antigravity 2.0。

谷歌需要一个统一的入口，将Gemini真正融入复杂的软件工程流程中，从而获取足够多的真实任务数据、失败案例、工具调用和长时间任务数据。

然而，同样是进入真实工作流，Claude Code的做法是让Agent紧密配合开发者的终端和代码库工作；Cursor则将AI嵌入IDE，方便用户随时查看、修改和接管。Antigravity 2.0的产品形态却显得过于激进，它直接将开发者提升一层，置于一个Agent Manager界面中，让用户查看任务进度、等待结果交付。

这种做法并非不可行，甚至可能是未来的趋势之一。但前提是用户对Agent已经足够信任，而Antigravity在尚未建立这种信任之前，就削弱了开发者熟悉的IDE协作体验。

可以说，不破不立，这可能需要一个过渡期。

除了整合产品入口至Antigravity，谷歌也在强化其背后的Agent底层架构。官方已开放Antigravity SDK预览版，开发者可以基于此框架构建自己的Agent。

这其中多少借鉴了Claude Code的成功经验。Claude Code之所以表现出色，不仅在于Claude模型本身，还在于Anthropic将其模型集成到一个成熟的Agent Harness中。许多开发者青睐Claude Code，因为它高度贴近真实的开发场景，终端、代码库、Git、测试、报错都一目了然。谷歌显然也在吸收这方面的经验。

在组织层面，据The Information报道，Google DeepMind已组建一支专门针对AI编程模型能力的工作小组，由研究员和工程师集中力量提升Gemini的代码能力。该团队由Google DeepMind研究工程师Sebastian Borgeaud领导，DeepMind首席技术官Koray Kavcuoglu和谷歌联合创始人谢尔盖·布林也据称参与其中。

这些举措表明谷歌已开始弥补短板，但这并不能保证它能迎头赶上。

谷歌历史上不乏“集中力量补短板”的时刻。在社交网络时代，它曾通过Google+试图追赶Facebook；在移动通信时代，它也尝试用Allo挑战WhatsApp、iMessage和Messenger。这些产品背后同样拥有谷歌账号体系、搜索流量、Android生态入口及强大的工程资源，但最终未能真正改变市场格局。

这并非预示Antigravity会重蹈覆辙，AI编程与社交、通信市场有所不同，谷歌也确实拥有Gemini、云服务、开发者工具和企业客户等更贴近软件工程领域的资产。但这提醒我们一点：巨头的资源只能将产品推到用户面前，却不能代替产品赢得用户习惯。

当前的Antigravity已被谷歌置于更重要的位置。但它仍需证明自己不是一个被强行整合的入口，而是一个真正能承接开发者日常工作的工具。

皮查伊对此充满信心。他在采访中表示，自己“非常、非常乐观”，并相信谷歌将“突破这一关”。

字节跳动的境遇与谷歌颇为相似，同样手握一套完整的AI全家桶：豆包、即梦、剪映、CapCut、飞书、火山引擎和扣子，再加上Trae，覆盖从普通用户到内容生产，从企业协作到云服务，从Agent平台到AI编程工具，字节几乎在每个层面都进行了布局。

然而，在AI编程领域，Trae和Antigravity一样，未能成为开发者不可或缺的工具。

字节当然也在积极追赶。Trae早已超越了单纯的AI IDE，它通过Trae SOLO试图切入用户的真实工作流；并通过开源的Trae Agent来建立开发者信任和技术认可。从招聘和产品动态来看，Trae已被字节打造为一条完整的产品线，涵盖Agent基础架构、AI编程环境、模型算法、开发者运营和企业客户等方向。

谷歌拥有Gemini、Antigravity、Google Cloud、Firebase、Android和Workspace；字节则有豆包、Trae、飞书、火山引擎、扣子和内容生态。它们并非单一工具公司，而是平台型企业。

谷歌的财报显示，Google Services仍是收入的绝对大头，搜索、YouTube、订阅和平台业务贡献了主要营收；Google Cloud则是增长最快的关键业务之一。

字节跳动虽未公开上市财报，但据路透社和第三方机构披露，其主要收入仍来自抖音/TikTok等内容平台上的广告、电商、直播和本地生活服务。

对这两家巨头而言，AI编程更像是一个入口：开发者入口、云服务入口、企业研发入口。

从业务收入来看，谷歌即使没有Antigravity也能运行良好，字节即使没有Trae也不会伤筋动骨。但若想在Agent时代继续保持平台级公司的地位，它们就不能长期缺少这个关键入口。

微软已经证明，开发工具的价值不一定体现在直接收入上。VS Code免费，GitHub长期以来也并非依靠单一软件授权盈利，但它们帮助微软锁定了开发者工作流。一位工程师在哪里编写代码、管理代码、调用AI，最终很可能就在哪里部署应用、采购云服务、接入企业工具。

AI编程也遵循同样的逻辑。谁能占据开发者每天使用的工具台，谁就更容易在后端接入云服务、模型、数据库、部署、监控、安全和企业协作。

谷歌和字节都拥有极其强大的生态系统，但AI编程不是一个简单依靠生态导流就能成功的市场。对开发者而言，最重要的是模型在真实代码库中的实际工作能力。

一个AI编程Agent需要解决的，不仅仅是“生成一段代码”（这种工作聊天机器人也能做）。它需要知道哪些文件应该查看、哪些不需要；需要理解用户真正意图的修改，而不是反复探索；需要能够根据错误信息继续修复；需要知道何时自动执行，何时先征求用户意见；需要尽量减少生成垃圾文件，避免误改生产代码，减少在无效搜索上消耗token。

这些能力的最终体现，都回归到底层模型。

Antigravity的许多问题，表面上是产品设计缺陷：Agent Manager过于“黑盒”、额度不透明、任务容易中断、文件修改不可控。但深入来看，许多问题也源于模型：如果模型足够强大，能够知道该看哪里、该改哪里、何时停止，用户就不会强烈感受到“不可靠”。

这也是Claude Code和Codex能够率先脱颖而出的原因。Claude Code的成功，最重要的是Claude模型在代码理解、长上下文处理、工具调用和复杂任务规划方面的强大能力；Codex也一样，OpenAI能够将其打造成大规模开发者入口，有赖于模型在软件工程任务上的持续迭代。

产品设计固然重要，Harness、权限管理、回滚机制、插件系统、移动端审批、第三方工具接入，这些都至关重要。但它们都是为了给模型提供更好的发挥空间，如果模型本身不够稳定，再好的生态也只会放大其不稳定性；只有模型足够强大，产品和生态才有机会将能力转化为有效的工作流。

AI编程的竞争，第一层是模型，第二层是工具，第三层才是生态。

谷歌和字节都不缺乏生态。真正的问题在于，它们能否将模型、Agent框架和开发者工作流整合为一个稳定的系统。

谷歌和字节能够将入口铺设得非常广泛，但如果模型无法支撑复杂的软件工程任务，这一短板将始终暴露在外。

生态可以将用户带到门前，但模型和产品的稳定性才能决定他们是否会留下。