五月末,人工智能行业两大事件鲜明地展现了中国头部科技企业在AI领域的差异化策略。
5月11日,阿里巴巴旗下夸克App与淘宝平台实现全面融合。用户现在能够直接在夸克中进行购物交流,同时在淘宝内利用AI实现商品虚拟试穿、智能比价以及优惠券抢购。此举使得夸克得以充分利用淘宝海量的40亿商品数据和长达20年的购物场景沉淀。
紧随其后,在5月20日至21日举行的阿里云峰会上,阿里云首席执行官吴泳铭全面阐述了“芯片-云-模型-推理-应用”全栈升级的战略,并宣布推出自研的真武M890芯片、旗舰模型通义Qwen3.7-Max、全新入口夸克云以及Agentic Cloud等一系列创新成果。吴泳铭在会议结尾强调,未来五年在资本开支方面的投入将远超此前3800亿元的计划。
回溯到三个月前,字节跳动的即梦AI发布了Seedance 2.0,该产品在Artificial Analysis Video Arena评测中以1269的Elo分值跃居榜首,超越了Google Veo 3、OpenAI Sora 2和Runway Gen-4.5。著名游戏制作人冯骥公开赞誉其为“最强AI视频模型”。随后,5月27日有外媒报道称,字节跳动2026年的资本支出上限可能达到4700亿人民币(约合700亿美元),若市场条件理想甚至可能冲刺1000亿美元,这一数字是其2024年250亿美元投入的近三倍。
显而易见,阿里巴巴正在构建AI时代的“水电煤”与“零售收银台”,而字节跳动则致力于打造AI时代的“诺贝尔实验室”。一边是产品的迅速上线,另一边则是技术长期的深耕。
两种AI战略并行,但其路线选择截然不同。
过去一年,阿里巴巴最大的变革不在芯片或模型本身,而在于其组织架构的调整。2024年3月,韩歆毅从井贤栋手中接过蚂蚁集团CEO一职,井贤栋则专注于董事长工作。韩歆毅上任后迅速推出了“AI First + 支付宝双飞轮 + 加速全球化”三大核心战略。半年后,蚂蚁集团进行“一拆四”拆分,蚂蚁国际、OceanBase、蚂蚁数科各自设立独立董事会,独立运营以面向市场。再过数月,2026年2月2日,韩歆毅发布内部邮件,推出“AI Credit”专项激励方案,旨在奖励在AI领域做出开创性贡献的团队和个人,提供额外的绩效激励。
这一系列举措明确表达了其意图:通过组织拆分提升效率,将激励机制与AI发展紧密结合,进而加速产品的市场化。
那么,阿里巴巴正在将这些AI能力“上架”到哪些具体应用中呢?
蚂蚁集团的AI支付业务在2026年2月春节期间,支付笔数突破1.2亿笔,用户规模破亿,成为全球首个支付笔数和用户数均破亿的AI原生支付产品。蚂蚁健康助手“阿福”的月活跃用户达到3000万。淘天平台接入夸克App后,AI试穿、AI比价和AI抢券已成为消费者购物的新方式。有市场传闻称,淘宝中小商家在内测中反馈,AI比价功能上线一周内,就有三个SKU主动降价。这表明AI不仅服务商家,也赋能消费者更好地享受优惠。
更值得关注的是ACT协议(Agentic Commerce Trust Protocol)。2026年1月16日,支付宝、夸克App、淘宝闪购、Rokid、大麦以及阿里云百炼等六个业务部门联合发布了此协议,旨在构建“AI代用户支付”的信任基础设施。六大事业部共同发布协议,在阿里巴巴历史上实属罕见。在两年前的张勇时代,淘天和阿里云在数据共享上尚存分歧,如今却能为一个AI协议共同发声,这体现了吴泳铭在过去一年完成的组织体系重塑。
此次组织变革的回报体现在财务业绩中。阿里巴巴第四季度营收增长3%,其中云业务外部收入增长40%。云外部收入的显著增长尤为关键,它表明阿里巴巴的基建投入正产生现金流回报。阿里云资深副总裁刘伟光在峰会上提及“建设中国最大的AI工厂”,其核心客户包括月之暗面、MiniMax、Kimi、智谱以及DeepSeek等。大量国产大模型正在阿里云平台上运行。
MaaS(模型即服务)收入正逐步取代ECS(弹性计算服务),成为阿里云最大的产品线,这意味着阿里云的增长引擎已从传统云计算转向AI服务。
吴泳铭曾直言:“现在阿里巴巴的服务器内几乎没有一张卡是空的。”这句话分量十足,它并非一位CEO的豪言壮语,而是上市公司向资本市场做出的承诺:每一笔资本开支所投入的资源都在产生实际收益。
然而,这种策略也伴随着潜在的挑战。阿里巴巴之所以能如此迅速地将AI能力“上架”,前提在于其模型达到“够用”的程度即可,无需追求全球顶尖,只要能实现业务变现。虽然通义Qwen3.7-Max紧随DeepSeek和Kimi的能力水平,但并未形成代际优势。在国际AI基础模型原创研究的学术影响力方面,阿里巴巴相对低调。尽管通义开源模型在HuggingFace上的下载量很高,但在关于“下一代架构演进”的论文权重方面,阿里巴巴的投入远不如字节跳动。如果未来基础模型的代际差距被字节跳动、OpenAI或Anthropic拉开五倍,那么今天所有集成到商业应用中的AI都可能迅速沦为需要升级换代的旧技术。
阿里巴巴敢于这样投入的判断是:未来五年内,基础模型的代际能力不会出现五倍的巨大差距。
与此同时,字节跳动则采取了另一种姿态,将AI的深层发展交由Seed部门。
Seed部门内部设有两条平行线:朱文佳负责模型应用,涵盖豆包、即梦、扣子等产品端业务;吴永辉则专注于AI基础研究探索,主导AGI路线。两人首次在全员大会上同台时,确定的核心目标只有一个字,那就是“探索智能上限”。
他们还释放了一个更具稀缺性的信号:“考虑推进开源。”在国内大型企业中,“开源”一词通常只在Linux时代被频繁提及。字节跳动在AGI时代敢于提出开源,意味着它不再将基础模型收费作为主要盈利模式,而是希望将基础模型打造成全球技术的基础设施。
对外而言,Seedance 2.0是其强大实力的例证。这款于2026年2月10日发布的视频生成模型,在Artificial Analysis Video Arena上以1269的Elo分值登顶,超越了Google Veo 3、OpenAI Sora 2和Runway Gen-4.5。它采用双分支扩散变换器架构,实现了原生多模态处理——文字、图片、音频、视频四种输入统一处理,能在60秒内生成带有原生音频的电影级多镜头视频,并且2K视频生成速度比同类产品快30%。冯骥的公开评价并非公关稿,而是他作为游戏制作人亲自使用后的真实反馈。
对内而言,其内部举措也更为强劲。Top Seed人才计划于2024年5月启动,面向应届博士生;同年7月,该计划扩展至在校博士研究实习生。以每日2000元的薪酬吸引顶尖人才,与DeepSeek在硅谷和清华校园公开竞争。市场传闻,一位前字节Seed实习生在饭局中透露,他加入团队的第一天,KPI并非日活用户或营收,而是“年底前在某个国际排行榜上进入前三名”,这种KPI在他之前供职的其他公司中从未见过。
还有那篇耗时八个月撰写的论文。豆包大模型团队花费八个月时间,进行了一项系统性实验,题为《视频生成模型距离世界模型有多远》。结论非常谦虚:“视频生成模型可以记忆训练案例,但暂时还无法真正理解物理规律。”这类论文不涉及商业转化,纯粹是从学术角度回答一个需在五到七年内才能解决的问题。
字节跳动每年在这些项目上投入多少资金?2025年12月,《金融时报》报道字节跳动2026年的资本支出计划为1600亿人民币;5月9日,《南华早报》报道称超过2000亿人民币(增长25%);5月27日,彭博社报道最高可达4700亿人民币(700亿美元)。在五个月内,这一数字连续三次上调,每次都有大幅增长,最新数字是2024年的2.8倍。据彭博社报道,资金来源是字节跳动2025年约500亿美元的利润——字节跳动内部对该数字的准确性有所保留——这意味着在花完当年利润后,可能还需要额外借贷200亿美元。如果市场环境理想,甚至可能冲刺1000亿美元(约合6781亿人民币)。
字节跳动的资金是否充足?答案是肯定的。由于其尚未上市,无需每个季度向资本市场汇报投资回报率,这使得它能够承担长期投入。
但其耐心是否足够?这不一定。豆包最近开始测试付费模式,钛媒体曾发布标题称“字节踩下豆包免费‘刹车’”。豆包的用户日活过亿,是字节跳动历史上推广费用最少却达到破亿用户的产品,按理说它最不应该面临变现压力,但内部 nevertheless 开始考虑插入广告。这说明即使是非上市公司,烧钱到第三年,财务压力也会开始显现。
坊间传闻,早期投资豆包风险投资机构私下评论,字节跳动这两年最大的变化不是模型变强了,而是它开始真正相信“技术领先能带来财富”。这种信念,在其公司过去的字典中是不存在的。
然而,相信归相信,信念不能当饭吃。Seedance 2.0登顶榜单和将Seedance 2.0转化为下一个抖音是两回事——后者字节跳动尚未证明。
“卖货”与“做产品”并非哲学问题,而是由其公司“出身”决定。
在此需要提出一个反主流的观点。主流叙事往往认为:阿里巴巴注重短期实用,字节跳动追求长期理想;阿里巴巴更精明,字节跳动更具远见。这些说法不无道理——阿里巴巴云业务外部收入增长40%是实实在在的成绩,字节跳动Seedance 2.0登顶榜单也是不争的事实。两家公司确实走着不同的道路。
然而,真正的核心问题不在于战略理念的差异。
阿里巴巴作为上市公司,每个季度的财报、股价、股票回购和分红,都需要在资本市场面前接受检验。吴泳铭表示“未来五年远超3800亿”,但没有给出具体数字,这正是其受股价制约的表现。它没有“先烧五年再看效果”的奢侈。一旦云业务外部收入某季度增长跌至个位数,股价便会迅速给出负面反馈。
字节跳动则不同。它可以允许Seed团队耗时八个月撰写一篇不带商业转化的世界模型论文,可以令其资本支出在五个月内翻三倍,也可以让吴永辉只发表学术论文而不撰写产品需求文档——因为它无需向任何人解释这些团队和人员存在的理由。
因此,如果阿里巴巴没有上市,它很有可能也会选择押注基础模型。参考其早期对达摩院、平头哥和罗汉堂的投入姿态,那正是张勇之前的阿里巴巴——当时马云确实相信“科技公司需要培育自己的科学家”。
反之,如果字节跳动上市,它也大概率会紧盯变现。参考字节跳动每次传出IPO消息后,豆包便突然加大商业化力度的反应曲线——市场预期会立刻反向编程其战略选择。
真正决定中国AI公司战略路径的,并非CEO的个人远见,而是这家公司是否上市。
这意味着腾讯、阿里巴巴、百度等体量庞大的上市公司在未来五年内无法像字节跳动那样“做AI”(从事基础研究和探索),而只能“卖AI”(将AI能力产品化和商业化);反过来,像DeepSeek、月之暗面这类非上市公司才拥有“做AI”的奢侈。
同样地,如果某一天字节跳动真的启动IPO,其Seed团队的长期研究预算将首当其冲面临压力。这一点比所有“豆包对标GPT”的判断都更值得关注。
同一周内,吴泳铭在阿里云峰会上高呼“五年远超3800亿”,而朱文佳和吴永辉则在Seed全员大会上喊出“探索智能上限”。一个在向市值高达数万亿人民币的股东们描绘现实的收银台,另一个则在向非公开股权的自家工程师们讲述高远的实验室愿景。
阿里巴巴将AI能力一个个地嵌入到商业门店,而字节跳动则将AI理念一行行地写入学术论文。待到2027年某天字节跳动真的递交S-1上市申请时,我们便能看到“练功”二字在其招股书中能支撑到第几页了。
