全球人工智能领域正经历前所未有的投资热潮。根据最新预测,2024年全球AI基础设施支出有望达到7250亿美元,同比增长45%。其中,Alphabet、亚马逊、Meta和微软这四大科技巨头贡献了超过60%的支出,市场呈现高度集中的态势。这一趋势也推动了数据中心PUE(电源使用效率)向1.1以下迈进,并促使科技公司通过长期能源合同,如微软的15年核电协议和亚马逊的200亿美元可再生能源投资,来保障算力稳定,进而带动全球核能与可再生能源投资增长28%。然而,若未来三年内AI投资未能使生产力提升超过15%,科技巨头估值可能面临10%至20%的修正风险。与此同时,英伟达GPU出货量激增300%,苹果和阿里云等企业也加速布局,使得AI领域的竞争从北美蔓延至全球。
在AI治理方面,OpenAI发布了前瞻性的AI治理框架,旨在通过民主进程引导超级智能的过渡,其中包括设立公共财富基金和征收机器人税等六项具有创新性的理念,以确保AI发展以人为本,并解决财富不平等问题。美国在AI安全政策领域取得了显著进展,通过发布网络安全行政命令,并成立人工智能安全研究所联盟(AISIC),联合200多家企业制定安全评估标准。OpenAI的治理框架涵盖了网络安全、生化风险和有害操纵等风险评估与缓解措施,以符合加州《前沿AI透明度法案》和欧盟《AI法案》等新兴法律要求。
Alphabet完成了一笔创纪录的847.5亿美元股权融资,其中包括400亿美元的“按市价发行”机制和伯克希尔哈撒韦的100亿美元私募投资。这笔巨额资金将全部用于AI基础设施建设和业务布局。尽管Alphabet在2024年第一季度营收达到805.39亿美元,仍选择股权融资,这表明在AI领域,投资已从研发阶段转向长期基础设施投入。预计到2026年,四大科技巨头的AI资本开支将达到7250亿美元,同比增长77%。此次融资将有力推动Google在Gemini多模态大模型和TPU芯片研发等核心技术上的落地,有望缩小与微软在AI应用速度上的差距,标志着AI领域进入由巨头主导的规模化发展阶段。
英伟达与微软在Build大会上宣布深化合作,将推出覆盖Windows设备到云端的统一技术栈,包括RTX Spark个人AI电脑、Windows版DGX工作站、GPU加速Microsoft Fabric以及NVIDIA开源模型接入微软Foundry平台等。RTX Spark个人AI电脑的AI算力高达1000万亿次浮点运算,内存最高可达128GB。Windows版DGX Station搭载GB300芯片,内存最高748GB,FP4精度算力最高2000万亿次浮点运算,可在本地运行万亿参数级大模型。双方的合作旨在将Windows打造为本地智能体开发和运行的核心载体,华硕、戴尔、惠普、联想等厂商预计将于今年秋季推出相关产品。GPU加速后,微软Fabric SQL的运算速度最高可达纯CPU方案的6倍。
Alphabet旗下的Gemini AI应用月活跃用户已突破9亿,同比增长超过100%,成为全球增长最快的AI应用之一。其搜索AI概览功能月活跃用户更是达到25亿,成为全球最大的AI信息服务平台。通过升级Gemini 3模型,Alphabet的核心AI响应成本降低了逾30%,预计本月将推出Gemini 3.5 Pro模型,以优化多模态处理能力和响应速度,增强企业级市场竞争力。全球AI助手类应用月活跃用户已突破50亿,其中生成式AI应用占比达到65%。微软Bing AI月活跃用户突破7亿,而百度文心一言的月活跃用户也达到了3.2亿,显示AI技术正加速融入日常生活。
微软Xbox Game Pass在6月进行了内容更新,将分批上线9款新游戏,覆盖云游戏、主机、PC及掌机平台,其中3款为首发。同时,6月15日将有5款游戏退出。这种动态内容更新策略有助于维持用户留存率,微软2025年运营报告显示,每月退出5至8款游戏可提升用户留存率12%。截至2025财年,Xbox Game Pass全球付费用户数已超过3400万,占据全球游戏订阅市场27%的份额。索尼PS Plus同期新增《战神:诸神黄昏》PC版,进一步加剧了市场竞争。微软计划在2026年第四季度推出4K云游戏服务,以提升订阅附加值,应对行业竞争。
谷歌正将AI技术布局二手转售市场。麦肯锡2023年报告显示,全球二手商品市场规模已突破2000亿美元,复古服装和电子产品等细分领域年复合增长率高达18%。谷歌在2024年第二季度推出了基于Gemini Pro Vision的Google Lens实时识别工具(准确率92%)和购物标签页二手筛选器,可将用户寻找商品的时间缩短40%。此举旨在增强搜索生态粘性,并开辟新的广告收入渠道。eBay、Depop、亚马逊等平台也纷纷升级AI功能,提升搜索转化率和用户留存率,Meta和阿里巴巴等科技巨头也加速布局“AI+二手”赛道。
Meta正式在全球推出基于WhatsApp的AI客服工具Meta Business Agent,该工具依托Llama 2大语言模型开发。测试数据显示,在印度市场,客户咨询响应时间平均缩短72%,人工客服工作量减少45%,意图识别准确率达91%。麦肯锡2024年报告指出,AI客服工具可帮助企业将客服运营成本降低30%至50%。使用Meta Business Agent的企业客户满意度得分平均提升28%,销售线索转化率比传统模式提高15%。即时通讯平台AI化已成为行业趋势,腾讯企业微信在2024年第一季度推出了智能客服助手,Telegram已有超过100万个企业bot在运行,Meta此次全球上线AI工具将加剧商业即时通讯领域的竞争。
Airtap推出了一款旨在处理日常重复移动任务的云手机。其AI代理能够自动处理早间简报、午夜预订和机票重订等任务,并能聚合聊天、通知、新闻及邮件摘要,同时在各类购物应用中扫描优惠券。用户可以通过SKILLS.md文件将Claude Code、Codex或OpenClaw连接到专用的云安卓实例,AI代理会在预设时间内完成真实应用中的点击、滚动、输入及导航操作,实现移动端自动化任务执行。中国信通院数据显示,2026年云手机市场将迎来爆发式增长,国内市场规模已突破120亿元,年复合增长率达到42.3%,AI算力与云手机的深度融合已成为行业标配,智能体调度与自动化任务处理成为新品的必备模块。
旧金山湾区房产市场出现了用AI公司股票置换房产的创新交易模式。例如,一套爱德华式住宅挂牌290万美元或等值的Anthropic/OpenAI股票,反映出科技公司股权已成为湾区高净值人群的重要财富形式。尽管全美房市降温,但2026年旧金山房屋中位数价格已突破200万美元,平均成交价仍高于挂牌价4%,这得益于AI财富效应支撑高端房产需求。Anthropic估值从2026年2月的3800亿美元飙升至9650亿美元,三个月内增长三倍,并已提交IPO申请。OpenAI估值约为8500亿美元,两家公司IPO的预期加剧了湾区投资者对潜在财富的FOMO情绪。
为了控制高昂的AI使用成本,优步出台了内部限额政策,规定每位员工每月在每款智能代码工具(如ClaudeCode、Cursor)上的调用费用上限为1500美元。员工可以通过数据面板实时监控消耗,特殊场景则需审批突破限额。此前,优步曾鼓励员工大量使用AI并设置内部竞赛,导致公司在四个月内就耗尽了全年AI预算。财富杂志调查显示,84%的企业因AI成本导致毛利率下降超过6%,优步此举反映出企业对AI投资回报的重新评估。
瑞典AI初创公司Lovable正与Google Cloud深化合作,利用Gemini模型扩展全球AI开发服务。麦肯锡2023年报告指出,生成式AI技术能将软件开发流程效率提升30%至50%,尤其在代码生成和bug修复环节表现突出。Lovable整合了Google Cloud的Gemini模型(代码生成准确率提升15%)和TPU v5e集群(访问延迟控制在100毫秒以内),以解决全球AI推理服务高质量模型接入和分布式算力支撑的难题。Gartner 2024年第一季度数据显示,Google Cloud在AIaaS市场份额达到18%,紧随AWS(22%)之后。行业竞争加剧,AWS、微软Azure、Anthropic等平台纷纷强化AI开发工具能力,推动企业级AI应用落地。
前xAI视频多模态负责人Ethan He指出,视频模型智能水平的真正天花板在于语言模型。扩散模型需要依赖大规模语言模型进行提示词重写,将简单输入转化为详细描述以提升生成质量,并且语言模型还能调用工具、协调智能体、规划视频布局。视频模型训练成本高昂,存储10亿条视频需要5PB空间,月存储费约23万人民币,数据出口费用更高,I/O瓶颈容易拉低GPU利用率。理想的世界模型需具备交互性、实时性和长时程三个条件,而当前视频模型距离这些要求仍有差距。Ethan预测,扩散模型将成为人机交互前端,语言模型和代码在后端提供支持。小而精的团队结构和快速迭代能力是xAI成功的关键,重点在于每天完成更多实验,通过修复微小bug来提升模型质量。
亚马逊云科技与临港新片区合作共建创新加速中心,旨在填补区域云技术资源平台空白,整合技术赋能和生态链接,重点服务人工智能、数字化转型与企业全球化三大方向。该中心依托亚马逊云科技全球32个区域、99个可用区的基础设施,其Bedrock平台可将企业AI模型训练周期缩短30%以上,AWS迁移服务能降低25%IT成本并提升40%运营效率。该中心将完善临港科技创新生态,参考历史数据可提升企业融资成功率40%、加快市场拓展速度50%。同时,该中心也将面临阿里云、微软Azure等云服务商创新平台的竞争,从而推动行业技术升级与服务深化。
Perplexity Computer将于7月推出“混合智能体推理”功能,根据任务属性和数据敏感级别,在本地轻量级模型与云端高性能大模型之间动态调度计算资源,以实现隐私安全与响应效能的双重优化。此举旨在降低使用成本,Perplexity公司2024年将营收的164%用于支付云计算成本,运营毛利率约为负64%。通过本地处理敏感数据可减少云端调用,改善成本结构。若高级版订阅用户30%的查询能本地处理,经济效益将显著改变,这与苹果推动设备端人工智能发展的逻辑相同,标志着AI智能体在办公提效与隐私保障双维度融合进程中迈出了实质性一步。
