← 返回新闻列表

AI芯片成本结构巨变:内存成主角,廉价智能机市场萎缩

最新数据显示,全球人工智能芯片总支出飙升,但增长主要由高带宽内存驱动,导致其成本占比急剧上升。这一变化重塑了半导体产业资金流向,并直接冲击了低端智能手机市场,使得廉价机型面临停产风险,提升了数字接入的门槛。

文 / 编辑部 · 2026/05/26 · 阅读约 5 分钟

分享:
AI芯片成本结构巨变:内存成主角,廉价智能机市场萎缩

硅谷的科技巨头们正面临一份前所未有的开销清单。尽管每次产品发布会上,处理器的晶体管数量和算力屡创新高,让人们为“智能大脑”的进步而欢呼,但深入审视这份算力成本账单,却揭示了一个令人警觉的错位。

根据知名研究机构Epoch AI的分析报告,从2024年初至2025年底,全球AI芯片的总组件支出预计将从220亿美元激增至520亿美元。然而,代表着核心计算能力的“主逻辑裸片”成本占比却几乎没有增长,保持在13%至14%之间。这意味着,真正大幅推高成本的并非计算核心,而是担任“记忆库”角色的内存。

具体数据显示,高带宽内存(HBM)在AI芯片组件中的成本占比已从52%攀升至63%。在这300亿美元的总支出增量中,HBM一项就占据了约200亿美元。这一趋势凸显了云端AI芯片算力竞赛背后,产业结构的深刻变革。它不仅影响着全球半导体投资流向,更直接导致了经济型智能手机市场的显著萎缩。

为何“大脑”成本增长有限,“记忆”却成为主要开支?当前AI领域竞争的关键,远不止于算法和架构的“智力”较量,它已演变为一场物理层面、生产线上的硬战。要理解这种成本错位,我们需要认识AI芯片的构造及其与传统电脑芯片的区别。

在传统CPU时代,芯片设计追求“单兵作战能力”,如同为顶级学者配备了充足的私人书架和灵活的任务调度。然而,AI大模型所需并非复杂逻辑判断,而是简单直接的大规模并行计算。因此,GPU和TPU等AI加速芯片应运而生,它们如同数万名流水线工人,专门处理海量加减乘除任务。当这些工人计算速度过快,瓶颈随之出现。

数据显示,过去二十年硬件峰值计算能力提升了60000倍,而内存容量仅增长100倍,互连带宽也只增加了30倍。在计算能力接近饱和的当下,竞争重心转向了现实的物理条件:谁能获得最高规格的HBM,并以最快速度将其数据传输给计算核心。由于计算性能的飞速进步远超内存带宽的改善,数据传输通道不堪重负,形成了计算机界长久以来的“内存墙”难题。

为了拓宽数据通道,行业采用了技术难度和成本极高的解决方案:高带宽内存(HBM)。HBM通过垂直堆叠DRAM存储芯片,并打通微观孔洞与计算核心直接连接,从而实现超宽数据传输。然而,生产1GB的HBM,需要消耗相当于普通DRAM三倍以上的晶圆产能。

当底层晶圆产能成为零和博弈,整个产业链的资金流向随之巨变。普通商品内存的毛利率通常在20%至30%之间,而HBM的毛利率却高达70%以上。面对如此巨大的利润差,存储巨头纷纷调整战略。

美光(Micron)于2025年12月宣布终止其运营29年的消费级品牌Crucial(英睿达),并于2026年2月停止面向消费端所有发货,将其产能全面转向利润更高的AI和企业级数据中心市场。韩国两大存储巨头也从中受益匪浅。2026年第一季度,SK海力士凭借HBM订单售罄实现了72%的营业利润率,而三星电子半导体部门也以超过70%的利润率,贡献了公司94%的整体利润。

然而,这种云端繁荣带来的直接代价是终端手机厂商面临的冲击。晶圆产能大量转向AI所需的HBM生产,导致普通手机内存供应短缺。仅仅一年内,老一代LPDDR4价格猛涨250%,LPDDR5也上涨了220%。因此,手机物料成本中内存的占比从约15%飙升至最高50%。

结果是,低端智能手机在商业上已经难以维系。分析师指出,低于100美元的智能手机已“永久性不再经济”。原本售价50美元的手机,由于内存成本高昂,被迫提价至120美元以上。占据非洲近半市场份额的手机品牌传音,2025年净利润暴跌54%,出货目标被迫削减40%。Oppo和Vivo也分别下调了预期超过20%和近15%。在印度,2026年一季度100美元以下手机市场同比萎缩了59%。AI的加速发展,无形中大幅提升了亚非拉地区用户数字接入的门槛。

除了庞大的内存成本,先进的封装技术也构成了另一重瓶颈。再昂贵的HBM和逻辑计算芯片,都必须通过台积电的CoWoS等先进封装工艺精密结合。台积电CEO魏哲家坦言,CoWoS产能极度紧张,至2026年已全部售罄,英伟达更是提前预订了超六成的产能。

未来的商业机会和发展方向又在哪里呢?随着行业从“模型训练”转向大规模的“AI代理(Agentic AI)”推理,模型需要更长时间的记忆和上下文支持,这使得“内存墙”的压力倍增。为应对挑战,行业分化出两条主要路径:

第一条是英伟达的“暴力加码”路线。其2026年将投产的新一代Rubin架构,旨在实现极致吞吐量。单颗Rubin GPU集成了3360亿个晶体管(较上一代增加1.6倍),并首次搭载容量高达288GB、带宽达22 TB/s的HBM4内存。美光的HBM4产能正以两倍于前代的速度爬坡,专供Rubin。英伟达的目标是利用极高的内存带宽降低推理成本。

第二条是初创企业的“底层架构突破”之路。既然逻辑计算成本仅占AI芯片的13%,那么只要能有效规避高昂的HBM,就有机会重塑整个算力市场的利益分配格局。例如,初创公司MatX在2026年获得了5亿美元的B轮巨额融资,他们设计了一款基于“可拆分脉动阵列”的专用芯片,利用SRAM的超低延迟特性来处理长文本推理。欧洲的Semidynamics公司也已在台积电3nm工艺上流片,专注于研发减少数据移动的AI推理新架构。

而在终端租赁市场,算力正在逐渐失去其神秘且昂贵的光环。华尔街已推出追踪GPU租赁价格的“硅数据指数”,如同大宗商品般实时关注算力现货价格。在2026年的现货交易平台上,曾一卡难求的H100,其小时租赁底价已被Thunder Compute等平台压低至1.38美元。算力大宗商品化时代已提速到来。在此剧烈的周期波动中,真正稀缺且昂贵的,不再是单纯的“大脑计算能力”,而是数据的流转、存储的吞吐性能,以及纳米级基板上的物理封装技艺。洞察这张以内存为主导的错位账单,才是理解科技巨头未来布局的关键。

广告位 · 文末横幅