← 返回新闻列表

AI时代,超高速连接技术CPO:驱动数据中心迈向“光”速未来

自2022年末ChatGPT问世以来,人工智能已在全球范围内掀起巨浪,推动半导体产业在算力、存储、CPU等领域实现突破。在AI高速发展的基础设施建设中,一个尚未充分释放潜力但极具万亿市值潜力的领域逐渐浮现,那就是AI时代的超级连接技术,它旨在解决数据传输瓶颈,加速AI智力中心的数据流转效率。

文 / 编辑部 · 2026/06/04 · 阅读约 13 分钟

分享:
AI时代,超高速连接技术CPO:驱动数据中心迈向“光”速未来

伴随2022年底ChatGPT的横空出世,人工智能技术在全球范围内引发了广泛关注。从GPU提供的算力,到存储技术保障的存力,再到CPU扮演的指挥调度角色,AI的发展已经催生了一系列半导体行业的巨大商机,并涌现出众多市值突破万亿美元的公司。

在构建AI基础设施的关键环节中,如果说还有哪个领域潜藏着下一个万亿市值的爆发点,那无疑是AI时代对超高速连接的需求。算力解决了AI的“智商”问题,存力满足了AI的“记忆力”需求,而连接力则致力于让AI的长期和短期记忆以火箭般的速度在“大脑”中高效传输。

正如英伟达首席执行官黄仁勋所指出的,随着计算能力和内存瓶颈的逐步缓解,以及能源问题作为长期挑战持续存在,AI时代下一个核心制约将是网络的高速互联。这是因为传统云计算的网络基础设施,已经无法满足Agentic AI时代数万亿模型参数、混合专家模型(MoE)以及局部激活所带来的巨大网络带宽传输需求。

因此,本文将深入探讨AI网络传输速度提升所引发的光电传输技术变革——共封装光学(CPO)技术,以期揭示AI时代网络传输的新方向。我们对CPO的研究将从以下几个方面展开:

首先,CPO究竟是什么,它能否真正取代传统的铜连接方式?其次,CPO是否能够完全替代目前主流的可插拔光模块?最后,在这一技术趋势下,相关产业链上下游企业的竞争格局将如何演变?本篇文章将首先对这些基本问题进行梳理。

正文:

一、CPO技术解析

传统数据中心架构中,光模块扮演着至关重要的角色。它的功能是将从光纤传来的光信号转换为电信号输送给数据中心,或者将数据中心产生的电信号转换为光信号并传输到光纤中,在数据传输过程中发挥着“桥梁”和“翻译”的作用。

共封装光学(CPO)架构包含了传统光模块的功能,但其设计理念和应用场景存在显著差异:

1、结构上的创新:传统的通用光模块采用可插拔设计,其外观类似于家用网线接口的水晶头。然而,CPO则完全不同,它将负责光电转换的光引擎与芯片(主要是交换机ASIC芯片)直接集成在同一封装基板或中介层上。

2、应用场景的扩展:光模块通常应用于机柜之间的数据互联(Scale-out),而CPO的应用范围则更为广泛,它既可以用于机柜间互联,也可以渗透到机柜内部的互联(Scale-up)之中。在机柜间场景,CPO替代的是传统光模块;而在机柜内场景,CPO则有望取代目前主流的铜连接。

近期,无论是英伟达还是博通,都在积极推动其CPO交换机解决方案。

那么,CPO技术为何会受到如此高度的重视?主要原因在于数据中心对计算能力的需求持续增长,这导致数据传输带宽呈现爆发式增长态势,并且数据中心正朝着超大规模算力集群的方向发展。在这种背景下,现有的传统数据传输技术面临诸多瓶阻碍:

1、带宽瓶颈的挑战:在机柜间场景中,传统交换机面板的空间有限,而可插拔光模块的尺寸难以显著缩小,这限制了单个交换机可提供的端口数量,无法满足日益增长的带宽需求。目前,可插拔模块的单模块带宽最高可达1.6Tbps,单个交换机面板最高支持51.2Tbps。未来虽然可能出现3.2Tbps模块,使交换机最高支持102.4Tbps,但这几乎已是可插拔光模块的极限。

2、信号完整性难题:在机柜内场景,随着传输速率的提升,如果继续使用传统的铜缆,电信号在较长距离传输时将面临严重的衰减和失真,传输距离也受到越来越严格的限制。目前,铜缆最高可支持1.8TB/s带宽(如英伟达的NVLink铜缆),但传输距离严格限制在2米以内,而单个GPU对带宽的需求正迅速逼近3.6TB/s。

3、散热与功耗困境:随着传输速率的提高,传统通信链路的功耗大幅攀升,同时散热问题也变得愈发严峻。考虑到当前美国数据中心建设面临巨大的能源挑战,功耗问题将带来显著的成本压力。

理论上,CPO能够有效解决上述问题。根据英伟达的数据,采用CPO技术后,功率效率可提升3.5倍。

二、数据中心数据传输场景分析

我们将数据中心在不同场景和环节中的数据传输技术路线进行细致划分:

1、Scale-up:主要涉及机柜内部互联。这包括机柜内,特别是服务器内部硬件之间的互联,如CPU、GPU、网卡、DDR内存和硬盘等。目前,这部分连接主要以铜为介质,包含连接CPU、GPU以及网卡的PCIe插槽、内存插槽(PCB铜走线),以及SATA线等各类铜缆。CPO技术有望彻底改变目前的主流方案。

2、Scale-out:主要涉及机柜或服务器与交换机之间的互联。这部分连接主要采用光作为介质,当前方案以光纤和可插拔光模块为主。在此场景下,CPO是重要的发展趋势,并且其进展速度快于机柜内场景。

3、更进一步地,还有数据中心之间以及数据中心与外部的互联,但这不是本文的重点讨论内容。

从业界巨头的布局来看,CPO目前的应用场景主要集中在机柜间互联,但未来有望扩展到机柜内部互联。

三、CPO推广阶段面临的主要瓶颈

CPO技术目前仍处于初步推广阶段,面临的主要挑战包括:

1、先进封装技术的成熟度:从底层技术来看,CPO与可插拔光模块等传统方案存在根本性差异。传统光电子零部件的生产技术与通用光电子元器件及模组并无太大区别,但CPO需要将光引擎封装到基板或中介层上,这主要依赖于CoWoS等先进封装技术。同时,相对于传统意义上的先进封装,CPO还需集成电子集成电路和光子集成电路,这种异质集成需要通过台积电的COUPE等混合键合技术来实现。

然而,上述先进封装技术工艺极为复杂,英伟达和博通等公司都依赖台积电的产能,但产能往往有限。此外,所需的光耦合和设备、混合键合设备、测试设备以及ABF基板等材料的供应也可能存在障碍。现阶段,上述先进封装技术,特别是异质集成的生产良率仍有巨大提升空间,导致其成本远高于可插拔方案。尽管台积电正努力提高先进封装良率,但这仍需一定时间。

2、检修与维护的挑战:对于传统可插拔方案而言,其“可插拔”特性使得检修和维护非常便捷。但CPO则不同,其光电模块与基板、中介层甚至芯片直接封装在一起,这显著增加了检修和维护的难度。不过,这些问题可以通过提高设计容错率、在运营层面布局冗余等方式来解决。

3、热管理问题:光引擎与芯片进行高密度封装,在运行时会导致局部温度显著升高,甚至可能超过激光器的耐受极限。因此,热管理是一个重大挑战。为了解决这一问题,需要引入更高效的散热方案,但这也会相应增加成本。

4、标准化缺失:目前,英伟达、博通等公司为抢占市场先机,积极推出各自独立的CPO交换机方案。然而,行业标准(如接口标准、封装标准等)尚未统一,这使得上下游企业难以基于统一标准进行研发、生产和配置,从而阻碍了商业化推广。总而言之,上述问题均存在解决方案,但都依赖于技术的成熟、标准的制定,这都需要一定的时间。

另一方面,从根本上讲,CPO技术需要在综合成本上形成优势。

这就引出了一个核心问题:无论哪种解决方案,成本始终是关键考量因素。除了CPO,还有其他更先进或更保守的技术路线正在推进中。这些技术路线之间有何关系?我们先区分一下它们的差异。

四、技术路线比较

1、CPO:顾名思义,共封装光学(Co-Packaged Optics)指的是将光引擎和芯片(可以是交换芯片ASIC,也可以是GPU等计算芯片,但通常指交换芯片)封装在同一基板上。

2、NPO:近封装光学(Near-Packaged Optics)是CPO的一个初级版本,尚未达到在同一基板甚至中介层上封装的程度,而是封装在同一块PCB主板上。中国国内如阿里巴巴、华为等都在推动NPO方案,这更多可以看作是在缺乏先进封装产能情况下的妥协方案,但在一定时期内可能成为中国市场的主流方案,这将在一定程度上影响英伟达方案在中国市场的渗透。

3、OIO:光学I/O(Optical I/O)可以看作是CPO的进阶版本,主要与计算芯片相关,而非交换芯片。它指的是将光引擎与计算芯片封装在一起,甚至直接在芯片层面上进行集成,主要面向机柜内部的互联场景。

在此,我们再次明确数据中心的架构:数据中心可以视为由几个相互连接的部分组成:服务器专注于计算任务,内部装载GPU、CPU等计算芯片、内存、硬盘等;交换机则负责服务器之间以及服务器与外部的网络通信,通过ASIC芯片实现数据交换;此外还有存储系统,在目前主流数据中心架构中,存储器主要分散布置在服务器节点,并放置在服务器内部,与服务器结合在一起。

基于上述架构,我们可以想象CPO的应用场景。那么,为什么CPO会率先从交换芯片开始应用呢?我们将交换机比作数据中心内部的立交桥,因此其所承受的数据传输带宽压力、端口密度以及伴随的功耗瓶颈是最大的,这使得对CPO的需求也最为迫切。

4、CPC:共封装铜互联(Co-Packaged Copper)指的是将高速铜连接器直接集成在封装基板上。这种技术路线的成本优势非常明显,但仍无法解决铜介质的带宽瓶颈和衰减问题,因此应用场景受到限制。它可以在机柜内部的GPU/CPU节点与交换机及存储芯片之间进行部分应用。目前,英伟达的机柜内方案仍采用铜连接,但未来可能会转向光互联。

5、LPO:线性驱动可插拔光学(Linear-Drive Pluggable Optics)是一种精简版的可插拔光学模块,它通过去除内部的DSP/CDR芯片,仅保留并强化模拟芯片驱动器(Driver)和跨阻放大器(TIA),实现了信号的直驱。简而言之,就是在光模块中直接移除高功耗的DSP芯片,放弃信号纠错功能;同时强化模拟芯片,无论信号准确与否,都通过模拟放大,直接让交换机ASIC的电信号来驱动激光器。

然而,这也存在问题。由于PCB走线并未省略(会造成信号衰减),同时对信号质量的要求更高,因此长距离传输仍然受到限制。当速率迈向更高维度(1.6T以上)时,信号完整性问题会格外突出。也就是说,简化结构的同时,性能上也会有所牺牲。综上所述,尽管存在NPO、CPC、LPO等折衷路线,但随着数据中心向更高速率和更大规模集群发展,这些折衷方案总会面临瓶颈。CPO是未来必须要突破的下一代方案。

6、光电路交换机(OCS)会威胁CPO的地位吗?

谈到这里,不可避免地会涉及到光电路交换机(OCS)。OCS这种交换机的核心特点是全过程不进行光电转换,而是通过光开关矩阵直接在光域内建立物理光路。直观地想象,它就像由一排排反射镜(微镜阵列)组成,可根据指令调整反射镜角度,向不同方向反射光线。

表面上看,OCS直接转发光信号,取代了传统交换机的光-电和电-光转换过程,似乎有了这种技术路线就不需要CPO了(至少在交换机环节不需要CPO)。但实际情况并非如此。

我们来梳理一下数据中心中交换机的架构是如何构建的:

(1)主板内部:首先,数据中心内最核心的计算是通过GPU实现的。GPU计算完成后,需要将数据传递给CPU,CPU处理后,再传递给网卡(内含ASIC),或者GPU也可以直接传输给网卡。这些环节都可以在一块主板上实现,或至少在同一台服务器内完成。

(2)机柜内部:接着,数据需要从服务器传递到机柜的交换机上。一个机柜内可以有多台服务器进行高速互联,但机柜顶部必须有一个交换机,即ToR(Top of Rack)交换机,用于与外部通信,实现机柜内部数据与外部数据的交换。以上环节在同一机柜内实现。

(3)机柜之间:数据中心由多个机柜组成的集群,机柜与机柜之间的通信如何调度?这就需要Spine交换机发挥作用。Spine交换机负责管理所有Leaf交换机之间以及与数据中心外部的高速连接,它是数据中心内整个交换机网络的枢纽。

OCS主要用于替代Spine交换机。首先,Spine交换机价格高昂且功耗大,替代方案需求最为迫切。其次,OCS的作用是有限的,它只能转发信号(反射光线),就像反光镜。但传统交换机功能更完整,需要拆解数据包,查看IP地址,然后决定转发方向。因此,由于OCS只能执行指令,没有判断能力,在这种情况下,它只被用于充当Spine交换机是可行的。但如果想替代Leaf交换机,就需要新增其他部件来执行“封包处理”功能,比如智能网卡(SmartNIC),这样架构就变得复杂了,可能不是最佳方案。

如此看来,架构就非常清晰了:尽管现阶段英伟达推出的Quantum X800-Q3450、博通推出的Tomahawk 6 - Davisson等CPO路线的交换机都是Spine交换机,而谷歌推动的OCS交换机替代的也是传统Spine交换机,两者之间确实存在直接竞争关系。但从终局来看,虽然OCS有机会替代Spine交换机,但再往下,对于用量更大的Leaf交换机上光引擎与ASIC芯片之间的电光转换,到服务器内主板与主板之间的连接(通过网卡ASIC或NVSwitch等),再到主板上计算芯片与计算芯片之间以及计算芯片与网卡ASIC之间的连接,仍然需要使用CPO。因此,未来两者更多是相辅相成的关系。

五、涉及的产业链环节

(一)首先解析CPO的原理和架构

CPO可以看作是升级版的光引擎,而光引擎的作用是进行光电转换,它主要包括以下几个部分:

1、光子电路部分:

(1)调制器:通过控制光的强弱和信号,将电信号(0/1数字)转换为光信号。

(2)探测器:即PD(Photodiode,光电二极管),用于将光信号转换成电信号。

(3)波导:可以理解为芯片内部印刷的微型光纤。

2、电子电路部分:

(1)驱动器(Driver):将交换机或服务器传来的微弱电信号放大,使其能精确控制激光器发光的电信号。因此,Driver的下一个环节是调制器。

(2)跨阻放大器(TIA):将PD产生的极其微弱的电信号放大,并转换成可供后续电路处理的电压信号。因此,TIA是PD的下一个环节。

3、光源:即激光器。调制器本身不能发光,但能控制光,所以需要一个能发光的部件(激光器)与之配合。

此外,还有两个部件:

4、DSP和CDR:它们都用于修复电信号。DSP用于补偿电信号的物理损伤,CDR用于从受损信号中提取精确时钟,并重整数据时序。其中,DSP芯片通常集成了CDR功能。

CPO与LPO的一个相似之处在于,它们都将高功耗、高成本且带来延迟的DSP从光引擎中移除。但在CPO方案下,DSP的部分功能集成到了交换ASIC中,而LPO则采用模拟芯片直接放大的方案。此外,CPO会将CDR集成到高速SerDes中。高速SerDes包括串行器(Ser)和解串器(Des),它们位于ASIC芯片内部,分别用于将芯片内部并行数据打包成高速串行数据流,或将高速串行数据流解包还原成多路低速并行数据。

(二)再看整个CPO产业链涉及的环节:

1、首先是CPO整体的制造和供应:

CPO中的光引擎包含了上述光子电路部分和电子电路部分,然后光引擎与ASIC芯片构成了CPO交换机的主体部分。这里先提出一个核心问题:谁来负责制造CPO?

传统光模块作为由光学组件、分立器件等组成的独立模块,可以由专业生产厂商完整提供,比如中际旭创、新易盛、Coherent等知名企业。然而,CPO显然不能再由它们来主导了。

我们倾向于认为,CPO的产业价值链将呈现以下走向:

(1)掌握核心技术的交换机厂商和平台商:如英伟达、谷歌、博通、Marvell等数据中心系统平台方和交换芯片厂商,将主导架构和标准的定义,并提供整套产品。

(2)代工厂:台积电、日月光半导体、艾克尔科技等晶圆制造厂和封测厂,将承担晶圆制造、光电集成和先进封装的代工任务。

(3)上游供应商:Coherent Corp.、Lumentum控股等器件厂商将继续生产和供应光电器件。

(4)传统光模块厂商:中际旭创、新易盛等企业在过渡期内将提供NPO、LPO等中间路线,以及基于可维护性考量的折衷CPO设计方案,继续供应光引擎模块。

2、除了CPO的核心光引擎之外,还有几个关键组件需要关注:

(1)激光器:CPO只能集成光电转换部件,直接集成激光器仍存在难度,因此仍需外置激光器。同时,CPO对激光器的功率要求大幅增加(至少增加3-4倍),对应性能和可靠性要求也大幅提高,因此其价值量也会显著增加。

广告位 · 文末横幅