

光互连正成为AI数据中心的关键瓶颈,铜缆传输已逼近物理极限,光纤凭借高带宽、低功耗、长距离优势全面替代,驱动光模块及CPO(共封装光学)技术爆发。CPO通过将硅光芯片与GPU共封装,重构互连架构,催生硅光PIC、SOI衬底、InP衬底、外部激光器等上游瓶颈环节需求,形成万亿级增量市场。
整理 & 编译:深潮 TechFlow
主持人:Nico
原标题:AI 光互连:被 GPU 光芒掩盖的下一个万亿赛道?
播客源:Nico 前沿 Alpha
播出时间:2026年 5月 8 日
光互连正在从 GPU 的“配套零件”变成 AI 数据中心的核心瓶颈,当单机柜、跨机柜乃至超级节点需要成百上千块 GPU 协同工作时,真正决定算力利用率的,不再只是芯片本身,而是 GPU 之间的数据传输能力。
本期播客以产业链投研视角,把光模块、硅光 PIC、CPO、外部激光器、InP 衬底、SOI 衬底、代工与封装测试串成一张图,并给出从 AVGO、MRVL、GLW 到 COHR、LITE、TSEM,再到 SIVE、AAOI、AXTI、IQE、Soitec 的分层配置框架。
这期内容最值得关注的不是单一股票推荐,而是一个判断,即 AI 基建竞争正在从“谁有更多 GPU”延伸到“谁能锁定更稀缺的光互连供应链”,CPO (共封装光学)可能是其中最大的增量变量。
过去两三年,几乎所有人都在讨论 GPU 和算力。自从 ChatGPT(OpenAI 推出的生成式 AI 产品,引爆大模型应用浪潮)诞生、AI 科技革命爆发之后,英伟达股价在三年时间里翻了 15 倍,算力成为 AI 大模型绕不开的关键词。以 GPU 为核心的半导体产业链,也迎来了跨越经济周期的全盛时期。
但在过去一年里,有一个和 GPU 一样关键、甚至更稀缺的环节正在悄悄爆发。在大规模数据中心部署中,即使一块英伟达 GB300 GPU 加速卡算力再强,如果它没法和其他几千块 GPU 高速通信,大部分算力也会被浪费。互连带宽不够,买再多 GPU 也是事倍功半。这个负责让几千块 GPU 高速通信的环节,就是光互连。
根据 LightCounting(光通信领域研究机构)的数据,2024 年全球光模块市场规模翻了一倍,达到 154 亿美元;2025 年继续增长 55%,达到 238 亿美元。在乐观情境下,LightCounting 预计到 2030 年,整个光互连产业链总市场规模将突破 1,100 亿美元。

但这条产业链上的公司,大部分投资者可能连名字都没听过。SIVE/SIVEE 年营收约 3,000 万美元,从 2026 年开年到现在涨了 10 倍;TSEM(Tower Semiconductor,以色列特种代工厂)被市场称为“光互连领域的台积电”,70% 产能已经被预订到 2028 年;COHR(Coherent,光学和材料领域垂直整合公司)年营收约 58 亿美元,获得英伟达 20 亿美元战略投资。
今天这期内容,会把光互连这条产业链从头到尾拆清楚。光互连是什么,光模块里面有什么,下一代技术路线是什么,产业链关键瓶颈在哪里,每家公司处于什么位置,以及投资者如何按照自己的风险偏好配置这条赛道。
在讨论具体公司之前,先要解释一个问题,为什么光互连会突然成为 AI 基建里最关键、最稀缺的环节之一?这要从 AI 如何工作讲起。AI 的工作分为两个阶段:训练和推理。
训练,就是把大量文本、图片、代码喂给模型,让模型根据已有内容不断学习和进化。一个大模型的训练参数可能达到万亿级别,任何单块 GPU 都无法容纳,所以必须把它拆成几千份,分布在几千块 GPU 上并行计算。每块 GPU 算完自己负责的部分之后,还必须把中间结果传给其他 GPU,大家协同完成整个任务。
推理,就是 AI 调用已经学到的知识来产出答案。你问 ChatGPT 一个问题,它几十秒后给你回答,这就是推理。很多人以为推理只是一块 GPU 回答一个问题,不需要互连。2023 年可能还接近这个状态,但到 2026 年就完全不同了。
AI 已经从简单的一问一答,进化到深度推理和 Agentic AI(智能体式 AI)。用户交互对象不再只是简单的聊天机器人,而是复杂的 Agent(智能体),背后可能要规划任务、执行多步推理、查询多个数据源。每一次交互背后,可能是几百甚至上千块 GPU 在协同工作。不管是训练还是推理,只要涉及协同工作,GPU 之间就必须高速交换数据,这条数据通道就是互连。
过去互连主要用铜缆,传的是电信号;现在,这条通道正在慢慢被光纤替代,传递光信号。铜缆不够用,主要有三个原因。
第一,铜缆传输速度已经接近物理极限。无论怎么优化材料和制程,单根铜线能承载的带宽已经到顶,就像双车道公路再怎么拥堵,也只能两辆车并排跑。第二,距离越远,信号越差。铜缆超过几米就会开始衰减和出现干扰,而 AI 数据中心里的连接距离动辄是几十米、几百米,铜缆已经撑不住。第三,铜缆更耗电。GPU 每一代功耗都在上升,H100 是 700 瓦,B200 升级到 1 千瓦,GB300 还会更高。在这种功耗等级下,GPU 之间的铜缆连接本身就可能消耗大量电力。
光纤则完全不同。一根光纤的带宽可以达到铜缆的几十倍,传输距离达到几公里也没有问题,能耗低到可以忽略。光纤还可以同时传输多个不同波长的光信号,就像一条高速公路分成 8 个车道,每个车道跑不同颜色的光,互不干扰。一根光纤,相当于顶上几十根铜缆。
光在数据中心里的使用,不是突然冒出来的新东西,而是经历了几个非常清晰的阶段。每一个阶段,光覆盖的范围都在向芯片方向逼近。
第一个阶段是在 2020 年之前。那时光更多用于数据中心之间,例如云厂商在北京和上海各有一个数据中心,中间相隔一千多公里,必须用光纤连接。但在数据中心内部,服务器与服务器之间更多还是用铜缆。
第二个阶段是 2023 到 2024 年。ChatGPT 在 2022 年底引爆 AI 科技革命,第二年 GPU 卖爆,但光模块市场一开始并没有明显启动。原因是当时英伟达 GPU 集群主要还是用铜缆,光模块不是核心组件。更糟糕的是,2023 年年初云厂商因经济衰退恐慌削减资本开支,Meta(Facebook 母公司,全球主要云和 AI 基建买方之一)甚至砍掉超过一半光模块部署计划。
真正的转折点出现在 2024 年。云厂商的 GPU 集群从几百块扩张到几千块,甚至上万块,铜缆几米级的传输距离彻底扛不住。英伟达在参考架构里把铜缆换成可插拔光模块,这个架构层面的切换引爆市场,2024 年光模块市场规模翻倍。
第三个阶段是 2025 年到现在。英伟达 Blackwell(英伟达新一代 AI GPU 架构)开始大规模部署,功耗更高、互连带宽需求更大,光模块需求进一步暴增。与此同时,五大云厂商前九个月资本开支合计超过 3,000 亿美元,创下历史新高,光模块需求一度超过供给两倍以上,出现严重供需不平衡。今年 3 月,英伟达又向 Lumentum 和 Coherent 各投 20 亿美元。GTC 2026(英伟达年度开发者大会)上,英伟达展示 CPO 方案和下一代 Rubin 架构的光互连设计,等于宣告光互连从小众赛道变成 AI 基建主线叙事。
进入投研正文前,要先讲几个基础概念。第一个是光模块。GPU 芯片本身只识别电信号,而光纤里跑的是光信号,两者语言不同,需要一个翻译器,把电信号翻译成光信号发出去,收到光信号之后再翻译回电信号。这个翻译器就是可插拔光模块。
光模块大概是 U 盘大小,一头插在服务器网卡上,另一头接光纤。大型 AI 数据中心里,可能有几万甚至十几万个这样的“小盒子”。这里有一个很容易误解的概念:光模块负责的是不同机柜之间的通信,不是机柜内部 GPU 之间的通信。
以英伟达 GB300 NVL72(英伟达整柜级 GPU 系统)为例,一个机柜内有 72 块 GPU,GPU 之间通过 NVLink 和 NVSwitch(英伟达高速 GPU 互连技术与交换芯片)互连,全部走铜线电信号,距离只有几十厘米到一两米,不需要光。只有当数据从一个机柜跑到另一个机柜,距离达到十几米、几十米甚至更远时,才需要光模块。
在完整 AI 集群里,光模块通常插在两个地方,服务器网卡上,以及交换机上。每根光纤两头都要插一个光模块。GPU 越多,机柜越多,机柜之间连接需求越大,光模块需求也越大。光模块产业链和 GPU 产业链不是独立赛道,而是 GPU 出货量直接驱动光模块需求。
一个 U 盘大小的光模块里,通常有五个核心组件:激光器芯片、调制器芯片、探测器芯片、DSP 芯片,以及透镜和光纤耦合组件。
第一是激光器芯片。它的功能是发光,持续发出一道稳定激光,作为光信号载体。激光器就像一个微型手电筒,比指甲盖还小,但发出的光非常精准和纯净。激光器最关键的是材料。GPU 和 CPO 用的是硅,而激光器用的是磷化铟(InP)或砷化镓(GaAs)。硅天生不擅长发光,InP 和 GaAs 这类化合物半导体的原子结构更适合产生光子,这也解释了为什么激光器芯片不是台积电这类硅基代工厂在做。
第二是调制器芯片。激光器发出来的光本身不携带信息,只是一道“空白的光”。调制器的功能,是把电信号写到光上。GPU 传过来的是 0 和 1 的二进制电信号,调制器要控制激光亮灭或强弱,用光表达 0 和 1。继续刚才的比喻,激光器是一直亮着的手电筒,调制器就是控制手电筒开关的那只手,每秒钟按几百亿次。有些时候,调制器会和激光器在同一颗芯片上,叫 EML(Electro-absorption Modulated Laser,电吸收调制激光器),相当于把手电筒和开关合成一个零件。
第三是探测器芯片。调制器负责把电信号转成光信号,这是发送过程;接收端还要把光信号再转回电信号,这就需要探测器。它就像接收端的耳朵,看到光亮就输出 1,没看到光就输出 0。探测器通常也使用 InP 或 GaAs 材料体系。
第四是 DSP 芯片(Digital Signal Processor,数字信号处理芯片)。它相当于光模块里的大脑,负责纠错、编码和均衡信号质量。光信号传输过程中会有噪音和失真,就像在车流嘈杂的大马路上打电话,对方说的话可能听不清。DSP 会在发送端用特殊方式编码,在接收端清理噪音,确保还原出来的 0 和 1 与原始数据一致。DSP 是硅基芯片,和 GPU、CPO 处在同一套半导体工艺体系里,通常由台积电等硅基代工厂制造。
800G 和 1.6T 指的是光模块传输速度。800G 是每秒传输 800 Gigabit 数据,1.6T 是每秒 1.6 Terabit,速度直接翻倍。光模块从 400G 到现在主流的 800G,再到正在部署的 1.6T,速度越快,芯片设计难度越高,DSP 的成本和设计难度也越高,有时甚至比激光器更贵。
第五是透镜和光纤耦合组件。它要把激光器发出的光精准对准光纤入口。激光器发出的光束很细,光纤芯也很细,只有头发丝的十分之一,对准精度要求是微米级。可以想象成用一根针往另一根针的针眼里穿线,而且要在工厂流水线上自动完成几百万次。
五个组件串起来,光模块的工作流程就很清楚。GPU 传输电信号,先进入 DSP 做编码纠错,再到调制器;调制器把电信号写到激光器发出的光上;光通过透镜进入光纤,跑几十米到几百米;到达另一头后,光从光纤出来,通过透镜对准探测器;探测器再把光变回电信号,交给另一头 DSP 解码纠错,最后送到另一块 GPU。
很多人下意识会觉得,芯片不就是台积电造的吗,光模块里的芯片应该也差不多。但真实情况完全不同。一个光模块里有两类完全不同的芯片,对应两种完全不同的材料,也在两类工厂里完成制造。
第一类是 DSP 芯片,也就是光模块里的大脑,负责纠错编码。它是硅基芯片,和 GPU、CPO 使用类似制造工艺,由台积电等硅基代工厂制造。DSP 设计公司主要包括 AVGO(Broadcom,博通,通信芯片和定制 AI 芯片巨头)、MRVL(Marvell Technology,迈威尔科技,数据中心和网络芯片公司)以及 CRDO(Credo,数据互连芯片公司)。
第二类是光学芯片,包括激光器、调制器和探测器,这些组件用 InP 这类化合物半导体材料做。部分公司会自己包揽设计和制造,例如 LITE(Lumentum,光通信器件和激光器厂商)、COHR(Coherent,光学材料与器件公司)和 AAOI(Applied Optoelectronics,美国光模块和光器件公司)。也有专门做激光器设计的小公司,例如 SIVE/SIVEE,把最难的激光器做到极致,再交给代工厂制造。
光学芯片不能直接交给台积电造,因为台积电整条产线、设备、化学品和工艺参数都是为硅设计的。InP 是完全不同的材料,晶圆尺寸、刻蚀化学品、生长温度都不同,放到台积电产线上根本跑不了。因此,光学芯片有自己独立的制造体系。
理解光学芯片制造,必须先理解两个概念:衬底和外延。衬底是所有光芯片制造的起点,是一块特殊薄片,后面所有功能结构都在它上面生长。打个比方,如果要种出一棵能发光的激光树,不能把种子丢到普通沙地上,而需要一块特殊土壤,分子结构必须和种子匹配,种子才能扎根生长。普通硅就是沙地,不适合发光;InP 就是那块特殊土壤。
衬底质量直接决定上面所有结构的质量。如果衬底里有一个原子级缺陷,这个缺陷会像裂缝一样一层层向上传递,导致激光器芯片不达标,光模块无法投入生产。制造高纯度 InP 衬底极其困难,全球能稳定做到这个水平的工厂只有少数几家。
有了衬底,还不能直接做芯片,还要在衬底上面一层一层种出功能层,这个过程叫外延生长。激光器之所以能发光,不是因为衬底本身发光,而是因为衬底上生长出的特殊结构能发光。电流通过外延层时,电子和空穴复合释放光子,这就是激光来源。
外延层每一层只有几个纳米厚,几十层叠在一起像千层饼。每一层的成分、厚度和掺杂浓度都有极高精度要求,差一个原子层,光的波长就会偏移,激光器就不能使用。
InP 衬底由 AXTI(美国化合物半导体衬底供应商)提供,外延由 IQE/IQEE(英国化合物半导体外延片供应商)完成。外延做完后,激光器芯片制造有两条路线:一种是 Fabless(设计与制造分离),例如瑞典 SIVE/SIVEE 做激光器设计,再交给台湾 Win Semi(稳懋半导体,化合物半导体代工厂)代工;另一种是 IDM(Integrated Device Manufacturer,设计制造一体化),例如 LITE、COHR、AAOI 从外延、激光器、调制器、探测器到光模块组装都自己做。
因此,一个光模块制造横跨两套完全不同的半导体工艺体系,InP 化合物半导体做光学芯片,硅做 DSP 芯片。两者互不兼容,不能放在同一条产线做。任何一个环节产能卡住,整个光模块都出不了货。
这也解释了为什么光学公司不轻易下场做 DSP,数字芯片公司也不轻易下场做激光器。光学芯片设计和数字芯片设计是两门完全不同的专业。光学工程师懂激光物理、光波导理论、量子阱结构;数字芯片工程师懂逻辑电路和数字信号处理算法。二者技能不重叠,就像心脏外科医生和脑外科医生都是外科医生,但不能随意互换手术。
光互连产业链最有意思的地方就在这里。它不像 GPU 那样由英伟达一家通吃,而是一个分工极其精细、瓶颈极其分散的产业链。也正因为这种分散,普通投资者才有机会找到被市场忽视的小公司。
可插拔光模块只是当前方案。更值得注意的是,这条产业链即将迎来一次根本性重构。一项叫 CPO 的下一代技术,正在把整个光互连架构推倒重来。
CPO 的全称是 Co-Packaged Optics,中文叫共封装光学。它解决的问题是光模块离 GPU 太远。现在的标准方案是,光模块作为一个可插拔小盒子插在服务器背面,GPU 产生的电信号要先跑几十厘米铜线到服务器背面,再在光模块里转换成光信号。这几十厘米铜线会造成能量损耗、延迟和发热。AI 集群密度越来越高,这点损耗被放大几十万倍后,就会变成严重问题。
CPO 的思路,是把光学元件从服务器背面搬进芯片封装内部,紧贴 GPU 或交换芯片,让电光转换距离从几十厘米缩短到几毫米。打个比方,现在的方案是饭和汤分开放,GPU 在饭盒里,光模块在单独水杯里;CPO 是把汤倒进饭盒的一个独立隔间,饭和汤仍然分开,但住在同一个盒子里,距离只有几毫米。

但把光学元件搬进芯片封装内部,有一个巨大障碍:传统光模块里的光学芯片用 InP,GPU 用硅,InP 和硅的封装工艺不兼容,不能把 InP 芯片和硅基 GPU 简单做在同一个封装里。解决方案就是用硅来做光学芯片,这就引出硅光 PIC。
PIC 是 Photonic Integrated Circuit 的缩写,中文叫光子集成电路。我们熟悉的 IC 是把几十亿个晶体管集成在一颗芯片上做计算;PIC 是类似思路,只不过集成的不是晶体管,而是光学元件。硅光 PIC 把调制器、光波导、探测器这些功能集成到一颗硅基芯片上。因为它是硅基的,所以可以用类似 GPU 的封装技术集成在一起,这是 InP 光学芯片做不到的。
硅光 PIC 使用的不是普通硅片,而是 SOI(Silicon-On-Insulator,绝缘体上硅)这种特殊三明治结构硅片。在衬底和顶层硅之间加一层绝缘层,光信号可以在顶层薄硅里传播,不会漏到下面。普通硅片是一整块实心材料,光进去后会到处跑,无法控制;SOI 中间那层绝缘层像一面镜子,把光反射回顶层,让光沿着设计好的通道走。
SOI 衬底这个细分领域,法国 Soitec(法国 SOI 衬底供应商)是核心供应商之一,市场地位接近垄断。硅光 PIC 的代工方主要是 TSEM,也就是 Tower Semiconductor。TSEM 在 SOI 衬底上加工硅光芯片,使用改良过的 CMOS 工艺,这套工艺台积电并不熟悉,TSEM 在这个细分领域反而是份额最高的代工厂。
但硅有天然缺陷,它不会发光。因此硅光 PIC 只能操控光,不能产生光,光源仍然需要 InP 激光器提供。这就形成 CPO 的核心结构,封装内部放一颗硅光 PIC,负责调制、传输、探测等操控光的环节;它通过先进封装技术和 GPU 并排放在同一个封装基板上,距离只有几毫米,类似 HBM 内存坐在 GPU 旁边。
硅光 PIC 旁边还会有一颗驱动芯片,负责在 GPU 电信号和硅光 PIC 光信号之间做转换。它也是硅基芯片,本质上是传统光模块中 DSP 的大幅简化版。因为 CPO 的电光转换距离只有几毫米,不需要 DSP 那套复杂纠错编码,一个简单驱动器就够了。
封装外部则放一个激光器作为外部光源,英文叫 ELS(External Laser Source)。激光器通过光纤把光送进封装内部的硅光 PIC。激光器不直接放进封装里,是因为 InP 激光器发热量大,和 GPU、硅光 PIC 挤在一起会出问题;而且激光器寿命有限,如果集成在封装内部,坏了就意味着整块价值几万美元的芯片报废。把激光器做成外部可插拔形态,坏了可以直接更换,不影响芯片本身。
CPO 真正颠覆的,不是光模块里的某个组件,而是光模块这个产品形态本身。现在可插拔光模块是一个独立小盒子,里面装着激光器、调制器、探测器和 DSP。CPO 相当于把这个盒子拆散:硅光 PIC 直接封装到芯片内部,激光器变成独立外部光源,DSP 被大幅简化甚至去掉,服务器背面那个小盒子不再需要。这不是对现有产品的升级,而是一次架构层面的重构。
CPO 的概念已经存在很多年,为什么突然在 2026 年成为热门投资主题?高盛发布报告称,光互潜在市场规模将从目前约 150 亿美元扩张到 2028 年 1,540 亿美元,增长约 9 倍,其中 CPO 占 910 亿美元。核心原因只有一个,英伟达下一代架构把 CPO 从可选项变成了必须项。

当前 GB300 NVL72 系统中,72 块 GPU 组成一个机柜,机柜内部 GPU 之间仍然用铜缆连接。但随着 AI 集群规模扩大到几百甚至上千块 GPU,机柜之间的网络连接成为瓶颈。英伟达在下一代 Rubin(英伟达后续 AI 平台代号)平台上,为机柜之间的网络交换机引入 CPO 方案,替代传统可插拔光模块。这是英伟达第一次在自己的平台里正式采用 CPO。
再到下下一代 Feynman(英伟达更后续 AI 平台代号),CPO 甚至可能进入机柜内部 GPU 互连。也就是说,光正在一步一步从机柜之间逼近 GPU 之间。Lumentum 的 CEO 在最新财报电话会上也确认,CPO 将出现大规模供需失衡,需求远远超过供给;CPO 是 Lumentum 最大的单一增长驱动力,而且仍然处于非常早期阶段。
从行业数据看,CPO 市场当前实际出货量还很小,2026 年大约只有 1.6 亿美元,主要是样品和小批量。但如果高盛预测兑现,到 2028 年会膨胀到 910 亿美元,这是一条从零到千亿美元的爆发式曲线。英伟达已经在 2026 年初开始量产 CPO 交换机,博通在 2025 年 10 月向客户交付 CPO 相关产品,台积电推出 COUPE(台积电 CPO 先进封装方案)封装方案。英伟达和博通都在采用 CPO,说明它不再是远期概念,而正在变成现实。
不过,CPO 不会在短期内完全替代可插拔光模块。CPO 主要解决超高密度 AI 集群内部连接需求,例如英伟达超级节点内部的 GPU 互连;数据中心仍然有大量其他连接场景,包括机柜到交换机、交换机到交换机、数据中心到数据中心,这些场景在可预见未来仍会使用可插拔光模块。因此,更准确的关系是,CPO 开辟了一个新的、可能远大于可插拔光模块的市场,而不是简单替代现有市场。两者会在不同场景下共存。
如果 CPO 未来真的爆发,甚至出现超级周期,最受益的产业链环节大致有五个。

第一是硅光 PIC 代工。CPO 架构强制使用硅光 PIC,因为只有硅基芯片才能和 GPU 做先进封装。能够做硅光 PIC 代工的厂商非常少,产能会成为最紧缺瓶颈之一。
第二是硅光衬底。每一颗硅光 PIC 都需要 SOI 衬底,CPO 带动硅光 PIC 需求暴增,也会带动 SOI 衬底需求暴增,而 SOI 衬底几乎是全球垄断市场。
第三是外部激光器以及背后上游供应链。CPO 创造出一个新产品品类:传统可插拔光模块把激光器集成在盒子内部,而 CPO 架构下激光器必须独立出来,做成外部光源。此前这个市场几乎不存在。
这里还有一个关键的工序错配。大型激光器厂商现有产能主要在生产 EML 传统激光器,这种激光器把发光和调制集成到一颗芯片上,用于可插拔光模块,订单合同已经签到 2027 至 2028 年。但 CPO 需要的是更简单的激光器,只负责发光,不负责调制,因为调制工作交给封装内部硅光 PIC。两类激光器虽然都用 InP,但设计不同、产线不同,没法无缝切换。大厂产能被传统激光器合同锁死,连 Lumentum 自己都要到公开市场采购 CPO 用激光器,溢出需求就会流向独立激光器供应商。
激光器需求暴增会继续传导到上游。更多激光器意味着更多 InP 衬底和更多外延片。高盛报告警告 InP 衬底供应紧张可能持续到 2027 年。
第四是封装和组装。CPO 本质上是封装挑战,需要把硅光 PIC 和电子芯片精密集成在一起,精度要求非常高。能够做到 CPO 级封装和组装的厂商未来会很稀缺。
第五是测试和检验。每一颗硅光 PIC 出厂前都需要做光学性能测试和可靠性验证。CPO 测试比传统光模块更复杂,因为它涉及光学和电子混合验证,这个环节也会随着 CPO 放量快速增长。
总结来说,CPO 需求爆发之后,受益最大的是硅光代工、硅光衬底、外部激光器、InP 衬底和外延、封装组装、测试检验这些瓶颈环节。

从上游到下游看,衬底层最重要的两家公司是 AXTI 和 Soitec。两家公司服务不同技术路线,不是竞争关系,而是配合关系。AXTI 服务激光器产业链,负责发光;Soitec 服务硅光产业链,负责操控光。光互连需要两者配合。
AXTI 是美国一家做 InP 和 GaAs 衬底的公司。它的工作是把铟、磷、镓、砷等稀有元素提纯、合成、拉成单晶锭,再切成薄片。AXTI 的不可替代性在于,全球能做高质量 InP 衬底的公司屈指可数,除了 AXTI,还有日本住友电工、德国 Freiberger 等少数厂商。AXTI 的护城河是材料纯度工艺积累、几十年 know-how,以及很长的客户认证周期。下游如果换供应商,需要重新验证整条产品线,切换成本很高。
CPO 不会绕过 InP 衬底,反而会放大需求。CPO 架构下,每个 GPU 需要外部激光器,激光器数量与 GPU 数量直接挂钩。更多激光器意味着更多 InP 衬底。因此,CPO 对 AXTI 是明确利好。AXTI 的投资属性是小市值、高波动,需求传导有滞后,但一旦传导到订单,股价弹性可能很大。
Soitec 是法国巴黎上市公司,做 SOI 硅光衬底。Soitec 在硅光专用 SOI 衬底领域具有压倒性市场地位,并发明了 Smart Cut(Soitec 的 SOI 晶圆制造技术)专利技术。CPO 的核心是硅光 PIC,而每一颗硅光 PIC 都需要 SOI 衬底,所以 Soitec 是 CPO 超级周期中确定性很强的受益者之一。它当时估值约为 1.4 倍账面价值,对于一个全球垄断者来说偏低。需要注意的是,Soitec 在巴黎交易所上市,不在美股。
往下是外延层。全球重要的独立外延供应商是 IQE/IQEE,它在伦敦上市。IQE 的护城河在于外延本身难度极高。外延是在衬底上像千层饼一样一层层生长功能层,每层只有几个纳米,任何材料、温度、生长时间的微小偏差都可能导致激光器报废。这些参数组合就是外延配方,IQE 在这些配方上积累了几十年,不是砸钱能短期复制的。
CPO 爆发后,IQE 与 AXTI 的逻辑类似,CPO 放大激光器需求,更多激光器需要更多外延片。IQE 的风险在于客户集中度较高,LITE 是其重要客户之一。如果 LITE 未来决定自己做外延、推进垂直整合,IQE 的最大收入来源可能受冲击,这是投资前必须注意的单点风险。
继续往下进入芯片层,这一层最稀缺的环节是激光器。核心公司包括 SIVE/SIVEE、LITE、COHR 和 AAOI。
SIVE/SIVEE 是过去一年涨幅最猛的光互连标的之一它是一家瑞典上市小公司,市值约 15 亿美元,年营收约 3,000 万美元。它走偏 Fabless 路线,拥有自己的 InP100 平台和英国格拉斯哥小型晶圆厂,具备一定制造能力,同时也与台湾 Win Semi 合作,把激光器设计交给成熟代工产能扩大高功率激光器量产。
SIVE/SIVEE 有五个核心优势。第一是 InP100 标准化平台,把激光器核心模块标准化,可以像搭积木一样快速组合不同规格产品;第二是晶圆级测试,不需要先切割再逐颗测试,而是在晶圆上直接测试每颗芯片,提高良率、降低成本;第三是同时覆盖当前和下一代技术,可插拔光模块激光器和 CPO 外部光源都有产品;第四是多赛道并行,除了 AI 数据中心光互连,还做 LiDAR(激光雷达)、卫星通信和国防,分散单一市场风险;第五是轻资产扩张模式,小工厂做核心验证和小批量,大规模量产调用 Win Semi 产能,不需要重资产建厂,同时保留核心制造能力。
SIVE/SIVEE 是 CPO 超级周期中弹性很大的标的。原因之一是大厂产能被传统激光器订单锁死,CPO 外部光源溢出需求需要由独立激光器供应商承接。另一个原因是,它已经嵌入多个 CPO 项目供应链。AMD 的 CPO 方案通过 GlobalFoundries(格芯,全球晶圆代工厂)平台推动,SIVE 是其生态内少数激光器供应商之一;Marvell 旗下 Celestial AI(硅光互连初创公司)、Ayar Labs(CPO/硅光互连初创公司)等也是其客户。
但 SIVE/SIVEE 风险也很明显,营收太低,客户大多还处于开发和验证阶段,没有进入正式大规模量产。如果任意两三家客户兑现,股价可能继续上涨;如果客户延迟或取消,股价也可能大幅回撤。可以把它理解为一张高赔率彩票。
LITE,也就是 Lumentum,是激光器 IDM 路线代表。它既做激光器设计,也做制造,同时做完整光模块组装。LITE 最核心看点是英伟达 20 亿美元战略投资和数十亿美元采购承诺,直接锁定其产能。同时,LITE 与 Google TPU(谷歌自研 AI 加速芯片生态)深度绑定,Google AI 数据中心大量使用 LITE 的光路交换技术和激光器。
LITE CEO 在财报会上讲了三句关键判断:CPO 将出现大规模供需失衡;CPO 是 Lumentum 最大的单一增长驱动力;CPO 仍处于非常早期阶段。这相当于行业一线 CEO 亲口确认 CPO 超级周期。LITE 产能已经被预订到 2028 年,护城河是英伟达和 Google 双重大客户绑定。风险在于,产能被英伟达锁定,也意味着短期上限被锁定,营收主要取决于英伟达订单,公司主动权有限,增长曲线没有 SIVE/SIVEE 那么陡。
COHR,也就是 Coherent,是光互连赛道里非常稀缺的全栈覆盖型公司。它从材料、InP 激光器、硅光 PIC 到光模块,整条产业链都能做。其光模块市占率处于全球第一梯队,约 20%。COHR 和 LITE 一样,也获得英伟达 20 亿美元战略投资和数十亿美元采购承诺。
COHR 的优势是无论技术路线怎么演进都不容易踏空。CPO 需要硅光 PIC,它可以做;CPO 需要激光器,它可以做;可插拔光模块继续存在,它也可以做。这就是全栈覆盖的价值。COHR 更像中等市值、安全性较高的光互连标的,确定性很高,弹性不如 SIVE/SIVEE,但波动较小、风险较低。
AAOI 是少数美国本土垂直整合光互连公司。它用 MBE(Molecular Beam Epitaxy,分子束外延)设备在 InP 衬底上生长外延层,自己做激光器芯片、封装光学子组件,并组装成品光模块。它当前核心业务是 800G 和 1.6T 可插拔光模块。转录稿称,AAOI 在 3 月拿到首个 1.6T 数据中心光模块大批量订单,初始订单超过 2 亿美元,4 月又拿到 7,100 万美元 800G 订单。
AAOI 并不一定会被 CPO 冲击。第一,可插拔光模块不会因为 CPO 爆发而消失,CPO 解决的是超级节点内部连接,机柜之间大量连接仍然需要可插拔光模块。第二,AAOI 正在切入 CPO 供应链。CPO 架构下激光器不能放在封装内部,必须外置成一个小模块,通过光纤把光送进去。AAOI 展示的新产品,就是专门给 CPO 供光的外部激光源。综合来看,AAOI 的优势是垂直整合、美国本土制造带来的供应链安全叙事,以及激光器技术切入 CPO 外部光源的延伸空间。但它也是小市值、高 Beta 标的,波动大、弹性高、风险也高。
讲完激光器,再看代工厂。最关键的两家公司是 Win Semi 和 TSEM。
Win Semi 是全球最大的化合物半导体纯代工厂之一,同时提供 GaAs 和 InP 代工。SIVE/SIVEE 激光器量产主要通过 Win Semi 完成。下一代 CPO 架构放大外部激光器需求,Win Semi 是这些激光器设计公司最重要的代工合作方。不管最后哪家激光器设计公司胜出,大概率都要找 Win Semi 完成制造。
TSEM 是以色列特种代工厂,被市场称为“光互连领域的台积电”。它可能是 CPO 超级周期中受益最直接的公司之一。CPO 核心是硅光 PIC,而 TSEM 是硅光 PIC 代工领域份额最高的代工厂。CPO 强制使用硅光 PIC,相当于把 TSEM 的硅光代工业务从细分领域推到产业链中心。
TSEM 大部分产能已经被预订到 2028 年,即便如此,预期市盈率也只有 16 到 18 倍,在 CPO 高增长预期下仍有上行空间。核心风险是地缘政治,它是以色列公司,处在中东,可能受到地缘冲突影响。
Win Semi 和 TSEM 都是代工厂,但核心区别在于材料不同、制造对象不同。Win Semi 用 InP 和 GaAs 造激光器,负责发光;TSEM 用 SOI 衬底制造硅光 PIC,负责操控光。两套材料体系互不兼容,它们不是竞争对手,而是产业链不同环节的代工者。
再往下是 DSP 和交换芯片层,主要是博通和迈威尔。
博通 AVGO 是万亿美元级别的美股巨头,业务包括交换芯片、定制 AI 加速芯片、企业软件等。和光互连直接相关的业务主要有两块。第一是 DSP 芯片,也就是光模块里的大脑,负责纠错编码;博通是这个领域最重要供应商之一。第二是 CPO 交换机,博通第三代 CPO 交换机已经进入量产,也就是把光学引擎直接封装到交换芯片旁边的新型交换机。在 CPO 商业化进度上,博通甚至比英伟达更早。
但从投资角度看,光互连只是博通众多业务之一,在整体营收中占比不大。它的股价不会因为 CPO 爆发就翻几倍。投资博通,买的是 AI 基建综合确定性,而不是光互连产业爆发的单点弹性。
MRVL,也就是 Marvell Technology,同样是业务多元的芯片公司,涉及定制 AI 加速芯片、数据中心网络芯片、存储芯片等。和光互连直接相关的也是两块:第一是 DSP 芯片,Marvell 和 Broadcom 是该领域两大核心供应商,二者正面竞争;第二是 CPO。Marvell 收购 Celestial AI,大幅增强了其在硅光互连方向的能力。
本期内容的核心逻辑是,GPU 之间原来用铜缆通信,现在要用光替代铜。Celestial AI 做的事情也是这个方向,只是距离更短:在芯片封装内部用光替代铜。通过这次收购,Marvell 在 CPO 方向上的战略位置明显增强。
和博通相比,Marvell 在光互连方向上的敞口更集中。博通是万亿美元级别公司,光互连只是其中一项;Marvell 体量更小,过去一个财年营收 82 亿美元,同比增长 42%,管理层预计未来两个财年接近 150 亿美元。光互连和 CPO 在 Marvell 整体营收中占比更大,弹性也更大。Marvell 不是光互连纯正标的,但可能是同时横跨 DSP 和 CPO 两个方向、综合敞口较好的选择。
最后是底层公司 GLW,也就是康宁。康宁是全球光纤龙头。很多人熟悉康宁,是因为苹果 iPhone 的屏幕玻璃;但实际上,光通信已经是康宁最大、增长最快的部门之一。自 1970 年发明通信光纤以来,康宁已经铺设数百万英里的光缆。
无论哪家光模块公司获胜,无论技术路线是可插拔还是 CPO,都需要康宁的光纤。CPO 架构下,激光器和硅光 PIC 之间仍然用光纤连接,不同机柜之间也继续使用光纤。光纤是整条产业链里少数不受技术路线之争影响的环节。
康宁最近客户绑定很强。今年 1 月 Meta 宣布投入最高 60 亿美元帮助康宁扩建光缆工厂;英伟达也宣布与康宁签署多年期合作协议,投资 5 亿美元获得康宁认股权。康宁承诺把美国光学连接产能提升 10 倍、光纤产量提升 50% 以上,并新建 3 座工厂。
英伟达此前投了 LITE 和 COHR 各 20 亿美元,现在又投康宁 5 亿美元,可以看到英伟达正在把 AI 基建竞争从芯片延伸到光纤,系统性锁定整条光互连供应链。康宁是整条光互连产业链中确定性相对最高、弹性相对最低的标的。
讲了这么多公司,最后要回答“怎么投”。最重要的规律是:越往上游走,公司越小,弹性越大,但确定性越低;越往下游走,公司越大,确定性越高,但弹性越小。最上游的衬底和外延公司,如 AXTI、IQE,市值小、需求传导有滞后,但一旦需求放量,弹性可能很大;下游 AVGO 这类大公司确定性很高,但很难指望一年涨五倍。
第一套是保守型配置,核心标的是 AVGO、MRVL 和 GLW。三家公司都是市值偏大的公司,其中博通已经来到约 2 万亿美元市值,位列美股前十;Marvell 和康宁也都是千亿美元级别附近的公司。博通和 Marvell 业务多元,光互连只是其中一部分;康宁虽然更聚焦,但光纤是不受技术路线之争影响的刚需环节。这套组合特点是下行风险有限,即使光互连发展不及预期,其他业务也能支撑股价,适合不愿承担太大波动的长期投资者。
第二套是均衡型配置,核心标的是 COHR、LITE 和 TSEM。三家公司都是各自环节里的头部公司,体量中等,既有确定性也有弹性。COHR 是全栈覆盖型光学公司,不管行业往哪个方向走都不容易踏空,英伟达 20 亿美元投资提供安全边际;LITE 是英伟达锁定产能的激光器核心供应商,CEO 亲口确认 CPO 供需失衡;TSEM 是硅光 PIC 代工领域份额最高的代工厂,估值相对便宜。如果想布局光互连并能承受一定波动,这个组合相对合适。
第三套是激进型配置,核心标的是 SIVE/SIVEE、AAOI、SOI/Soitec、AXTI、IQE。五家公司都处在产业链上游瓶颈环节。SIVE/SIVEE 是 CPO 外部光源激光器的稀缺供应商,已嵌入多个 CPO 项目供应链;AAOI 是可插拔光模块高 Beta 标的,也有能力切入 CPO 外部光源;Soitec 是硅光衬底领域拥有压倒性主导地位的供应商;AXTI 提供激光器制造所需的 InP 衬底;IQE 做激光器制造关键外延片。如果 CPO 超级周期按高盛预测的速度爆发,这套组合弹性最大,但风险也最高。
这些小市值标的单日暴跌 20% 到 30% 都很正常,仓位最好控制在总投资组合的 5% 到 10% 以内。还要注意,很多光互连小市值标的不在美股上市。Soitec 在巴黎交易所,IQE 在伦敦交易所,SIVE 在瑞典,Win Semi 在台湾。如果使用盈透证券,大部分可以交易,但需要开通对应市场权限。

整个赛道也有明显投资风险。
第一,CPO 商业化进度不确定。高盛预测的 910 亿美元 CPO 市场是相当激进的判断。要实现这个数字,需要英伟达下一代架构按时上线,CPO 良率达标,InP 衬底供应跟上,云厂商资本开支持续高位,并且有源源不断资金流入产业链。任何一个环节掉链子,实际数字都会打折扣。
第二,英伟达的选择至关重要。英伟达下一代 Rubin 平台采用什么光互连方案,会直接影响整条供应链格局。目前英伟达已经把 CPO 写进 Rubin 参考架构,但具体供应商选择和量产节奏仍有变数。
第三,小市值标的有固有风险。很多光互连产业链公司市值很小,这类标的不能重仓,更不能加杠杆。
最后,总结我对光互连赛道的三个判断。
第一,光互连不是概念炒作。AI 数据中心的互连需求是真实的、紧迫的、不可逆的。GPU 卖得越多,光互连需求越大,这是一个和 GPU 产业链强绑定的确定性赛道。
第二,CPO 是这条赛道未来最大的增量。高盛预测光互连市场可能增长 9 倍,其中 CPO 占 910 亿美元;Lumentum CEO 亲口确认 CPO 供需严重失衡,且仍处于早期;英伟达已经把 CPO 写进下一代架构,说明它不是远期故事,而是正在发生。
第三,如果能够承担高风险、高波动,想追求高收益,核心逻辑就是抓瓶颈。光互连产业链和 GPU 不一样,不是英伟达一家通吃,而是分工极其精细、瓶颈极其分散。每一个瓶颈环节背后,往往只有一两家公司能做。找到这些瓶颈,就是找到这条赛道里最大的 Alpha。
最后再总结一句,GPU 是 AI 的大脑,但大脑之间的神经网络,才是决定整个系统能跑多快的关键。光互连就是 AI 的神经网络。没有它,再多 GPU 也只是一个个孤岛。这条被 GPU 光芒掩盖、未来可能达到万亿级别的产业链,可能正在酝酿下一波非常大的投资机会。
当然,光互连板块的波动和风险也会非常大,以上内容都不构成投资建议。投资之前,一定要想清楚背后的收益和风险,结合自己的实际仓位与现金流,再做决定。