16

06

星期二

16:52

花旗:AI推理需求仍紧,瓶颈正从芯片扩散至电力和数据中心

火星财经消息,6 月 16 日,花旗称,人工智能推理需求的强度仍在延续,算力稀缺正从最新一代芯片外溢至上一代 GPU,并推动模型厂商通过价格、限额和路由机制加速变现。 Heath Terry 等花旗分析师在 6 月 14 日发布的报告中写道,A100 GPU 租赁价格过去一周上涨 0.6%,六周累计上涨 11%,显示 AI 算力需求并未只集中在最先进硬件上。与此同时,部分前沿模型在智能得分提升后显著提价,花旗称「稀缺性被货币化的速度快于被解决的速度」。 报告指出,当前没有任何模型供应商能同时占据 智能、速度和价格 三个优势。最新前沿模型智能分数提高约 4 点,但综合价格接近翻倍;而中端模型在速度上取得进展,Top 20 模型的中位输出速度六周内从 64 tokens/s 升至 105 tokens/s。 花旗还称,闭源模型与开源模型之间的能力差距正在扩大,专有模型相对开源模型的智能领先幅度从约 6 点扩大至约 10 点。这意味着头部模型厂商仍倾向于用更强能力守住高端市场,而不是直接与开源模型展开价格竞争。 算力之外,电力和数据中心选址正成为 AI 扩张的新约束。报告提到,一家私有 neocloud 已签约 4.9GW 需求,但规划管线超过 40GW,凸显需求爆发与供给落地之间的差距。花旗称,数据中心倾向布局在电价约 9-12 美分/kWh 的地区,同时可再生能源占比和长期购电协议也在影响选址。 报告认为,未来 AI 基建成本将继续上升。随着组件价格、电力接入和前期基础设施投入增加,按 H100 等效算力计算的资本开支正在走高,电力成本也正从运营阶段前移为建设前的资本投入。 花旗表示,下一阶段的价值可能流向「推理路由层」,即能够判断不同任务该使用哪种模型、量化方式和硬件的平台。该层既能降低推理成本,也能提高输出效率,但企业数据、知识产权和隐私保护将是落地难点。 从产业链看,报告指向的不只是 GPU,还包括数据中心、电力、光通信、云基础设施和模型应用。花旗在附录中列出 Ciena、Lumentum 和 MiniMax 等相关覆盖标的,显示 AI 推理周期正在从芯片扩散到更广泛的基础设施和应用层。

本内容旨在传递行业动态,不构成投资建议或承诺。