16

06月

星期二

16:52

花旗：AI推理需求仍紧，瓶颈正从芯片扩散至电力和数据中心

火星财经消息，6 月 16 日，花旗称，人工智能推理需求的强度仍在延续，算力稀缺正从最新一代芯片外溢至上一代 GPU，并推动模型厂商通过价格、限额和路由机制加速变现。 Heath Terry 等花旗分析师在 6 月 14 日发布的报告中写道，A100 GPU 租赁价格过去一周上涨 0.6%，六周累计上涨 11%，显示 AI 算力需求并未只集中在最先进硬件上。与此同时，部分前沿模型在智能得分提升后显著提价，花旗称「稀缺性被货币化的速度快于被解决的速度」。报告指出，当前没有任何模型供应商能同时占据智能、速度和价格三个优势。最新前沿模型智能分数提高约 4 点，但综合价格接近翻倍；而中端模型在速度上取得进展，Top 20 模型的中位输出速度六周内从 64 tokens/s 升至 105 tokens/s。花旗还称，闭源模型与开源模型之间的能力差距正在扩大，专有模型相对开源模型的智能领先幅度从约 6 点扩大至约 10 点。这意味着头部模型厂商仍倾向于用更强能力守住高端市场，而不是直接与开源模型展开价格竞争。算力之外，电力和数据中心选址正成为 AI 扩张的新约束。报告提到，一家私有 neocloud 已签约 4.9GW 需求，但规划管线超过 40GW，凸显需求爆发与供给落地之间的差距。花旗称，数据中心倾向布局在电价约 9-12 美分/kWh 的地区，同时可再生能源占比和长期购电协议也在影响选址。报告认为，未来 AI 基建成本将继续上升。随着组件价格、电力接入和前期基础设施投入增加，按 H100 等效算力计算的资本开支正在走高，电力成本也正从运营阶段前移为建设前的资本投入。花旗表示，下一阶段的价值可能流向「推理路由层」，即能够判断不同任务该使用哪种模型、量化方式和硬件的平台。该层既能降低推理成本，也能提高输出效率，但企业数据、知识产权和隐私保护将是落地难点。从产业链看，报告指向的不只是 GPU，还包括数据中心、电力、光通信、云基础设施和模型应用。花旗在附录中列出 Ciena、Lumentum 和 MiniMax 等相关覆盖标的，显示 AI 推理周期正在从芯片扩散到更广泛的基础设施和应用层。

本内容旨在传递行业动态，不构成投资建议或承诺。

4分钟前

特朗普：伊朗协议进入第二阶段，不会向伊朗投资任何资金

4分钟前

贝莱德：日本央行在进一步加息方面将谨慎行事

4分钟前

路透社：美军效仿伊朗模式秘密转运海湾石油

5分钟前

IMF 警示尼日利亚稳定币快速渗透或削弱本币政策传导

10分钟前

Polymarket 24小时收入激增至126万美元，暂列加密货币收入排行榜第六位

17分钟前

数据：HYPE 价格上涨，持仓规模超 1200 万美元的 4 个空头地址距离清算仅有 1%-4%差距

29分钟前

Binance将于6月19日下线ADX/BTC等五个现货交易对

29分钟前

万斯：美国在美伊后续核谈判中占据主导地位，正式签署仪式定于本周五日内瓦举行

下载火星财经 APP

以行业热点、实时快讯、视频解读等维度提供全方位的AI和Web3整合服务

24H热门新闻

暂无内容