扫描下载APP
其它方式登录
摩根大通研报显示AI基础设施需求持续强劲:LLM token用量6月环比激增70%,GPU租赁价格连续七个月上涨,DRAM现货价同比暴涨740%;美国模型占据85%消费金额,高端算力稀缺性缓解但整体需求未见顶,存储周期呈现NAND松动、DRAM坚挺的分化态势。
AI模型价格大幅下降(三年降千倍),但企业AI总支出激增320%,因应用数量、单应用深度和模型复杂度三重叠加导致token消耗指数级增长,进而推高对GPU、DRAM等硬件需求,半导体与存储芯片价格持续飙升,AI基础设施资本支出预计2026—2031年达7.6万亿美元。
文章指出AI行业普遍存在GPU算力严重浪费现象,前沿实验室GPU利用率不足10%,企业峰值负载下GPU利用率普遍低于70%。根本原因在于数据供给瓶颈、存储IO滞后及监控指标失真,导致GPU大量时间处于等待状态。提升利用率(如MFU)已成为关键工程挑战,正推动从‘堆算力’转向‘产出最大化’的范式变革。
文章指出AI行业普遍存在算力严重浪费现象:尽管全球疯狂采购GPU,前沿实验室GPU利用率不足10%,企业峰值负载下GPU利用率普遍低于70%。根本原因在于数据供给瓶颈、基础设施效率低下及监控指标失真,导致大量算力空转耗电。提升MFU(模型浮点运算利用率)成为新焦点,行业正从‘堆算力’转向‘榨取智能’的效率革命。
Ornn获3300万美元融资,由a16z Crypto领投,致力于将GPU算力转化为可定价、可交易、可对冲的金融化商品。公司推出Ornn Compute Price Index(OCPI)提供透明价格基准,并构建算力使用权交易平台,联合ICE推进GPU期货合约,推动AI算力市场从私下议价走向标准化、流动性强的成熟商品市场。
文章聚焦中国芯片公司曦望科技如何通过专为AI推理优化的GPU(如启望S3)降低Token成本,抓住大模型推理需求爆发的机遇。其采用大显存、高兼容性、软硬同源设计,在国产模型与国芯协同背景下,实现单位Token成本大幅下降,推动国产算力从‘替代’转向‘全球竞争力’,并拓展至中东、欧洲等海外市场。
文章指出AI正从模型竞赛转向产业落地,云厂商竞争重心由‘烧Token’转向交付真实业务结果,强调AI作为基础设施需深度嵌入金融、汽车、能源等高责任场景;国产算力底座加速替代,资本按基础设施逻辑重估AI价值,平台层(云)成为价值沉淀核心。
国产GPU四小龙(摩尔线程、沐曦股份、壁仞科技、燧原科技)加速登陆资本市场,叠加寒武纪、海光信息等已上市企业,国产AI芯片军团总市值逼近2万亿元。DeepSeek-V4等大模型适配推动技术验证与商业落地,国产芯片在性能、成本、生态适配及边缘场景中实现差异化突围,市场份额快速提升,正从‘替代’迈向‘原生’生态构建。
蚂蚁集团通过训推一体池化调度解决GPU结构性稀缺问题,打通训练与推理资源池,实现跨任务潮汐调度;强调国产芯片短板在于全链路生态而非单卡算力,并指出提升利用率存在硬件与业务SLO双重天花板,需软硬协同优化。
文章聚焦中美AI竞争中的核心瓶颈——高端算力芯片差距,指出中国在AI训练芯片领域严重依赖进口,受美国出口管制制约,导致大模型参数规模、迭代速度和工业应用能力显著落后于美国;虽国产GPU在推理侧取得进展,但在训练侧性能与生态(如CUDA替代)仍存代际差距,需长期投入突破。
壁仞科技作为首家港股上市GPU公司,凭借‘国产NVIDIA’标签获得高热度,但其发展受美国出口管制严重冲击,经历旗舰产品BR100流产、降规迭代为BR106/BR166、产线被迫转至国内等波折;当前依赖产能配额与主权订单维持出货,短期看BR20X新品能否补足FP8/FP4等短板并提升良率,长期则面临单芯性能、软件生态(BIRENSUPA)及系统交付能力的多重挑战。
沐曦GPU万卡集群将在上海临港落地,标志国产AI芯片厂商从单卡性能竞争转向系统级万卡集群能力比拼;公司已实现超万卡全量交付及推理GPU规模化落地,正推进H股上市;行业面临训练向推理需求迁移、商业化落地与产能供应链挑战。
摩尔线程作为国内唯一聚焦全功能GPU研发的企业,虽技术稀缺、业绩扭亏但依赖政府补助,主业仍亏损;客户高度集中、经营性现金流持续恶化、存货激增,导致股价滞涨。尽管面临激烈竞争和短期财务压力,其受益于国产AI芯片替代加速与行业高增长,正从烧钱扩张转向规模化盈利,长期成长逻辑未变。
燧原科技通过科创板上市委审议,成为国产GPU四小龙中最后登陆资本市场的成员。公司三年营收翻三倍,单季同比暴增1474%,但超83%收入依赖腾讯,面临市场化拓展与生态独立性挑战。其选择非GPGPU专用架构聚焦AI推理场景,以差异化路线谋求自主可控,募资60亿元用于新一代AI芯片研发。
燧原科技成功过会,成为国产GPU四小龙中最后一家登陆资本市场的公司。公司专注云端AI芯片研发,已迭代四代架构五款芯片,主要产品为AI加速卡及模组、智算系统及集群,2025年国内市占率约1.7%。虽连续三年亏损超43亿元,但预计2026或2027年实现合并报表盈利。