智谱会是下一个 MiniMax 吗?

最话FunTalk
个人专栏
热度: 5438

文章分析智谱AI与MiniMax的估值困境,指出二者虽具真实技术能力与商业落地成果,但缺乏底层范式定义权和指数级增长模式,被资本市场错误按L1(基础模型定义者)逻辑高估,实际更接近L4(垂直服务商)定位;其万亿市值缺乏可持续支撑,面临技术叙事漂移、商业模式线性增长、解禁压力等结构性挑战。

摘要由 Mars AI 生成
本摘要由 Mars AI 模型生成,其生成内容的准确性、完整性还处于迭代更新阶段。

如果不是因为要写得逻辑严密,反复修改了好几遍,这篇文章本该上周就发送。

如果是上周发送,看似就“预言”到了上周五的大跌。

那日,MiniMax 港股收市报 427 港元,较前一日再跌 6.48%。这距离其上市后 52 周高点 1330 港元,已经跌去超过六成。同一日,智谱AI 收市报 2046 港元,大跌 12.94%,盘中一度跌破 2000 港元关口,而就在四天前,它刚创下2980 港元的历史新高。

但我们做的分析并不是一两天乃至一两周的行情变化,我们无意扮演那种“预言大跌”的股评角色。上周五的下跌,有受美股行情的影响、解禁期临近的焦虑、资金获利离场的避险情绪。这些都是短期冲击,这不,本周一再度下跌后,周二又反弹了,没有人能准确预测短期点位。

我们试图回答的,是一个更慢、更深、也更难以回避的问题:当“中国版Anthropic”的故事被反复讲述直到市场听觉疲劳,智谱的近万亿市值,究竟建立在什么上面?

不可否认的是,智谱是一家有真实原创技术、有产品口碑、有商业落地能力的公司。早在2021 年,它提出的GLM 架构就是与BERT、GPT 不同的第三条道路;最近,GLM-5.2 在 Code Arena 盲测中拿下全球可用模型第一,在开发者社区有真实口碑;它的 MaaS 平台ARR 在 12 个月内提升 60 倍,政企客户愿意为它付费。

这些都是真实的价值。这些价值,足以撑得起一家优秀的垂直AI 服务商,却难以闭环一个万亿市值平台型的叙事。万亿市值需要范式定义权、指数级增长、不可替代的护城河,而智谱在这三个维度上,暂时还没有交出被市场验证的答案。

更微妙的是,智谱的技术能力正被一种“内外分裂”的舆论场遮蔽。外网开发者调用裸 API,看到的是GLM-5.2在SWE-bench、LiveCodeBench 上硬碰硬不输 GPT-5.5 的输出能力;内网C端用户看到的是模型输出文本同质化,并不了解智谱的coding能力。

这种分裂,让资本市场对智谱的定价处在摇摆中:要么因为外网的技术赞誉而高估其变现能力,要么因为质疑其“借鉴”了DeepSeek V3.2而低估其后训练和工程优化价值。但真正的错配,在归类。市场现在是按“中国版Anthropic”给智谱定价,但它的技术基础和财务结构反复证明,它更接近一家“中国版Palantir”。

这不是贵不贵的问题,而是它根本还不是市场以为的那个物种。

01

市场大体把AI 企业分为四层完全不同的物种,每一层对应一套独立的估值逻辑。

第一层是基础模型定义者(L1)。它们发现了模型背后的数学基础,能提出并工程化实现新架构,拿着模型的“语法”书写模型的发展方向。比如DeepSeek 用MLA 和 GRPO 定义了“如何更便宜地训练”,Anthropic 用Constitutional AI 定义了“如何更安全地对齐”。这类公司的估值容忍度极高,PS 可以给到 50-100 倍,因为它们一旦确立范式,所有上层应用都必须遵循其语法,天花板是整个产业的底层。

第二层是基础设施控制者(L2)。它们掌握算力、云和分发管道,是“管道”的垄断者。Azure、AWS、Google Cloud 的PS 通常在 20-30 倍,溢价来自规模效应和资源壁垒。

第三层是超级应用统治者(L3)。它们掌握用户入口、日活和场景,掌握的是AI“语用”,如豆包、千问、微信,这类应用很难以技术给予估值,只能看用户数、日活、变现能力。

第四层是垂直服务商与物理整合者(L4)。它们用AI 解决具体问题,比如政企 IT 外包、系统集成、行业解决方案。Palantir、商汤都属于这一层。它们的估值最传统,通常只有 10-20 倍PS,因为增长受限于人力、预算和项目周期,边际成本不会随着客户增加而趋近于零。

L1与L4的估值鸿沟,是对模型基础能力质的差别。L1 的 100 倍PS 隐含的是“赢家通吃”的期权价值,“语法”一旦确立,整个产业都要交“税”。L4 的 10 倍PS 反映的是“按劳取酬”的劳务价值,每增加一个客户,就要增加一批工程师。

而判断一家人工智能公司是否在L1,标准从来不是参数规模或融资估值,而是它是否提出了被行业广泛采纳的底层数学架构,或者是否拥有无法被开源社区复制的训练效率。

在这个标准下,DeepSeek 拥有MLA(多头潜在注意力)、GRPO(组相对策略优化)和 DSA2(DeepSeek 稀疏注意力 2.0)。OpenAI 拥有测试时计算扩展(Test-time Compute Scaling)。Anthropic 拥有Constitutional AI和对齐的数学形式化框架。这些不是产品功能,是定义坐标系的能力,它们决定了整个行业如何理解“高效训练”“长上下文”和“安全可控”。

MiniMax 和智谱,都不在这个坐标系内。

但这不等于它们没有技术。公允地说,MiniMax 不是一家“纯产品公司”。早在2025 年初,它推出的MiniMax-01 首次将线性注意力(Lightning Attention)在工业级规模上跑通,就在最近,它的 M3 模型进一步推出自研稀疏注意力架构 MSA(MiniMax Sparse Attention),支持 100 万token 超长上下文。而专为 M3 训练的Agent 产品MiniMax Code,支持Computer Use、多文件代码库重构、长达 12 小时的自主编程任务。

智谱的GLM 架构同样也有不少创新。2021 年,智谱提出了“自回归填空+双向上下文”的GLM 范式,与BERT 和 GPT 形成了第三条道路。GLM-5 在保留自研MoE 路由和自回归填空框架的同时,引入了DeepSeek 开源的 DSA 组件以提升长上下文效率,这是开源生态中的正常技术吸收,不是“换皮”。GLM-5.2 在 Code Arena 盲测中拿下 1595 分,排名总榜第二,在全球可用模型中排名第一;在Design Arena(审美品味)上更是全球第一。

然而,原创技术不等于范式定义权,工程优化并不等于拥有改写模型底层的能力。

GLM 是“支流”而非“主流”,全球基座模型的语法仍是 GPT 路线的自回归。MiniMax 的线性注意力是组件替代而非架构重构,行业主流仍是标准 Transformer+各种稀疏优化,其线性注意力没有被全球社区广泛采纳为默认方案。

这和DeepSeek 不同,它的MLA/GRPO/DSA2 之所以形成代差,是因为创新发生在最底层的数学,且被全球社区迅速采纳为标准,所以,DeepSeek拥有基座模型的定义权,而智谱的定义权是不完整的。

没有核心技术定义权,就意味着没有定价权。MiniMax 的API 和 Code 服务在定价上仍面临DeepSeek 等开源模型的竞争压力;智谱的 MaaS 服务也只能在价格战和涨价之间摇摆。2026 年一季度,智谱API 价格累计上调 83%,编程套餐涨价 30%,调用量反而增长 400%。这看起来像是供不应求的“定价权”,实则是因为“龙虾热”期间,中国模型因低成本优势吸引了大量海外开发者和成本敏感型Agent工作流,厂商出于成本考虑,集体涨价。

拥有真正的技术溢价,是OpenAI 、Anthropic ,虽然定价高昂,但企业客户依然愿意买单。而智谱和MiniMax 的客户们,永远有替代方案。

智谱的问题,是被资本市场用L1 的逻辑定价,但它的技术基础之前只能支撑 L4 的定位。即使有了GLM-5.2,其技术基础仍然支撑的是L4定位,而非L1范式定义者。

更关键的是,没有核心技术定义权,叙事就会不断漂移。智谱从早期的“另一家中国版OpenAI”,切换到“开源先锋”,再切换到如今的“中国版Anthropic”,每一次切换,也都是因为上一个坐标系里的对标对象被证伪。MiniMax 的叙事正在从“多模态全球化”和“C 端陪伴”,向“M3 的Coding/Agent 能力”切换,但Coding/Agent 市场的商业验证尚未开始。

资本市场上,科技公司的定价某种程度上就是定位叙事,但错误的定位叙事,总有一天会被修正。

02

技术溢价的缺失,如果能被商业模式的指数级增长弥补,公司依然可以获得高估值。但MiniMax 和智谱的商业模式,都困在线性增长的陷阱里。

MiniMax 此前的营收结构建立在 C 端陪伴产品之上。据其财报及公开披露,2025全年营收约 7903.8 万美元(约 5.7 亿元人民币),同比增长 158.9%,海外收入占比超过 70%,主要来源是 Talkie、星野等应用的付费和广告。2026 年 2 月,其年度经常性收入(ARR)突破 1.5 亿美元,过去两个月实现翻番。

但这些数字背后有一个隐忧:C 端AI 陪伴产品的用户没有迁移成本。用户因为新鲜感下载,但没有社交关系链的锁定,最终会因为新鲜感过去而流失。Character.AI、ChatGPT、甚至DeepSeek 的开源模型,都在持续挤压MiniMax 的用户时长。

为了维持增长,MiniMax 必须不断投入高额获客成本,而留存率却难以提升。这不是平台型公司的网络效应,而是内容型公司的流量消耗,每一分钱增长,都需要对应一分钱的营销投入。其 2025 全年经调整净亏损 2.51 亿美元,年内亏损同比扩大,正是这种“烧钱换流水”模式的直接结果。

所以,M3 的Coding 能力和MiniMax Code 产品的发布,表明它正在试图摆脱“纯陪伴”标签。问题在于:Coding/Agent 市场的竞争同样激烈(Cursor、Claude Code、GitHub Copilot 已占据生态位),而MiniMax Code 的排名并不靠前,并且开发者渗透率、付费转化率、企业级客户数量,目前都缺乏独立第三方的验证。它有了“第二曲线”的技术基础,但“第二曲线”的商业验证,尚未开始。

智谱的商业模式此前同样无法指数增长。2025 年,智谱营收 7.24 亿元,其中本地化部署收入 5.34 亿元,占比 73.7%;云端 MaaS 及API 收入仅 1.9 亿元,占比 26.3%。本地化部署意味着项目制,工程师驻场、模型微调、数据对接、安全适配、持续运维。每个政府或金融客户都需要非标定制,人效无法提升,毛利率被人力成本持续侵蚀。

虽然 2026 年 3 月其 MaaS 平台ARR 达到17 亿元,过去 12 个月提升 60 倍,但这更多是从极小基数开始的爆发,目前还未看到可持续的指数曲线。这还意味着销售模式的转变,此前智谱为了承接ToG 项目,将内部组织调整为按区域建立地方项目团队,这种结构更接近传统的系统集成商,而非平台型科技公司。

真正的规模效应,要求同一套产品以极低的边际成本服务无限用户。OpenAI 的ChatGPT Plus 是标准化订阅,同一套模型服务全球数亿用户;DeepSeek 的API 是标准化调用,同一套权重通过云计算分发给全球开发者。它们的增长公式是“用户量×ARPU×留存率”。

而过去无论智谱还是MiniMax的变现方式困在“人力×时间”的线性公式里。资本市场给 SaaS 公司 30-50 倍PS,是因为相信其未来三年营收可以每年翻倍;而给项目制公司或流量型公司 10-15 倍PS,是因为知道其增长受限于人力和预算。智谱和MiniMax 之前的估值,显然建立在前者的假设上,但财务数据却不断证明后者才是现实。

当然,现在智谱有了GLM-5.2,MiniMax 有了M3,都有了切入订阅制的产品。如果GLM-5.2的API调用能保持高增长、留存率良好,那么,它就会从L4向L2/L3混合切换。

好消息是,全球开发者尤其是个人开发者越来越愿意调用DeepSeek、智谱、Qwen的API,不愿意再给Anthropic交“税”;坏消息是,竞争压力下,大家都大打价格战,就连Anthropic也推出了新版性价比模型Sonnet 5,能自己规划任务、调用浏览器和终端,跑分逼近自家最贵的Opus 4.8,价格却只要后者的六成左右。

另外,如果DeepSeek按市场传闻迭代推出更专注coding的V4.1,同时着手研发Agent Harness,一个基座模型更强、token成本更低的对手,显然会压制智谱、MiniMax 的空间。

模型层惨烈的价格战会爆发,算力成本、需求还在持续增长,巨头的降价会进一步挤压市场生存空间,直到出现出清。这对于中小玩家来说,并不是好消息。

03

2026 年1 月,MiniMax 在港股上市,首日收涨 109%,市值一度超过 1066 亿港元。到 6 月 30 日,股价收市417 港元,较 52 周高点 1330 港元跌去 68%,市值约 1308 亿港元。这距离其 5 月 29 日启动A 股上市辅导时 2635 亿港元的总市值,已经蒸发了超过 1327 亿港元。

市场用最直接的方式进行修正:当 C 端用户增长的故事被验证为“低留存、高流失、无壁垒”,当底层模型能力被验证为“跟随者而非定义者”,估值迅速回归常识。

智谱的修正来得更慢,但逻辑相同。2026 年1 月,智谱上市发行价 116.2 港元,到 6 月 22 日盘中一度触及2980 港元,市值突破一万亿港元,较发行价上涨超过 20 倍。然而,2025 全年智谱营收 7.24 亿元,经调整净亏损 31.82 亿元,研发开支 31.80 亿元,研发投入相当于收入的 4.4 倍。以万亿市值计算,其市销率(PS)超过 1000 倍。

作为参照,全球 SaaS 龙头Salesforce 的PS 约 8-10 倍,已盈利的AI 应用公司Palantir 的PS 高达五十多倍,2025 年底峰值时曾达 90-120 倍。即使按摩根大通预测的 2026 年营收 45.97 亿元计算,智谱前瞻PS 也超过 200 倍,远超任何可比的科技巨头。

正如之前所分析的,智谱万亿市值的问题,不是简单的“太贵了”,而是“被错误归类”。此前市场是按“中国版Anthropic”,全球AI coding范式的定义者,标准化API 经济的享受者给它定的价。但它技术底子和的财务结构都不支持这个叙事,当时它的业务模型更接近一家“中国版Palantir”:深耕政企的数据服务公司,项目制为主,增长受限于人力和预算。

Anthropic代表的是定义范式、平台化增长、生态溢价,Palantir代表的是深耕客户、项目交付、资质壁垒。

把两者放在一起,估值鸿沟就一目了然:对于Anthropic ,市场愿意给一个还没有盈利的范式定义者很高的容忍度,因为相信安全是未来所有AI 部署的刚性成本,而它定义了这条赛道。而作为一家已经盈利、产品化程度高、但仍是项目制为主的公司,市场给Palantir的滚动PS 是五十多倍。

两者之间,可能有十倍的估值差。需要指出的是,Palantir的市销率远高于行业平均水平,已经是行业地位溢价的天花板,即便如此,其股价、PS 也较最高点大幅回落。毕竟,所有叙事最后都得接受财报的重力。

更严峻的考验是解禁期。MiniMax 已经经历了这一过程,股价腰斩就是解禁和业绩双重压力的结果。智谱的基石限售股将在7 月 8 日解禁,原始股东面临巨大的减持动机,但具体选择取决于解禁当日的市场流动性与情绪博弈。

值得注意的是,MiniMax 早期投资方以美元 VC 为主,解禁后减持动机强烈且退出渠道有限;智谱的股东结构中,国资与战略产业资本占比更高,这类股东的更关注战略卡位而非短期财务回报。解禁不等于必然减持。

但面对高昂的市值,很难说股东们就不会动心思。

所以,严格来说,MiniMax 的估值修正已经大部分完成,而智谱的修正可能才刚刚开始。它们不是简单的“先后关系”,而是同一套结构性困境的两个版本:都有被低估的技术原创性,但技术深度不足以定义范式,商业模式无法支撑估值。

不过,DeepSeek 与智谱、MiniMax 也不是“你死我活”的敌对关系。

DeepSeek 开源 MIT 协议,本身就在邀请生态伙伴。智谱基于DeepSeek 做深度后训练(如 GLM-5.2 吸收DSA),MiniMax 则在自研 M3 基座之上构建Coding 和Agent 产品,如果智谱继续走这个路线,基于DeepSeek的基座模型做足后训练和产品开发,当市场意识到它是生态中的“好伙伴”,估值就会到它应有的位置。

但如果,智谱在下一代模型超越了Mythos 5,并提出被全球行业广泛采纳的底层标准,或者GLM-5.2以及后续产品的订阅有指数级增长,同时毛利率大幅改善,那么,智谱的市值会有个有力支撑,修正过程就会在中途戛然而止。

只是,要做到这点,智谱需要至少在一个维度上提出原创数学框架:在注意力机制上,不依赖DeepSeek 的DSA,而是提出新的、被全球社区采纳的、更优的稀疏化或压缩方案;不跟随 GRPO/PPO,而是提出新的、从统计估计理论出发的优化方法;不依赖人工标注的 RLHF,而是提出类似Constitutional AI 的数学形式化框架。或者,基于对模型的数学理解力,开拓出会被广泛接受的新线路。

这些都需要花数年不计商业回报的偏执投入和探索,需要不受 KPI 干扰的研究自由,以及最重要的,对GLM 架构第一性原理的重新解构能力。

在维护市值的压力下,智谱是否有这个定力,能否在充满不确定性和市值重构的数年里,保持坚持,起码目前没有看到相关的组织信号。

当然,争辩无异议,只有结果见真章。

我们也希望我们的看法是错的。

本文来自微信公众号“最话 FunTalk”,作者:最话团队

声明:本文为入驻“火星财经 专栏”作者作品,不代表火星财经官方立场。
转载请联系网页底部:内容合作栏目,邮件进行授权。授权后转载时请注明出处、作者和本文链接。未经许可擅自转载本站文章,将追究相关法律责任,侵权必究。
提示:投资有风险,入市须谨慎,本资讯不作为投资理财建议。
本内容旨在传递行业动态,不构成投资建议或承诺。