智谱会是下一个 MiniMax 吗？

个人专栏

2026-07-01热度: 5919

文章分析智谱AI与MiniMax的估值困境，指出二者虽具真实技术能力与商业落地成果，但缺乏底层范式定义权和指数级增长模式，被资本市场错误按L1（基础模型定义者）逻辑高估，实际更接近L4（垂直服务商）定位；其万亿市值缺乏可持续支撑，面临技术叙事漂移、商业模式线性增长、解禁压力等结构性挑战。

摘要由 Mars AI 生成

本摘要由 Mars AI 模型生成，其生成内容的准确性、完整性还处于迭代更新阶段。

如果不是因为要写得逻辑严密，反复修改了好几遍，这篇文章本该上周就发送。

如果是上周发送，看似就“预言”到了上周五的大跌。

那日，MiniMax 港股收市报 427 港元，较前一日再跌 6.48%。这距离其上市后 52 周高点 1330 港元，已经跌去超过六成。同一日，智谱AI 收市报 2046 港元，大跌 12.94%，盘中一度跌破 2000 港元关口，而就在四天前，它刚创下2980 港元的历史新高。

但我们做的分析并不是一两天乃至一两周的行情变化，我们无意扮演那种“预言大跌”的股评角色。上周五的下跌，有受美股行情的影响、解禁期临近的焦虑、资金获利离场的避险情绪。这些都是短期冲击，这不，本周一再度下跌后，周二又反弹了，没有人能准确预测短期点位。

我们试图回答的，是一个更慢、更深、也更难以回避的问题：当“中国版Anthropic”的故事被反复讲述直到市场听觉疲劳，智谱的近万亿市值，究竟建立在什么上面？

不可否认的是，智谱是一家有真实原创技术、有产品口碑、有商业落地能力的公司。早在2021 年，它提出的GLM 架构就是与BERT、GPT 不同的第三条道路；最近，GLM-5.2 在 Code Arena 盲测中拿下全球可用模型第一，在开发者社区有真实口碑；它的 MaaS 平台ARR 在 12 个月内提升 60 倍，政企客户愿意为它付费。

这些都是真实的价值。这些价值，足以撑得起一家优秀的垂直AI 服务商，却难以闭环一个万亿市值平台型的叙事。万亿市值需要范式定义权、指数级增长、不可替代的护城河，而智谱在这三个维度上，暂时还没有交出被市场验证的答案。

更微妙的是，智谱的技术能力正被一种“内外分裂”的舆论场遮蔽。外网开发者调用裸 API，看到的是GLM-5.2在SWE-bench、LiveCodeBench 上硬碰硬不输 GPT-5.5 的输出能力；内网C端用户看到的是模型输出文本同质化，并不了解智谱的coding能力。

这种分裂，让资本市场对智谱的定价处在摇摆中：要么因为外网的技术赞誉而高估其变现能力，要么因为质疑其“借鉴”了DeepSeek V3.2而低估其后训练和工程优化价值。但真正的错配，在归类。市场现在是按“中国版Anthropic”给智谱定价，但它的技术基础和财务结构反复证明，它更接近一家“中国版Palantir”。

这不是贵不贵的问题，而是它根本还不是市场以为的那个物种。

01

市场大体把AI 企业分为四层完全不同的物种，每一层对应一套独立的估值逻辑。

第一层是基础模型定义者（L1）。它们发现了模型背后的数学基础，能提出并工程化实现新架构，拿着模型的“语法”书写模型的发展方向。比如DeepSeek 用MLA 和 GRPO 定义了“如何更便宜地训练”，Anthropic 用Constitutional AI 定义了“如何更安全地对齐”。这类公司的估值容忍度极高，PS 可以给到 50-100 倍，因为它们一旦确立范式，所有上层应用都必须遵循其语法，天花板是整个产业的底层。

第二层是基础设施控制者（L2）。它们掌握算力、云和分发管道，是“管道”的垄断者。Azure、AWS、Google Cloud 的PS 通常在 20-30 倍，溢价来自规模效应和资源壁垒。

第三层是超级应用统治者（L3）。它们掌握用户入口、日活和场景，掌握的是AI“语用”，如豆包、千问、微信，这类应用很难以技术给予估值，只能看用户数、日活、变现能力。

第四层是垂直服务商与物理整合者（L4）。它们用AI 解决具体问题，比如政企 IT 外包、系统集成、行业解决方案。Palantir、商汤都属于这一层。它们的估值最传统，通常只有 10-20 倍PS，因为增长受限于人力、预算和项目周期，边际成本不会随着客户增加而趋近于零。

L1与L4的估值鸿沟，是对模型基础能力质的差别。L1 的 100 倍PS 隐含的是“赢家通吃”的期权价值，“语法”一旦确立，整个产业都要交“税”。L4 的 10 倍PS 反映的是“按劳取酬”的劳务价值，每增加一个客户，就要增加一批工程师。

而判断一家人工智能公司是否在L1，标准从来不是参数规模或融资估值，而是它是否提出了被行业广泛采纳的底层数学架构，或者是否拥有无法被开源社区复制的训练效率。

在这个标准下，DeepSeek 拥有MLA（多头潜在注意力）、GRPO（组相对策略优化）和 DSA2（DeepSeek 稀疏注意力 2.0）。OpenAI 拥有测试时计算扩展（Test-time Compute Scaling）。Anthropic 拥有Constitutional AI和对齐的数学形式化框架。这些不是产品功能，是定义坐标系的能力，它们决定了整个行业如何理解“高效训练”“长上下文”和“安全可控”。

MiniMax 和智谱，都不在这个坐标系内。

但这不等于它们没有技术。公允地说，MiniMax 不是一家“纯产品公司”。早在2025 年初，它推出的MiniMax-01 首次将线性注意力（Lightning Attention）在工业级规模上跑通，就在最近，它的 M3 模型进一步推出自研稀疏注意力架构 MSA（MiniMax Sparse Attention），支持 100 万token 超长上下文。而专为 M3 训练的Agent 产品MiniMax Code，支持Computer Use、多文件代码库重构、长达 12 小时的自主编程任务。

智谱的GLM 架构同样也有不少创新。2021 年，智谱提出了“自回归填空+双向上下文”的GLM 范式，与BERT 和 GPT 形成了第三条道路。GLM-5 在保留自研MoE 路由和自回归填空框架的同时，引入了DeepSeek 开源的 DSA 组件以提升长上下文效率，这是开源生态中的正常技术吸收，不是“换皮”。GLM-5.2 在 Code Arena 盲测中拿下 1595 分，排名总榜第二，在全球可用模型中排名第一；在Design Arena（审美品味）上更是全球第一。

然而，原创技术不等于范式定义权，工程优化并不等于拥有改写模型底层的能力。

GLM 是“支流”而非“主流”，全球基座模型的语法仍是 GPT 路线的自回归。MiniMax 的线性注意力是组件替代而非架构重构，行业主流仍是标准 Transformer+各种稀疏优化，其线性注意力没有被全球社区广泛采纳为默认方案。

这和DeepSeek 不同，它的MLA/GRPO/DSA2 之所以形成代差，是因为创新发生在最底层的数学，且被全球社区迅速采纳为标准，所以，DeepSeek拥有基座模型的定义权，而智谱的定义权是不完整的。

没有核心技术定义权，就意味着没有定价权。MiniMax 的API 和 Code 服务在定价上仍面临DeepSeek 等开源模型的竞争压力；智谱的 MaaS 服务也只能在价格战和涨价之间摇摆。2026 年一季度，智谱API 价格累计上调 83%，编程套餐涨价 30%，调用量反而增长 400%。这看起来像是供不应求的“定价权”，实则是因为“龙虾热”期间，中国模型因低成本优势吸引了大量海外开发者和成本敏感型Agent工作流，厂商出于成本考虑，集体涨价。

拥有真正的技术溢价，是OpenAI 、Anthropic ，虽然定价高昂，但企业客户依然愿意买单。而智谱和MiniMax 的客户们，永远有替代方案。

智谱的问题，是被资本市场用L1 的逻辑定价，但它的技术基础之前只能支撑 L4 的定位。即使有了GLM-5.2，其技术基础仍然支撑的是L4定位，而非L1范式定义者。

更关键的是，没有核心技术定义权，叙事就会不断漂移。智谱从早期的“另一家中国版OpenAI”，切换到“开源先锋”，再切换到如今的“中国版Anthropic”，每一次切换，也都是因为上一个坐标系里的对标对象被证伪。MiniMax 的叙事正在从“多模态全球化”和“C 端陪伴”，向“M3 的Coding/Agent 能力”切换，但Coding/Agent 市场的商业验证尚未开始。

资本市场上，科技公司的定价某种程度上就是定位叙事，但错误的定位叙事，总有一天会被修正。

02

技术溢价的缺失，如果能被商业模式的指数级增长弥补，公司依然可以获得高估值。但MiniMax 和智谱的商业模式，都困在线性增长的陷阱里。

MiniMax 此前的营收结构建立在 C 端陪伴产品之上。据其财报及公开披露，2025全年营收约 7903.8 万美元（约 5.7 亿元人民币），同比增长 158.9%，海外收入占比超过 70%，主要来源是 Talkie、星野等应用的付费和广告。2026 年 2 月，其年度经常性收入（ARR）突破 1.5 亿美元，过去两个月实现翻番。

但这些数字背后有一个隐忧：C 端AI 陪伴产品的用户没有迁移成本。用户因为新鲜感下载，但没有社交关系链的锁定，最终会因为新鲜感过去而流失。Character.AI、ChatGPT、甚至DeepSeek 的开源模型，都在持续挤压MiniMax 的用户时长。

为了维持增长，MiniMax 必须不断投入高额获客成本，而留存率却难以提升。这不是平台型公司的网络效应，而是内容型公司的流量消耗，每一分钱增长，都需要对应一分钱的营销投入。其 2025 全年经调整净亏损 2.51 亿美元，年内亏损同比扩大，正是这种“烧钱换流水”模式的直接结果。

所以，M3 的Coding 能力和MiniMax Code 产品的发布，表明它正在试图摆脱“纯陪伴”标签。问题在于：Coding/Agent 市场的竞争同样激烈（Cursor、Claude Code、GitHub Copilot 已占据生态位），而MiniMax Code 的排名并不靠前，并且开发者渗透率、付费转化率、企业级客户数量，目前都缺乏独立第三方的验证。它有了“第二曲线”的技术基础，但“第二曲线”的商业验证，尚未开始。

智谱的商业模式此前同样无法指数增长。2025 年，智谱营收 7.24 亿元，其中本地化部署收入 5.34 亿元，占比 73.7%；云端 MaaS 及API 收入仅 1.9 亿元，占比 26.3%。本地化部署意味着项目制，工程师驻场、模型微调、数据对接、安全适配、持续运维。每个政府或金融客户都需要非标定制，人效无法提升，毛利率被人力成本持续侵蚀。

虽然 2026 年 3 月其 MaaS 平台ARR 达到17 亿元，过去 12 个月提升 60 倍，但这更多是从极小基数开始的爆发，目前还未看到可持续的指数曲线。这还意味着销售模式的转变，此前智谱为了承接ToG 项目，将内部组织调整为按区域建立地方项目团队，这种结构更接近传统的系统集成商，而非平台型科技公司。

真正的规模效应，要求同一套产品以极低的边际成本服务无限用户。OpenAI 的ChatGPT Plus 是标准化订阅，同一套模型服务全球数亿用户；DeepSeek 的API 是标准化调用，同一套权重通过云计算分发给全球开发者。它们的增长公式是“用户量×ARPU×留存率”。

而过去无论智谱还是MiniMax的变现方式困在“人力×时间”的线性公式里。资本市场给 SaaS 公司 30-50 倍PS，是因为相信其未来三年营收可以每年翻倍；而给项目制公司或流量型公司 10-15 倍PS，是因为知道其增长受限于人力和预算。智谱和MiniMax 之前的估值，显然建立在前者的假设上，但财务数据却不断证明后者才是现实。

当然，现在智谱有了GLM-5.2，MiniMax 有了M3，都有了切入订阅制的产品。如果GLM-5.2的API调用能保持高增长、留存率良好，那么，它就会从L4向L2/L3混合切换。

好消息是，全球开发者尤其是个人开发者越来越愿意调用DeepSeek、智谱、Qwen的API，不愿意再给Anthropic交“税”；坏消息是，竞争压力下，大家都大打价格战，就连Anthropic也推出了新版性价比模型Sonnet 5，能自己规划任务、调用浏览器和终端，跑分逼近自家最贵的Opus 4.8，价格却只要后者的六成左右。

另外，如果DeepSeek按市场传闻迭代推出更专注coding的V4.1，同时着手研发Agent Harness，一个基座模型更强、token成本更低的对手，显然会压制智谱、MiniMax 的空间。

模型层惨烈的价格战会爆发，算力成本、需求还在持续增长，巨头的降价会进一步挤压市场生存空间，直到出现出清。这对于中小玩家来说，并不是好消息。

03

2026 年1 月，MiniMax 在港股上市，首日收涨 109%，市值一度超过 1066 亿港元。到 6 月 30 日，股价收市417 港元，较 52 周高点 1330 港元跌去 68%，市值约 1308 亿港元。这距离其 5 月 29 日启动A 股上市辅导时 2635 亿港元的总市值，已经蒸发了超过 1327 亿港元。

市场用最直接的方式进行修正：当 C 端用户增长的故事被验证为“低留存、高流失、无壁垒”，当底层模型能力被验证为“跟随者而非定义者”，估值迅速回归常识。

智谱的修正来得更慢，但逻辑相同。2026 年1 月，智谱上市发行价 116.2 港元，到 6 月 22 日盘中一度触及2980 港元，市值突破一万亿港元，较发行价上涨超过 20 倍。然而，2025 全年智谱营收 7.24 亿元，经调整净亏损 31.82 亿元，研发开支 31.80 亿元，研发投入相当于收入的 4.4 倍。以万亿市值计算，其市销率（PS）超过 1000 倍。

作为参照，全球 SaaS 龙头Salesforce 的PS 约 8-10 倍，已盈利的AI 应用公司Palantir 的PS 高达五十多倍，2025 年底峰值时曾达 90-120 倍。即使按摩根大通预测的 2026 年营收 45.97 亿元计算，智谱前瞻PS 也超过 200 倍，远超任何可比的科技巨头。

正如之前所分析的，智谱万亿市值的问题，不是简单的“太贵了”，而是“被错误归类”。此前市场是按“中国版Anthropic”，全球AI coding范式的定义者，标准化API 经济的享受者给它定的价。但它技术底子和的财务结构都不支持这个叙事，当时它的业务模型更接近一家“中国版Palantir”：深耕政企的数据服务公司，项目制为主，增长受限于人力和预算。

Anthropic代表的是定义范式、平台化增长、生态溢价，Palantir代表的是深耕客户、项目交付、资质壁垒。

把两者放在一起，估值鸿沟就一目了然：对于Anthropic ，市场愿意给一个还没有盈利的范式定义者很高的容忍度，因为相信安全是未来所有AI 部署的刚性成本，而它定义了这条赛道。而作为一家已经盈利、产品化程度高、但仍是项目制为主的公司，市场给Palantir的滚动PS 是五十多倍。

两者之间，可能有十倍的估值差。需要指出的是，Palantir的市销率远高于行业平均水平，已经是行业地位溢价的天花板，即便如此，其股价、PS 也较最高点大幅回落。毕竟，所有叙事最后都得接受财报的重力。

更严峻的考验是解禁期。MiniMax 已经经历了这一过程，股价腰斩就是解禁和业绩双重压力的结果。智谱的基石限售股将在7 月 8 日解禁，原始股东面临巨大的减持动机，但具体选择取决于解禁当日的市场流动性与情绪博弈。

值得注意的是，MiniMax 早期投资方以美元 VC 为主，解禁后减持动机强烈且退出渠道有限；智谱的股东结构中，国资与战略产业资本占比更高，这类股东的更关注战略卡位而非短期财务回报。解禁不等于必然减持。

但面对高昂的市值，很难说股东们就不会动心思。

所以，严格来说，MiniMax 的估值修正已经大部分完成，而智谱的修正可能才刚刚开始。它们不是简单的“先后关系”，而是同一套结构性困境的两个版本：都有被低估的技术原创性，但技术深度不足以定义范式，商业模式无法支撑估值。

不过，DeepSeek 与智谱、MiniMax 也不是“你死我活”的敌对关系。

DeepSeek 开源 MIT 协议，本身就在邀请生态伙伴。智谱基于DeepSeek 做深度后训练（如 GLM-5.2 吸收DSA），MiniMax 则在自研 M3 基座之上构建Coding 和Agent 产品，如果智谱继续走这个路线，基于DeepSeek的基座模型做足后训练和产品开发，当市场意识到它是生态中的“好伙伴”，估值就会到它应有的位置。

但如果，智谱在下一代模型超越了Mythos 5，并提出被全球行业广泛采纳的底层标准，或者GLM-5.2以及后续产品的订阅有指数级增长，同时毛利率大幅改善，那么，智谱的市值会有个有力支撑，修正过程就会在中途戛然而止。

只是，要做到这点，智谱需要至少在一个维度上提出原创数学框架：在注意力机制上，不依赖DeepSeek 的DSA，而是提出新的、被全球社区采纳的、更优的稀疏化或压缩方案；不跟随 GRPO/PPO，而是提出新的、从统计估计理论出发的优化方法；不依赖人工标注的 RLHF，而是提出类似Constitutional AI 的数学形式化框架。或者，基于对模型的数学理解力，开拓出会被广泛接受的新线路。

这些都需要花数年不计商业回报的偏执投入和探索，需要不受 KPI 干扰的研究自由，以及最重要的，对GLM 架构第一性原理的重新解构能力。

在维护市值的压力下，智谱是否有这个定力，能否在充满不确定性和市值重构的数年里，保持坚持，起码目前没有看到相关的组织信号。

当然，争辩无异议，只有结果见真章。

我们也希望我们的看法是错的。

本文来自微信公众号“最话 FunTalk”，作者：最话团队

本内容旨在传递行业动态，不构成投资建议或承诺。