模型不要钱之后，AI 创业最贵的东西才刚刚出现

个人专栏

2026-06-26热度: 4952

随着大模型API价格大幅下降甚至趋近免费，AI创业的核心竞争焦点正从模型成本转向下游高壁垒环节：行业场景理解、企业级交付能力、合规嵌入与责任兜底。模型成为公共基础设施后，真正稀缺且昂贵的是将AI稳定、安全、可信地融入真实业务流程的确定性能力。

摘要由 Mars AI 生成

本摘要由 Mars AI 模型生成，其生成内容的准确性、完整性还处于迭代更新阶段。

文 | wiwi

过去两年，AI 创业者最怕的是模型太贵；到了 2026 年 6 月，他们可能要开始害怕模型太便宜了。

这不是一句修辞。模型调用的价格正在以肉眼可见的速度奔向零——而一个东西一旦免费，靠它赚钱的整套逻辑就得推倒重来。先看过去一个多月到底发生了什么。

事情要从五月下旬说起。DeepSeek 宣布 V4-Pro 的 API 价格永久降至原定价的约四分之一，每百万 token 的价格区间从 0.1—24 元一路压到 0.025—6 元——输入端两分多钱，直接击穿了行业底价。进入六月，战火从模型公司烧到云平台：腾讯云从 6 月 3 日起下调 DeepSeek-V4 系列价格，V4-Pro 的推理输入、输出均降 75%，缓存命中价格的降幅达到 97.5%；小米跟进降价，部分模型、部分计费项的最高降幅一度达到 99%。

开放权重这条线也在同步加速。月之暗面把 Kimi K2.7 Code 发布并开源；Cohere 拿出了 North Mini Code 1.0，一个面向代码生成和 agentic 软件工程的开放权重模型（Apache 2.0，30B 总参数、3B 激活，最低一张 H100 可跑）；智谱、字节等也在通过开源、开放权重或 API 上线，把模型能力进一步推向低成本供给。把价格战和开放权重这两条线放在一起，信号已经很清楚：模型这一层，正在被集体做成几乎不要钱的基础设施。

很多人把这件事读成应用层的利好：模型成本归零，创业门槛降低，套个壳就能上桌。

这个判断只对了一半。

第一层判断：成本下降，和利润上升，是两回事

这是理解整件事的关键。

模型降价降下来的，是全行业的共同成本，不是某一家公司的独占成本。这两者的区别，决定了省下来的钱最后流向哪里。如果一项成本只有你一家降了，它会变成你的利润；可一旦它对所有竞争者同时下降——大家用的是同一批开源模型、同一个降价后的 API——它就不再是任何人的优势。共同成本下降，最终往往不会沉淀成利润，而会变成下一轮价格战的弹药：所有人把省下的成本让给用户，再在功能同质化和买量获客上把它烧光，最后一起卷回原点。

所以模型免费没有把利润送进应用层，它做的是一件更隐蔽的事——把过去能拉开差距的"模型成本"这个变量，一笔抹平。差距被抹平之后，能让一家公司活下来的，只剩那些没被抹平的东西：对某个具体场景的理解、和客户之间攒下的信任、能不能持续把活儿稳定交付。应用层真正的护城河，从来不是 token 成本，而是获客、留存、工作流嵌入和客户关系。

模型层为什么要把 token 变成入口

先记住一句话，它能重新框定你对这场价格战的理解：模型层不是放弃赚钱，而是在放弃最容易被比价的那部分收入。 token 调用这门生意天然透明、可替换、可横向比较，几家模型放在一张价格表上一目了然，一旦开源追上来，它就再难承担高毛利。于是平台真正要做的，不是守住 token 价格，而是把 token 变成入口——模型 API 是免费或低价的获客漏斗最上沿，越多开发者把工作负载搬上来，后面的算力、存储、私有化部署、企业账号才是真正的账单。腾讯云这类平台主动跟降，根本不指望靠模型调用赚钱，靠的就是这个逻辑。

想清楚这个框架，背后那几股推力就各归其位。

一是成本端松动。推理成本随结构优化、量化和调度效率提升持续下降，国产算力适配补上供给。DeepSeek 这轮永久降价，外界普遍归因于成本效率和算力供给改善，而非赔本赚吆喝——它不是被迫贱卖，是有底气把这层做成水电。

二是开源在背后追赶。当 Kimi、North Mini Code 这类开放权重模型把"够用"的能力免费摆上货架，闭源模型再想靠 token 差价维持高毛利就很难——你不降，开源就替客户降了。

三是 Agent 场景倒逼。智能体做一次多步任务，背后是几十上百次模型调用，单价不打下来，Agent 跑不起规模。模型层降价，某种程度上是在给上面的 Agent 生态铺路——铺的是别人家的路，进账的却是自己家的钱。

利润迁移到哪里

模型能很便宜地生成一段代码、一份报告、一套方案，但它生成不出"这套方案要不要上线"的判断，接不住"出了事谁负责"的那口锅，也搞不定一家企业把模型真正用起来之前的一长串工程：私有化部署与算力适配、企业知识库的治理与清洗、权限系统和数据隔离、可审计的日志、符合行业监管的合规改造、效果评测与回归、上线后的售后响应，以及责任兜底和定制化工作流的搭建。

这些没有一项是"模型能力"本身，但它们共同决定了模型能不能进入一个真实组织、跑在真实业务里。当生成本身不要钱，值钱的就只剩生成之外的这一整圈。这些东西听起来不像 AI，却恰恰是 AI 真正进入企业之后最贵的部分。

把它放进一个真实场景，就清楚了

抽象的清单容易让人点头就忘，换两个具体生意就一目了然。

一个做法律合同审查的 AI 产品。模型调用成本降到几乎可以忽略，"帮我总结这份合同的要点"这种能力，现在任何一个套壳工具都能免费做。客户真正愿意付费的，根本不在这里——他们要的是"能不能识别我们公司自己那套风险条款"、"能不能接进我们的 OA 审批流"、"每一次审查能不能留下可追溯的审计记录"、以及最要命的一句"如果它漏判了一条致命条款，谁来负责"。模型把"读懂合同"打成了白菜价，但把这家公司的合同流程真正跑通、并且敢为结果兜底的能力，反而变贵了。

跨境电商的客服 Agent 也一样。回复一封英文邮件、生成一段礼貌话术，早就不值钱。值钱的是它能不能接进店铺的订单系统、退款规则、物流异常和平台申诉流程，在高风险场景（大额退款、纠纷升级）自动转人工，并且不把客户的敏感数据喂到不该去的地方。客户买的不是"会说英语的机器人"，是"能嵌进我整条履约链路、出问题有边界"的确定性。

两个场景指向同一件事：模型变成免费的通用原料之后，客户的钱不再为"生成"付，而是为"嵌入、合规、兜底"付。利润的迁移，正发生在这里。