

随着大模型API价格大幅下降甚至趋近免费,AI创业的核心竞争焦点正从模型成本转向下游高壁垒环节:行业场景理解、企业级交付能力、合规嵌入与责任兜底。模型成为公共基础设施后,真正稀缺且昂贵的是将AI稳定、安全、可信地融入真实业务流程的确定性能力。
文 | wiwi
过去两年,AI 创业者最怕的是模型太贵;到了 2026 年 6 月,他们可能要开始害怕模型太便宜了。
这不是一句修辞。模型调用的价格正在以肉眼可见的速度奔向零——而一个东西一旦免费,靠它赚钱的整套逻辑就得推倒重来。先看过去一个多月到底发生了什么。
事情要从五月下旬说起。DeepSeek 宣布 V4-Pro 的 API 价格永久降至原定价的约四分之一,每百万 token 的价格区间从 0.1—24 元一路压到 0.025—6 元——输入端两分多钱,直接击穿了行业底价。进入六月,战火从模型公司烧到云平台:腾讯云从 6 月 3 日起下调 DeepSeek-V4 系列价格,V4-Pro 的推理输入、输出均降 75%,缓存命中价格的降幅达到 97.5%;小米跟进降价,部分模型、部分计费项的最高降幅一度达到 99%。
开放权重这条线也在同步加速。月之暗面把 Kimi K2.7 Code 发布并开源;Cohere 拿出了 North Mini Code 1.0,一个面向代码生成和 agentic 软件工程的开放权重模型(Apache 2.0,30B 总参数、3B 激活,最低一张 H100 可跑);智谱、字节等也在通过开源、开放权重或 API 上线,把模型能力进一步推向低成本供给。把价格战和开放权重这两条线放在一起,信号已经很清楚:模型这一层,正在被集体做成几乎不要钱的基础设施。
很多人把这件事读成应用层的利好:模型成本归零,创业门槛降低,套个壳就能上桌。
这个判断只对了一半。
这是理解整件事的关键。
模型降价降下来的,是全行业的共同成本,不是某一家公司的独占成本。这两者的区别,决定了省下来的钱最后流向哪里。如果一项成本只有你一家降了,它会变成你的利润;可一旦它对所有竞争者同时下降——大家用的是同一批开源模型、同一个降价后的 API——它就不再是任何人的优势。共同成本下降,最终往往不会沉淀成利润,而会变成下一轮价格战的弹药:所有人把省下的成本让给用户,再在功能同质化和买量获客上把它烧光,最后一起卷回原点。
所以模型免费没有把利润送进应用层,它做的是一件更隐蔽的事——把过去能拉开差距的"模型成本"这个变量,一笔抹平。差距被抹平之后,能让一家公司活下来的,只剩那些没被抹平的东西:对某个具体场景的理解、和客户之间攒下的信任、能不能持续把活儿稳定交付。应用层真正的护城河,从来不是 token 成本,而是获客、留存、工作流嵌入和客户关系。
先记住一句话,它能重新框定你对这场价格战的理解:模型层不是放弃赚钱,而是在放弃最容易被比价的那部分收入。 token 调用这门生意天然透明、可替换、可横向比较,几家模型放在一张价格表上一目了然,一旦开源追上来,它就再难承担高毛利。于是平台真正要做的,不是守住 token 价格,而是把 token 变成入口——模型 API 是免费或低价的获客漏斗最上沿,越多开发者把工作负载搬上来,后面的算力、存储、私有化部署、企业账号才是真正的账单。腾讯云这类平台主动跟降,根本不指望靠模型调用赚钱,靠的就是这个逻辑。
想清楚这个框架,背后那几股推力就各归其位。
一是成本端松动。推理成本随结构优化、量化和调度效率提升持续下降,国产算力适配补上供给。DeepSeek 这轮永久降价,外界普遍归因于成本效率和算力供给改善,而非赔本赚吆喝——它不是被迫贱卖,是有底气把这层做成水电。
二是开源在背后追赶。当 Kimi、North Mini Code 这类开放权重模型把"够用"的能力免费摆上货架,闭源模型再想靠 token 差价维持高毛利就很难——你不降,开源就替客户降了。
三是 Agent 场景倒逼。智能体做一次多步任务,背后是几十上百次模型调用,单价不打下来,Agent 跑不起规模。模型层降价,某种程度上是在给上面的 Agent 生态铺路——铺的是别人家的路,进账的却是自己家的钱。
模型能很便宜地生成一段代码、一份报告、一套方案,但它生成不出"这套方案要不要上线"的判断,接不住"出了事谁负责"的那口锅,也搞不定一家企业把模型真正用起来之前的一长串工程:私有化部署与算力适配、企业知识库的治理与清洗、权限系统和数据隔离、可审计的日志、符合行业监管的合规改造、效果评测与回归、上线后的售后响应,以及责任兜底和定制化工作流的搭建。
这些没有一项是"模型能力"本身,但它们共同决定了模型能不能进入一个真实组织、跑在真实业务里。当生成本身不要钱,值钱的就只剩生成之外的这一整圈。这些东西听起来不像 AI,却恰恰是 AI 真正进入企业之后最贵的部分。
抽象的清单容易让人点头就忘,换两个具体生意就一目了然。
一个做法律合同审查的 AI 产品。模型调用成本降到几乎可以忽略,"帮我总结这份合同的要点"这种能力,现在任何一个套壳工具都能免费做。客户真正愿意付费的,根本不在这里——他们要的是"能不能识别我们公司自己那套风险条款"、"能不能接进我们的 OA 审批流"、"每一次审查能不能留下可追溯的审计记录"、以及最要命的一句"如果它漏判了一条致命条款,谁来负责"。模型把"读懂合同"打成了白菜价,但把这家公司的合同流程真正跑通、并且敢为结果兜底的能力,反而变贵了。
跨境电商的客服 Agent 也一样。回复一封英文邮件、生成一段礼貌话术,早就不值钱。值钱的是它能不能接进店铺的订单系统、退款规则、物流异常和平台申诉流程,在高风险场景(大额退款、纠纷升级)自动转人工,并且不把客户的敏感数据喂到不该去的地方。客户买的不是"会说英语的机器人",是"能嵌进我整条履约链路、出问题有边界"的确定性。
两个场景指向同一件事:模型变成免费的通用原料之后,客户的钱不再为"生成"付,而是为"嵌入、合规、兜底"付。利润的迁移,正发生在这里。
第一类,纯 API 套壳应用,最危险。 全部价值就是调一个模型再套层界面。模型降价带来一段短暂的毛利改善,但很快被同行低价抹平——他们能做的,别人用同样接近零的成本也能做。没有场景纵深、客户关系和交付能力的套壳产品,是最先被挤干利润的一批。
第二类,云厂商和模型平台,在悄悄换收费点。 模型层清零不等于它们不赚钱,它们只是把账单后移:模型 API 是入口,真正的钱在私有化部署、专属算力、企业版账号、生态绑定和长期运维上。越多人免费用,越多企业最终要为后面那些难替代的部分付费。看懂这点,就明白这轮降价为什么是云厂商主动打的。
第三类,行业交付型团队,反而可能受益。 客户从不买"模型",买的是"能不能在我的业务里跑起来、出了问题有没有人负责"。当模型变成免费原料,这些团队过去最难报价、最常被当成免费售前的东西——流程理解、合规改造、责任兜底——反而显出稀缺。模型越便宜,他们卖的那份确定性越贵。
第一类在被抹平,第二类在搬家,第三类在接盘。判断自己处在哪一类,比纠结模型又降了多少更重要。
对独立开发者,这其实不是坏消息——前提是别误读它。
先说一句给安全感的话:不是所有套壳都会死,死的只是"只套一层壳"的。那些在模型外面又套上一层行业理解、客户关系和交付能力的人,模型免费之后反而会活得更舒服——他们的成本跟着降了,护城河却一点没被动过。降价杀死的不是"小",是"薄"。
免费模型不是让你少干活,而是逼你把价值往上挪。如果你还把自己定义成"一个调用大模型的产品",那层马上不值钱,你会和无数套壳者一起被卷进价格战。但如果你把自己重新定义成"在某个具体场景里,帮某一类人稳定交付某件难事的人"——前者的成本正在归零,后者的定价权正在变硬。
这也是一次筛选。过去,一个人靠 API、模板和一个前端界面,就能快速攒出一个 AI 工具;接下来,真正有价值的不再是"一个人能不能做出来",而是"一个人能不能切进一个足够具体的问题"。越小的团队,越不该站在通用能力上竞争——那是模型厂商和云平台的战场——而要站在具体场景、具体人群和具体交付上竞争。
回到六月这一连串的降价和开源。它确实是行业的进步:模型这层水电做成了人人用得起的基础设施,门槛实实在在地降了。但它同时按下了另一个开关——利润正在从模型层迁出,搬进下游那间更难进、也更难被复制的房子里。
模型不要钱之后,AI 创业里真正昂贵的东西才刚刚出现:不是更强的模型,而是把模型送进真实组织所需要的那一整套判断、交付和信任。看见迁移方向的人,会提前去下游那些更难标准化、也更难被替代的环节里占位;只盯着"免费"两个字的人,最后会发现:自己省下的不是成本,而是被迫交出去的定价权。