
文章以1858年大西洋海底电缆为历史隐喻,分析2026年中国大模型通过OpenRouter平台占据全球61% Token消耗份额的现象,指出其核心驱动力是电价优势、MoE架构降本、行业激烈内卷及OpenClaw等AI Agent工具引发的算力需求激增;本质是电力与算力服务以Token为载体的‘隐形出口’,构成中美在AI基础设施层面的战略博弈。
作者:黑色龙虾,深潮 TechFlow
1858 年的夏天,一根铜芯电缆横穿大西洋海底,把伦敦和纽约连在了一起。
这件事的意义从来不在于传输速度,而在于权力结构,谁铺设了海底电缆,谁就能在信息流动中抽水。大英帝国靠着这张全球电报网,把殖民地的情报、棉花的价格、战争的消息都攥在手里。
帝国的强大不仅是有舰队,还有那根电缆。
一百六十多年后,这个逻辑正在以一种意想不到的方式重演。
2026 年,中国大模型正在悄悄吃掉全球开发者市场。OpenRouter 最新数据显示,平台前十模型的 Token 消耗中,中国模型独占 61%,前三名清一色来自中国。旧金山、柏林、新加坡的开发者每天发出的 API 请求,正穿越太平洋海底光缆抵达中国数据中心,算力在那里消耗,电力在那里流动,结果传回来。
电力从未离开中国电网,但它的价值通过 Token 完成了跨境交付。
2026 年 2 月 24 日,OpenRouter 发布了一份周度数据:平台前十模型的总 Token 消耗约 8.7 万亿,中国模型独占 5.3 万亿,占比 61%。MiniMax M2.5 以 2.45 万亿 Token 空降榜首,Kimi K2.5、智谱 GLM-5 紧随其后,前三名清一色来自中国。

2 月 26 日最新数据
这不是偶然,一根导火索点燃了一切。
今年初,OpenClaw 横空出世,一个让 AI 真正开始"干活"的开源工具,可以直接控制电脑、执行命令、并行完成复杂工作流,GitHub 星标数周内突破 21 万。
金融从业者 John 第一时间安装 OpenClaw,并接入了 Anthropic API,开始自动监控股市信息,并及时汇报给出交易信号,几个小时后,他盯着账户余额愣了几秒:几十美元,没了。
这就是 OpenClaw 带来的新现实。过去跟 AI 聊天,一次对话几千个 Token,费用忽略不计。OpenClaw 接入之后,AI 在后台同时跑十几个子任务,反复调用上下文、循环迭代,Token 消耗不是线性的,是指数级的。账单像开着引擎盖的车在加速,油表往下掉,停不下来。
开发者社群里随即流传出一个“妙招”:用 OAuth 令牌把 Anthropic 或 Google 的订阅账户直接接进 OpenClaw,把月费制的“无限”额度变成 AI Agent 的免费燃料,这也是很多开发者采取的方法。
官方的反制随即到来。
Anthropic 在 2 月 19 日更新协议,明确禁止将 Claude 订阅凭证用于 OpenClaw 等第三方工具,要接入 Claude 功能,必须走 API 计费通道。Google 更是大面积封禁了通过 OpenClaw 接入 Antigravity 和 Gemini AI Ultra 的订阅账号。
“天下苦秦久矣”,Jhon 随即投入了国产大模型的怀抱。
在 OpenRouter 上,国产大模型 MiniMax M2.5 在软件工程任务上的得分是 80.2%,Claude Opus 4.6 是 80.8%,差距几乎可以忽略。但价格天差地别,前者输入端每百万 Token 0.3 美元,后者 5 美元,差了约 17 倍。
John 切了过去,工作流依然运转,账单缩水了一个数量级,这种迁徙正在全球范围内同步发生。
OpenRouter 的 COO Chris Clark 说得很直接,中国开源模型之所以能拿下大量市场份额,是因为它们在美国开发者运行的代理工作流中占比异常之高。
要理解 Token 出海的本质,必须先搞清楚一个 Token 的成本结构。
它看起来很轻,一个 Token 大约等于 0.75 个英文单词,你跟 AI 的一次普通对话,消耗的也不过几千个 Token。但当这些 Token 以万亿为单位堆叠,背后的物理现实就变得沉甸甸。
拆开 Token 的成本,核心只有两项:算力和电力。
算力是 GPU 的折旧摊销,你买下一块英伟达 H100,花大约三万美元,它的寿命换算到每一次推理,就是折旧成本。电力是数据中心持续运转的燃料,GPU 满载时每块耗电约 700 瓦,加上冷却系统的开销,一个大型 AI 数据中心的电力账单可以轻松超过年均数亿美元。
现在,把这个物理过程在地图上画出来。
一个美国开发者在旧金山发出一条 API 请求。数据从加利福尼亚出发,经由太平洋海底光缆抵达中国某地的数据中心,GPU 集群开始工作,电从中国的电网流向那些芯片,推理完成,结果回传。整个过程,也许只用了一两秒。
电力,从未离开中国的电网,但电力的价值,通过 Token,完成了跨境交付。
这里有一个普通贸易无法企及的神奇之处:Token 没有形体,不需要经过海关,不会被关税打到,甚至不在任何现行的贸易统计口径里。中国出口了大量算力与电力服务,但在官方的商品贸易数据上,它几乎是隐形的。
Token 成为了电力的衍生品,Token 出海本质是电力出海。
这也得益于中国地相对低廉的电价,综合电价比美国低约 40%,这是物理层面的成本差,竞争对手能轻易复制的。
此外,中国 AI 大模型也有算法和“内卷”优势。
DeepSeek V3 的 MoE 架构让推理时只激活部分参数,独立测试显示其推理成本比 GPT-4o 低约 36 倍,MiniMax M2.5 同样是 229B 总参数只激活 10B。
最上一层是内卷,阿里、字节、百度、腾讯、月之暗面、智谱、MiniMax……十几家公司在同一条赛道上互相踩踏,价格早就跌破了合理利润区间,赔本赚吆喝已经是行业常态。
细看一下,这和中国制造出海一样,利用供应链优势和行业内卷,将 Token 价格狠狠打下去。
在 Token 之前,还有一次电力出海。
大约在 2015 年前后,四川、云南和新疆的电站管理者,开始迎来一批奇怪的客人。
这些人租下废弃的厂房,装进密密麻麻的机器,24 小时通电运转。机器什么都不生产,只是不停地做一道数学题,偶尔,会从这道无穷无尽的数学题里,算出一枚比特币。
这是电力出海的第一代形态:把廉价水电和风电,经由矿机的哈希运算,兑换成全球流通的数字资产,再在交易所上变现为美元。
电力没有穿越任何边境,但电力的价值,以比特币为载体,流向了全球市场。
那几年,中国算力一度占到全球比特币挖矿算力的 70%以上。中国的水电和煤电,以这种迂回的方式,参与了一场全球资本的重新分配。
2021 年,这一切戛然而止。监管重锤落下,矿工四散,算力迁徙到了哈萨克斯坦、美国德克萨斯和加拿大。
但这个逻辑本身从未消失,只是在等待一个新的外壳,直到 ChatGPT 横空出世,大模型群雄逐鹿,曾经的比特币矿场摇身一变成为了 AI 数据中心,矿机变成了算力 GPU,曾经生产的比特币变成了 Token,不变的只有电力。
比特币出海和 Token 出海,在底层逻辑上是同构的,但 Token 在当下更有商业价值。
矿机挖矿是一个纯粹的数学计算,产出的比特币是一种金融资产,它的价值来自于稀缺性和市场共识,与“算了什么”毫无关系。算力本身没有生产性,更像是一个信任机制的副产品。
大模型推理不一样。GPU 消耗电力,产出的是真实的认知服务,代码、分析、翻译、创意。Token 的价值直接来自于它对使用者的效用。这是一种更深层的嵌入,一旦开发者的工作流依赖了某个模型,切换的成本会随时间积累而变高。
当然,还有一个关键差异:比特币挖矿是被中国驱逐出去的,而 Token 出海,是被全球开发者主动选择的。
1858 年铺设的那根海底电缆,代表的是大英帝国对信息高速公路的主权,谁拥有基础设施,谁就能定义游戏规则。
Token 出海,同样是一场没有宣战的战争,阻力重重。
数据主权是第一道墙,一个美国开发者的 API 请求经由中国数据中心处理,数据物理上流经了中国。对个人开发者和小型应用来说,这不是问题,但涉及企业敏感数据、金融信息、政府合规的场景,这是一道硬伤。这也是为什么中国模型的渗透率在开发工具和个人应用领域最高,在企业核心系统里几乎没有存在感。
芯片禁令是第二道墙,中国 AI 发展面临英伟达高端 GPU 的出口管制,MoE 架构和算法优化只能部分抵消这一劣势,天花板依然存在。
但眼前的阻力,只是序章,更大的战场正在成形。
Token 和 AI 模型,已经成为中美之间新的战略博弈维度,不亚于 20 世纪的半导体、互联网,甚至更接近一个更古老的比喻:太空争霸。
1957 年,苏联发射斯普特尼克一号,美国举国震惊,随即启动阿波罗计划,砸下相当于今天数千亿美元的资源,要在太空竞赛中绝不落败。
AI 争霸的逻辑与此惊人地相似,但激烈程度将远超太空竞赛。太空毕竟是物理空间,普通人感受不到,AI 渗透的是经济的毛细血管,每一行代码、每一份合同、每一个政府决策系统背后,都可能跑着某个国家的大模型。谁的模型成为全球开发者的基础设施默认选项,谁就在无形中获得了对全球数字经济的结构性影响力。
这正是中国 Token 出海让华盛顿真正感到不安的地方。
当一个开发者的代码库、Agent 工作流、产品逻辑都围绕某个中国模型的 API 构建起来,迁移成本会随时间指数级上升。届时,即便美国立法限制,开发者也会用脚抵制,就像今天没程序员无法抛弃 GitHub 一样。
今天的 Token 出海,也许只是这场漫长博弈的开篇。中国大模型没有宣称要颠覆什么,它们只是以更低的价格,把服务送到了全球每一个有 API Key 的开发者手里。
这一次,铺设电缆的,是那些在杭州、北京、上海写代码的工程师团队,和在南方某个省份昼夜运转着的 GPU 集群。
这场争霸没有倒计时,它每天 24 小时都在进行,单位是 Token,战场是每一个开发者的终端。