

MiniMax通过M3发布,将AI公司价值重心从模型智能(Intelligence)转向工作流能力(Task Completion),强调模型在真实企业场景中完成具体任务的能力,如修复Bug、网页操作、系统集成等,标志着AI行业从Benchmark竞争转向Workflow和生产力落地的新阶段。
过去,AI行业一直围绕一个问题竞争:谁拥有最聪明的模型。
模型参数、推理能力、Benchmark 排名,几乎构成了每一家 AI 公司发布会的全部内容。
无论是 OpenAI、Anthropic,还是智谱、MiniMax、月之暗面,讲述自己的方式都高度一致。
模型越聪明,公司价值越高,这是第一代大模型公司的共同叙事。
现在,这种叙事开始出现变化。
比如MiniMax M3发布,最醒目的内容不再只是模型能力,而是 BrowserComp、SWE Bench、Terminal Bench、OSWorld、MCP Atlas。

这些名字有一个共同特点,它们讨论的,不再是模型知道什么。
而是模型能够完成什么。
很多人把这种变化理解成 Agent。
但如果把时间线拉长,会发现 M3 更值得关注的地方,并不是 Agent,而是 MiniMax 对自身价值的重新定义。
它开始尝试回答一个过去行业很少认真回答的问题:一家 AI 公司真正出售的,到底是什么?
过去几年,竞争逻辑非常简单:模型能力,就是产品;Benchmark,就是价值。
MMLU,GSM8K,HumanEval,LiveCodeBench…
这些 Benchmark 的意义,从来不仅仅是技术测试,它们更像是一套市场共同认可的价值语言。
CPU 有 SPEC,GPU 有 MLPerf,数据库有 TPC。
每一个成熟产业都会形成自己的 Benchmark,因为市场需要一种统一标准,去理解产品价值、评估采购决策,也帮助资本形成共识。
因此,无论是参数规模,还是排行榜位置,都成为市场理解一家 AI 公司最直接的方式。
这一阶段,模型本身就是商品。
MiniMax M3,一个容易被忽略的变化: MiniMax 花了大量篇幅介绍另一类能力。

SWE Bench、BrowserComp、Terminal Bench、OSWorld、MCP,这些 Benchmark 有一个共同特点:它们几乎都不关心模型会不会回答问题。
它们关心的是:模型能不能修复真实 Bug,能不能独立完成网页操作,能不能调用开发环境,能不能连接企业系统,能不能完成一项完整工作。
换句话说,Benchmark 的评价对象开始发生变化。
过去评价的是 Intelligence,今天评价的是 Task Completion。
模型第一次开始接受"岗位考核",而不是"知识考试"。
这不仅仅是评测体系变化,它更像是 MiniMax 对市场释放的一种信号:
模型能力依然重要,但真正决定商业价值的,将是工作能力。
过去,大模型最重要的客户是开发者。开发者购买的是能力,他们关心模型是不是更聪明,是不是能够解决更复杂的问题。
但企业不同,企业采购 AI,很少关心模型在排行榜上排第几。
企业真正关心的是:它能够帮助业务完成多少工作?减少多少人工?进入多少流程?提升多少效率?
于是,产品表达也开始发生变化。
Browser,不再只是浏览器能力,而是进入办公流程;Coding,不只是代码生成,而是进入研发流程;Terminal,不只是 Linux,而是进入开发环境;MCP,也不只是协议,而是进入企业已有的软件系统。
如果把这些能力放在一起看,就会发现 MiniMax 想展示的,不是一个模型,而是一套工作流能力。
很多人仍然把 AI 公司理解为 API 公司,收入来自 Token。
调用次数越多,收入越高,这是第一代 AI 商业模式。
但今天,一个新的趋势正在出现。
越来越多企业购买 AI,并不是为了获得更多回答,而是为了完成更多工作。
修一个 Bug、整理一次会议、处理一张工单、分析一份合同、完成一次网页操作,价值单位开始发生变化。
过去,一次调用对应一个 Answer,今天,一次调用越来越对应一项 Task。
MiniMax M3 的产品设计,也越来越围绕这一逻辑展开。

模型成为底座,Workflow 成为产品。
如果把 M3 放到整个行业里看,会发现它代表的是一种新的产品叙事。
越来越多 AI 公司开始证明:工作能力。
这种变化,并不仅仅发生在 MiniMax。
Claude Code 强调的是开发工作流;OpenAI 的 Operator、Computer Use 关注的是任务执行;Google 不断强化 Gemini 在 Workspace 和浏览器中的协同能力。
行业正在围绕一个新的竞争单位展开:Workflow 和 Productivity。
资本市场真正关心的,从来不是技术领先本身,而是技术如何转化为持续收入。
模型能力能够建立技术壁垒。
但 Workflow 更容易建立商业壁垒。
因为工作流一旦进入企业,就意味着:数据沉淀、流程绑定、员工习惯、系统集成。
这些都意味着更高的续费率、更高的客户黏性,以及更稳定的商业模式。
因此,越来越多 AI 公司开始把产品叙事,从模型能力转向工作能力。
这并不是放弃模型,而是在寻找模型之外,更长期的价值来源。
把视角再拉高一点,会发现 M3 最值得关注的地方,并不是某一项 Benchmark。
而是 MiniMax 对未来竞争对象的重新定义:从另一家模型公司到企业工作入口、浏览器、IDE、Office、ERP、CRM。
企业的数据不会沉淀在一次聊天中,它最终沉淀在每天发生的工作流里。
谁能够进入更多工作流,谁就拥有更强的商业基础。
从这个意义上看,MiniMax 未来面对的,不只是 OpenAI 或 Anthropic。
更是所有定义企业工作方式的软件平台。
如果说过去的大模型竞争,是围绕 Intelligence 展开,那么今天,MiniMax M3 展示的是另一种竞争逻辑。

模型依然重要。
但模型正在从产品,变成基础设施。
真正站到台前的,是模型如何进入企业、连接软件、完成工作。
对于 MiniMax 来说,这或许比一次 Benchmark 排名更加重要。
因为它意味着,公司开始尝试回答一个新的问题:
当模型能力逐渐趋同时,一家 AI 公司还能依靠什么建立长期价值?
M3 给出的答案,不是更多参数,也不是更多排行榜,而是更多真实工作。
这或许也是 AI 行业进入下一阶段最重要的信号。
未来,决定一家 AI 公司价值的,不只是模型有多聪明,而是它能够帮助企业重新组织多少生产力。
本文来自微信公众号“奇点湃”