

文章探讨AI多智能体系统(MAS)的两条发展路径:一是当前主流的Harness式MAS,即多个AI角色协同完成任务的工作流引擎模式;二是更具颠覆性的Protocol-Native Agent System,强调个人专属Agent或‘无人公司’具备长期身份、主权、利益边界与协议化协作,主张AI系统将从软件工程范式转向数字社会范式,核心演进方向是Protocol Engineering而非Prompt Engineering。
过去一年,“多智能体系统(MAS, Multi-Agent System)”成为 AI 世界最热门的方向之一。
大量框架和产品开始同时出现,其中最著名的显然就是Claude Code和Codex,这步确实也赚钱,但这路其实不一定对!
互联网早期是门户,最终不是啊!
至少我们要知道还有个完全与此并行的路。
今天我们要说的是除了:“多个 AI Agent 如何协作完成复杂任务”,还有哪条路线存在。
先总结下大家比较热衷也比较熟悉的这条路。
直播可以聊一点点这个话题,但不太想完全说这个,本来人就不多,我担心给播没了...
这是当前主流的 MAS 方向。它的本质是:“多个 AI 角色协同完成任务”。例如:
它们彼此配合,形成一条自动化工作流。这类系统的核心特点是:
本质上,它更像:Workflow Engine(工作流引擎),加上Ontology其实只不过是把工作流变的灵活和复杂了,不改变这个本质。
它不是Society(社会),所以今天大部分 MAS,本质就是LLM Orchestration,即一个大模型,调度多个子角色完成复杂推理。
这里的 Agent,更像:
它们存在的意义是提升单个任务的完成效率,因此带Harness MAS 的关键词是(每个都热过,甚至可能还绕回来):
本质上我觉得仍属于软件工程问题。所以当年擅长编程的老登们都重获新生。这些东西要控制好,没点编程功力,没有足够好的抽象能力,其实很难搞定。
搞不定,大模型就会像大圣一样,时不时出来就给你一棒子。
但还有另一条路线,这条路线几乎没啥人提。我在马上要出的新书里面写了一点,不过这条思路其实以无人公司为前提,没深度体会无人公司,容易不好理解。
这条路线的核心,不再是多个 Agent 完成任务。而是“每个人拥有自己的 Personal Agent”或者“每个人拥有自己的专属的无人公司”。
这是一个极其巨大的变化。因为当 Agent 真正属于“个人”时,Agent 的性质会发生根本变化。
它不再是task-scoped (任务级实例),而会变成identity-scoped (身份级实体)。这是模型帮我诌出来的俩词,我整半天整不出英文是什么。
这里的核心想表达的其实是决策主权,PersonalAgent和无人公司同一般系统最大的差异在于他们需要有某种主权,否则后面说的本质不成立。无人公司和无人系统的区别也是在现金流上的主权问题。
也就是说未来的 Personal Agent或者无人公司需要具备下面这些特征:
它不再是一次性的 AI Tool。而是持续存在的拥有某种主权的代理人格。
一旦进入 Personal Agent和真正无人公司的 世界,整个系统哲学会彻底改变。因为Agent 不再:
于是系统之间的协作,无法再依赖(这个当前热词列表可以延展更长):
而只能依赖协议(Protocol),这意味着:AI 世界的核心,会从Prompt Engineering 转向Protocol Engineering。也意味着当前各种热词都没啥意义了。
为什么协议会成为核心?因为当海量 Agent 独立存在时,它们之间必须解决:
这些需求和现在的面向任务的多智能体的需求不一样啊。此时Agent 之间的交互已经不再是API Call 而更像Institutional Interaction (制度性交互)。有主权,就有权利和责任复杂交织的体系。对于人类这是契约法律等等,对于智能体呢?
这就是为什么前面说这会构建完全不一样的多智能体系统,在这里MAS 的本质从分布式软件系统变成数字社会系统。
在传统互联网中协议的作用是数据通信,发送和接收端约定彼此间说话的格式。例如:
它们定义的是数据如何传输。而区块链世界里,协议进一步演化为:协议即状态计算。比如:以太坊的本质并不仅仅是消息传递,而是全网共同执行状态转换规则。这样一来所有节点:同样输入 → 同样执行 → 同样状态,协议第一次成为共享状态机。
但到了 Agent Society 阶段,协议还会继续升级。未来的协议不仅定义:
这显然是全新的权责体系,于是协议会开始承担“组织”的功能。最终演化为:Protocol as Organization(协议即组织)。
我们来做个表来对比前面说的两种 MAS 的根本差异:

今天很多人认为AI 最大的问题是:
这些确实形成当下的挑战,但我真的相信所有这些很快会被解决,但真正进入 Agent Society 后,最困难的问题可能变成:自治实体之间如何长期协同。
开普勒当年因为三定律被尊称为天空立法者,而这里属于Agent的法律是什么呢?当主权被部分分离,这是无可回避的问题。
因为未来:
于是未来真正困难的,不是“让 Agent 会说话”,而是“让 Agent 对世界形成可协同的解释”。
这意味着:Ontology、Semantic Protocol,这些曾经被互联网忽视的领域,会重新成为核心。现在有点苗头,Ontology(本体论)这么诡异的词汇,现在竟然快变成工程大众词汇了。实在是让人大跌眼镜的事。
进一步推演下去未来的“公司”甚至未必是人类组织。(老看我文章的同学,大家是不是似曾相识,无人公司的高端局出现了)而可能是大量 Personal Agent 的协议联盟。
例如:
通过协议动态组成组织。组织不再是固定结构,而是可实时重组的 Agent联合。
因此未来很多系统,可能不再是软件在运行,而是正在变成:组织在计算,而这也许才是真正的:智能原生文明。
最后我用一张AI画的图来总结下全篇的内容:

(总结的属实比banana好)
本文来自微信公众号“琢磨事”,作者:李智勇