OpenAI和Anthropic带头念的经可能是歪的

李智勇
个人专栏
热度: 4602

文章探讨AI多智能体系统(MAS)的两条发展路径:一是当前主流的Harness式MAS,即多个AI角色协同完成任务的工作流引擎模式;二是更具颠覆性的Protocol-Native Agent System,强调个人专属Agent或‘无人公司’具备长期身份、主权、利益边界与协议化协作,主张AI系统将从软件工程范式转向数字社会范式,核心演进方向是Protocol Engineering而非Prompt Engineering。

摘要由 Mars AI 生成
本摘要由 Mars AI 模型生成,其生成内容的准确性、完整性还处于迭代更新阶段。

过去一年,“多智能体系统(MAS, Multi-Agent System)”成为 AI 世界最热门的方向之一。

大量框架和产品开始同时出现,其中最著名的显然就是Claude Code和Codex,这步确实也赚钱,但这路其实不一定对!

互联网早期是门户,最终不是啊!

至少我们要知道还有个完全与此并行的路。

今天我们要说的是除了:“多个 AI Agent 如何协作完成复杂任务”,还有哪条路线存在。

先总结下大家比较热衷也比较熟悉的这条路。

直播可以聊一点点这个话题,但不太想完全说这个,本来人就不多,我担心给播没了...

第一条路线:Harness式 MAS

这是当前主流的 MAS 方向。它的本质是:“多个 AI 角色协同完成任务”。例如:

  • 一个 Agent 写代码
  • 一个 Agent 做测试
  • 一个 Agent 做规划
  • 一个 Agent 做搜索
  • 一个 Agent 做审查

它们彼此配合,形成一条自动化工作流。这类系统的核心特点是:

  • 共享上下文
  • 共享目标
  • 中心化调度
  • 临时角色
  • 无长期身份
  • 无持续利益
  • 无真正所有权

本质上,它更像:Workflow Engine(工作流引擎),加上Ontology其实只不过是把工作流变的灵活和复杂了,不改变这个本质。

它不是Society(社会),所以今天大部分 MAS,本质就是LLM Orchestration,即一个大模型,调度多个子角色完成复杂推理。

这里的 Agent,更像:

  • 可调用的函数
  • 带人格的工具
  • 任务节点

它们存在的意义是提升单个任务的完成效率,因此带Harness MAS 的关键词是(每个都热过,甚至可能还绕回来):

  • Prompt Engineering
  • Context Management
  • Task Routing
  • Tool Calling
  • Planning
  • Memory
  • Workflow

本质上我觉得仍属于软件工程问题。所以当年擅长编程的老登们都重获新生。这些东西要控制好,没点编程功力,没有足够好的抽象能力,其实很难搞定。

搞不定,大模型就会像大圣一样,时不时出来就给你一棒子。

“Harness”这个词用反了

老登的春天

第二条路线:Protocol-Native Agent System

但还有另一条路线,这条路线几乎没啥人提。我在马上要出的新书里面写了一点,不过这条思路其实以无人公司为前提,没深度体会无人公司,容易不好理解。

这条路线的核心,不再是多个 Agent 完成任务。而是“每个人拥有自己的 Personal Agent”或者“每个人拥有自己的专属的无人公司”。

这是一个极其巨大的变化。因为当 Agent 真正属于“个人”时,Agent 的性质会发生根本变化。

它不再是task-scoped (任务级实例),而会变成identity-scoped (身份级实体)。这是模型帮我诌出来的俩词,我整半天整不出英文是什么。

这里的核心想表达的其实是决策主权,PersonalAgent和无人公司同一般系统最大的差异在于他们需要有某种主权,否则后面说的本质不成立。无人公司和无人系统的区别也是在现金流上的主权问题。

也就是说未来的 Personal Agent或者无人公司需要具备下面这些特征:

  • 有长期记忆
  • 有持续身份
  • 有偏好
  • 有资源
  • 有权限
  • 有历史
  • 有关系网络
  • 有利益边界
  • 有代表性(代表“你”)

它不再是一次性的 AI Tool。而是持续存在的拥有某种主权的代理人格。

双原生架构,不用错AI的关键

从“软件模块”变成“数字社会”

一旦进入 Personal Agent和真正无人公司的 世界,整个系统哲学会彻底改变。因为Agent 不再:

  • 属于同一个模型
  • 属于同一个公司
  • 共享同一个上下文
  • 拥有同一个目标

于是系统之间的协作,无法再依赖(这个当前热词列表可以延展更长):

  • Prompt
  • Workflow
  • Shared Context

而只能依赖协议(Protocol),这意味着:AI 世界的核心,会从Prompt Engineering 转向Protocol Engineering。也意味着当前各种热词都没啥意义了。

为什么协议会成为核心?因为当海量 Agent 独立存在时,它们之间必须解决:

  • 身份确认
  • 权限边界
  • 信任机制
  • 委托关系
  • 协商机制
  • 激励机制
  • 声誉系统
  • 价值交换
  • 能力声明
  • 长期契约

这些需求和现在的面向任务的多智能体的需求不一样啊。此时Agent 之间的交互已经不再是API Call 而更像Institutional Interaction (制度性交互)。有主权,就有权利和责任复杂交织的体系。对于人类这是契约法律等等,对于智能体呢?

这就是为什么前面说这会构建完全不一样的多智能体系统,在这里MAS 的本质从分布式软件系统变成数字社会系统。

哲学笔记(7)

“协议即组织”

在传统互联网中协议的作用是数据通信,发送和接收端约定彼此间说话的格式。例如:

  • TCP/IP
  • HTTP
  • SMTP

它们定义的是数据如何传输。而区块链世界里,协议进一步演化为:协议即状态计算。比如:以太坊的本质并不仅仅是消息传递,而是全网共同执行状态转换规则。这样一来所有节点:同样输入 → 同样执行 → 同样状态,协议第一次成为共享状态机。

但到了 Agent Society 阶段,协议还会继续升级。未来的协议不仅定义:

  • 通信
  • 计算
  • 更定义:
  • 协调
  • 权限
  • 激励
  • 身份
  • 组织关系

这显然是全新的权责体系,于是协议会开始承担“组织”的功能。最终演化为:Protocol as Organization(协议即组织)。

我们来做个表来对比前面说的两种 MAS 的根本差异:

Protocol Engineering

“智能”之后

今天很多人认为AI 最大的问题是:

  • 推理能力
  • 模型能力
  • 长上下文
  • 多模态
  • Agent 执行

这些确实形成当下的挑战,但我真的相信所有这些很快会被解决,但真正进入 Agent Society 后,最困难的问题可能变成:自治实体之间如何长期协同。

开普勒当年因为三定律被尊称为天空立法者,而这里属于Agent的法律是什么呢?当主权被部分分离,这是无可回避的问题。

因为未来:

  • Agent 会拥有不同目标
  • Agent 会拥有不同世界模型
  • Agent 会拥有不同利益
  • Agent 会拥有不同记忆
  • Agent 会拥有不同价值体系

于是未来真正困难的,不是“让 Agent 会说话”,而是“让 Agent 对世界形成可协同的解释”。

这意味着:Ontology、Semantic Protocol,这些曾经被互联网忽视的领域,会重新成为核心。现在有点苗头,Ontology(本体论)这么诡异的词汇,现在竟然快变成工程大众词汇了。实在是让人大跌眼镜的事。

Palantir之秘

公司可能只是“Agent联合”

进一步推演下去未来的“公司”甚至未必是人类组织。(老看我文章的同学,大家是不是似曾相识,无人公司的高端局出现了)而可能是大量 Personal Agent 的协议联盟。

例如:

  • 你的 Agent
  • 我的 Agent
  • AI CFO
  • AI Lawyer
  • AI Sales
  • AI Factory

通过协议动态组成组织。组织不再是固定结构,而是可实时重组的 Agent联合。

因此未来很多系统,可能不再是软件在运行,而是正在变成:组织在计算,而这也许才是真正的:智能原生文明。

最后我用一张AI画的图来总结下全篇的内容:

Protocol Engineering

(总结的属实比banana好)

我建立了一个AI本体论的“宇宙”

策马长风春意老,苍黄世态客行迟。

本文来自微信公众号“琢磨事”,作者:李智勇

声明:本文为入驻“火星财经 专栏”作者作品,不代表火星财经官方立场。
转载请联系网页底部:内容合作栏目,邮件进行授权。授权后转载时请注明出处、作者和本文链接。未经许可擅自转载本站文章,将追究相关法律责任,侵权必究。
提示:投资有风险,入市须谨慎,本资讯不作为投资理财建议。
本内容旨在传递行业动态,不构成投资建议或承诺。