本文探讨了AI框架在加密领域的崛起及其潜在意义。AI框架作为底层开发工具,类似操作系统,为构建AI Agent提供支持。文章分析了几种主流框架(如Eliza、G.A.M.E、Rig等)的特点与应用场景,并将其比作未来的“公链”,而AI Agent则类似DApp。作者认为,AI框架的去中心化与上链化可能带来成本降低、安全性提升及新金融模式等优势,同时推动Web3创造者经济的发展。
原文标题:Deconstructing AI Frameworks: From Intelligent Agents to Decentralization Exploration
原文作者:Zeke,YBB
原文来源:https://cointelegraph.com/news/bitcoin-92-k-correction-triggered-long-term-hodlers-etfs
编译:Tom,火星财经
在此前的文章中,我们多次阐述了对 AI Memes 现状以及 AI Agent 未来发展的观点。然而,AI Agent 赛道的叙事发展与迭代速度仍然相当惊人。从“Truth Terminal”上线、迎来 Agent Summer 至今不过短短两个月时间,AI 与加密结合的叙事几乎每周都在演变。最近,市场的关注点开始转向“Framework”类项目,它们主要由技术叙事驱动。在这块相对小众的细分领域中,过去几周里已出现多家市值超过 10 亿美元的独角兽项目,还带动了一种全新的资产发行范式:项目根据其 GitHub 代码仓库来发行代币,基于这些框架构建的 Agent 同样也能发行代币。框架成为核心,Agent 则是上层应用,类似于一种资产发行平台,但本质上却是 AI 时代下涌现的全新基础设施模式。我们该如何看待这一全新趋势?本文将从框架的角度出发,结合自身思考,对 AI 框架对加密行业意味着什么进行解读。
从定义上看,AI 框架是一个底层开发工具或平台,集成了一系列预构建的模块、库和工具,用于简化构建复杂 AI 模型的流程。通常包含数据处理、模型训练、推理预测等功能。简单来说,可以将它视作 AI 时代的操作系统,类似于桌面端的 Windows、Linux,或移动端的 iOS、Android。每种框架都有自己的优缺点,开发者会基于需求来选择。
虽然“AI 框架”在加密圈仍是个相对新鲜的概念,但其发展在传统 AI 社区里可追溯至 2010 年的 Theano,已有近 14 年历史。谷歌的 TensorFlow、Meta 的 PyTorch、百度的 PaddlePaddle、字节跳动的 MagicAnimate 等都是当今学界和业界广泛使用的成熟框架,各自都在不同场景下有相应优势。
当前在加密领域涌现的 AI 框架项目,则基于 AI 热潮下对大量 Agent 的需求,又进一步分化到加密中的其他赛道,最终形成各自针对特定子领域的 AI 框架。我们先了解几款业内主流框架,以此更直观地说明。
首先是由 ai16z 推出的 Eliza,一个多 Agent 仿真框架,旨在创建、部署并管理自治式 AI Agent。其主要编程语言是 TypeScript,优点在于兼容性良好,API 集成难度更低。根据官方文档,Eliza 更偏重社交媒体场景,提供对多平台的支持。它有完备的 Discord 集成功能(含语音频道),也可对接 X/Twitter 与 Telegram,能够进行直接的 API 调用。在多媒体处理层面,它能读取并分析 PDF 文档、提取与总结链接、进行音频转写、视频内容处理、图像分析与对话总结。
Eliza 目前支持四类应用场景:
当前可使用的模型包括:
G.A.M.E(Generative Autonomous Multimodal Entities Framework)是由 Virtual 推出的多模态 AI 框架,专注于游戏中的智能 NPC 设计。其特点在于,低代码甚至零代码的用户也可通过可视化试用界面,修改参数来设计 Agent。
在项目架构方面,G.A.M.E 采用了模块化设计,让多子系统协同工作。其详细结构如下:
工作流程:开发者通过 Agent Prompting Interface 创建 Agent,感知子系统将输入交给策略规划引擎,后者结合记忆系统、世界上下文和 Agent 仓库进行规划并执行,学习模块对 Agent 的行为进行监控并实时调整。
应用场景:该框架主要聚焦虚拟环境中 Agent 的决策、反馈、感知以及个性等层面。除游戏外,在元宇宙领域也可应用。官方透露已有不少项目基于该框架构建。
Rig 是使用 Rust 编写的开源工具,旨在简化大语言模型(LLM)应用的开发工作,可提供统一接口让开发者方便地与多家 LLM 服务商(如 OpenAI、Anthropic)及多种向量数据库(MongoDB、Neo4j)交互。
关键特性:
工作流程:用户请求先进入“服务提供商抽象层”,将不同提供商的差异做统一封装并进行统一错误处理。核心层中,智能 Agent 可调用各类工具或向量存储查询信息,最后采用 Retrieval-Augmented Generation(RAG)等机制综合文档检索和上下文理解,生成精准的回应返回给用户。
应用场景:适合搭建快速精准的问答系统,构建高效文档搜索工具,开发具备情境感知的聊天机器人或虚拟助理,乃至基于已知数据模式自动生成文本或其它内容的场景。
ZerePy 基于 Python 的开源框架,旨在简化 AI Agent 在 X(原推特)平台的部署与管理。其前身是 Zerebro 项目,沿袭了核心功能,但以更模块化、更可扩展方式设计,让开发者能轻松创建个性化 AI Agent,实现自动化任务、内容创作。
ZerePy 提供命令行(CLI)界面,方便用户管理、控制所部署的 AI Agent。其核心采用模块化设计,可集成的功能模块示例:
整体而言,ZerePy 与 a16z 的 Eliza 都致力于搭建与管理 AI Agent,但各自侧重点不同。Eliza 更偏向多 Agent 仿真及广泛 AI 研究,ZerePy 则专注在特定社交平台(X)的应用部署,具有更强的落地导向。
如果从发展路径看,AI Agent 与 2023 年底到 2024 年初的 BTC 生态颇为相似。BTC 生态的简要脉络是:BRC20-Atomical/Rune 等多协议竞争 — BTC L2 — 围绕 Babylon 的 BTCFi。AI Agent 虽然基于传统 AI 技术栈更成熟,但整体发展轨迹也体现出某种相似:GOAT/ACT — 社交型 Agent — 分析型 AI Agent 框架竞争。从趋势来看,围绕 Agent 的去中心化与安全性等基础设施项目,可能会接力这股“框架”浪潮,成为下一阶段重点。
那么,这条赛道会不会如 BTC 生态一样,最终陷入同质化与泡沫化?我认为不太会。首先,AI Agent 的叙事并不在于重走智能合约链老路;其次,无论现有 AI 框架类项目在技术方面是真材实料,还是 PPT 阶段、或者是简单的 Ctrl+C/V,好歹都给出了新基础设施思路。很多文章将 AI 框架比作资产发行平台,而将 Agent 比作“资产”。但我个人更倾向于认为,AI 框架对应着未来的“公链”,而 Agent 则对应未来的 DApp。
在今天的加密世界里,我们有成千上万条公链、数以万计的 DApp;通用链方面有 BTC、Ethereum 和各种异构链,应用链形态更是丰富,如游戏链、存储链、Dex 链等。公链与 AI 框架本质上有相似之处,DApp 则与 Agent 的角色高度对应。
所以,在“Crypto in AI”时代,生态很可能演变成这种形态,未来争论的焦点或将从 EVM 与异构链之争转向对“Framework”路线的讨论。当前更关键的问题是去中心化或“上链化”如何进行。我相信,未来的 AI 基建项目会围绕此基础继续演进。另一个重要问题是:把这套东西搬到区块链上,究竟意义何在?
不管区块链与什么结合,最终都会面临“有没有实际意义?”的问题。去年我就曾在文章中批评 GameFi 在基础设施进度上“跑偏”。在此前有关 AI 的文章中,也表达了对“AI + Crypto”当下落地价值的怀疑。毕竟,传统叙事驱动力的减弱已是大势所趋,而去年价格表现尚可的项目,往往能“硬扛”或超越行情。
AI 对 Crypto 有何帮助? 此前我只想到过 AI Agent 代替用户做任务、元宇宙、让 Agent 做“员工”之类比较常规但确实有部分需求的场景。可这些需求并不一定要全部上链,而且在商业逻辑上也难形成闭环。上篇文章提到的 Agent 浏览器虽可通过意图执行产生数据标注与算力需求,但这两点与区块链的结合并不紧密,而算力依旧是中心化占优。
回顾 DeFi 的成功,它能在传统金融中占据一席之地,是因为具备更高可及性、更好效率、更低成本与去信任安全。如果套用此框架,我推测 Agent 上链化或许在以下几方面有意义:
未来的框架类项目还会提供类似“GPT Store”那样的创业机会。对普通用户而言,当前通过框架来启动一个 Agent 仍然较为复杂。不过,若能进一步简化构建过程,并组合更多复杂功能,这类框架将有不小竞争优势,也可能促成一种更有趣的 Web3 创造者经济,大大超越 GPT Store 的体验。
目前的 GPT Store 仍更偏向传统应用,爆款应用大多由 Web2 公司制作,收益也多由创作者“独占”。根据 OpenAI 官方说明,他们只是在美国范围内给优秀开发者提供资金扶持,额度有限。
从需求层面看,Web3 仍有大量空白,且在经济体系上也能让 Web2 巨头主导的政策变得更加公平。与此同时,我们可天然引入社区经济来进一步改善 Agent。围绕 Agent 的创造者经济,将为普通人提供更多参与机会。届时 AI Meme 会远比如今的 GOAT 或 Clanker 等 Agent 要更“聪明”、更有趣。