本文邀请了来自知名项目方和投资机构的一些朋友,一起从不同视角聊了聊对 ERC-4337 的一些最新的思考和想法。
原文作者:Buidler DAO
原文来源:Buidler DAO
引言
Vitalik 曾经在他一篇文章中,将智能合约钱包的采用描述为以太坊面临的三大重要转变之一。7 月份在 ETHCC 的演讲中,他也再次发表过对账户抽象历史和未来的看法,并认为账户抽象非常优雅。ERC-4337 是实现账户抽象的一个非常重要的标准。3月上线主网之后一直引发巨大的关注和讨论。到目前为止,超过 40 万个 ERC-4337 的账户已经部署在以太坊和一些 L2 上,其中大部分的账户是上个月开始创建的。突然的增长加速离不开 Buidler 们共同的努力和建设,比如 Polygon 链上 ERC-4337 账户的近期增长主要来自 CyberConnect V3 版本更新带来的流量。我们邀请了来自知名项目方和投资机构的一些朋友,一起从不同视角聊了聊对 ERC-4337 的一些最新的思考和想法。
https://dune.com/niftytable/account-abstraction?ref=0xtrends.com
📖本期干货满满, 建议音频+文字搭配食用~
https://twitter.com/BuidlerDAO/status/1690692311896961024?s=20
主持 & 嘉宾
1. 4337设计的优雅之处和未来的改进方向
2. Audrey 对账户抽象发展历史的观察,以及在早期投资 UniPass 的原因
3. CyberConnect 对 Onboarding 的思考,V3 引入4337的出发点以及实践4337过程中需克服的技术难点
4. Ethstorage 在其存储层上所作的 dApp 探索及 AA 在其中可能带来的对用户体验的改进,Qiang 尤其推荐 Vitalik “The Three Transitions ”这篇文章
5. 只有4337能完成的一些场景,4337自身如何被大规模采纳
6. 对 L2 竞争的一些看法:技术并非全部,应用生态、先发等因素也很重要
7. 其他可能对 Mass Adoption 有深刻影响的协议和因素:ERC-6551,以太坊从世界“计算器”——>世界计算机,App Chain
8. 对 Mass Adoption 的展望
Jane
第一个问题,因为我们听众里可能有一些朋友对4337不是很了解,想请大家先来聊一聊4337里印象深刻的一些新的功能和巧妙的设计。
Qiang
在我看来4337的整个设计还是非常有意思的一个设计。从我的角度看的话4337整个的结构跟 L2 是非常像的。大家类比 L2 的话,4337的 UserOperation 就类似于 L2 大家都发的交易,但这种交易没法直接发送到 L1 的 Mempool 里被 Validator 打包。它们都会通过现在偏中心化的一个角色来打包(不管是 sequencer 还是 Bundler ),然后再去到 L1 链上。不同的是,现在的这种 L2,不管是计算型的或者存储型的 L2,它的一个目标是来解决比如说扩容的问题,计算型的扩容或者存储型的扩容。但 4337 它的改善实际上是一种去改善用户体验的 L2。这个层面是我觉得还挺有意思的一个类比。4337这种 L2 它可以被融合到计算型的 L2 里面,比如说StarkNet,zkSync 它们都原生地支持这种 AA 的东西。
Zhimao
首先在4337的标准里面有不同的组件构成了这个协议。在我看来的话,比如说在概念里面的 UserOp 或者 bundler 的设计,它很优雅的地方在于在没有修改以太坊底层的 Protocol 和没有进行强制升级的情况下,能够改变整个 transaction 以及 transaction fee 流程。所以说它叫 alternative Mempool,就是它有个可替代的 Mempool,然后去改变这个 transaction 的流程,我觉得设计上是非常优雅的,这是第一点。第二点优雅的地方在于它改变了 transaction 流程以后,把 gas 费的支付逻辑抽离出来了。这个相比传统的 Mempool 的一个好处是大家可以去开发基于自己逻辑的一些更加灵活的 gas 费的代付逻辑。很有意思的比如说最近的 Visa 用信用卡来帮用户带付 gas。然后像我们 CyberConnect 新出的钱包也是允许用户在任意一条链上充值它的 gas,并且在任意一条链上使用,从而有一个全链支付 gas 费的这种体验在里面。
但是其实整个4337的设计在我看来还是有一些牺牲的,比如说它在安全性或者成本上的牺牲。它目前的设计在 gas 费的 overhead 上会比较多,因为改变了 transaction 的流程后,需要有很多不同的合约和一些额外的操作去完成这件事情,所以会导致 gas 的成本上是有牺牲的。另外在安全性层面,它不同的组件会有一些安全性的问题。目前大家也还是在积极地探索怎么能够避免让 Alternative Mempool 遭遇 Sybil attack 或者相似的安全性的攻击。
Jane
顺着 Zhimao 的问题正好想问问 Yuxing,在你之前的研究中提到像 Bundler 和 Aggregator 在早期主要是中心化的构建方式,你觉得后面它们是不是有可能会形成一些模块化的网络?包括 Zhimao 刚刚也提到了安全性的问题,太过中心化可能也会有一些安全隐患。
Yuxing
去中心化可能会包括几个方面。Bundler 你可以把它理解为就像以太坊的客户端一样,可能会有用 Rust 实现的 Bundler,或用 Python 实现的 Bundler 等。这个客户端的多样性是一个去中心化。还有一个是某一个 Bundler,比如说我用 Rust 写的 Bundler,它不是由一家公司全部控制的,而是一个去中心化的网络的形式进行组建的。比如说我们投的 Stackup,目前来讲还是一个偏中心化的方式运行 Bundler。但他们也在和很多运营商协商来帮他们 host 一些节点,这样子去做一个去中心化的 Bundler网络。他们自己会提供一个 Nodes as a Service 的功能来做这个服务。所以我觉得最后会变成模块化的这个趋势还是在的,包括4337本身就是模块化的一个事情。
然后现在有很多说他们做账户抽象,做4337,做智能合约钱包都做模块化,这里可能会有一些概念上的混淆。4337肯定是智能合约钱包,因为它本身就是一个合约。但有的时候我们提到的模块化更多是智能合约钱包的模块化,不是 4337的模块化。因为4337它本来就有几个模块,比如 Bundler 是一个模块,入口点合约是一个模块,这些是不同的合约模块。智能合约的模块化可能指的是一些智能合约钱包的模块化,比如它的智能合约所对应的一些功能变成一个模块,从而可以互相组合。我们在听到一些产品的时候说它具有很多种功能,但这些功能不一定是模块化的。以 Biconomy 为例,至少在目前这个阶段它不是模块化的,但其他模块化钱包的功能它也全都有,只不过实现方式不同。
这是我关于模块化的趋势,以及4337它底层的 Bundler 网络会不会去中心化的一些想法,不知道其他人有没有一些想法。
Audrey
正好我最近也在思考这个问题,我觉得就像刚才 Yuxing 和 Qiang 说的,如果类比的话,我们可以把它类比到 Rollup 里面的 Sequencer。但其实这里面在商业化和后面可能会有一个问题,大家也可以探讨一下。就是我们现在,包括很多的 L2,大家看到了其实都是需要去中心化的 Sequencer 方案。但是这里面就有一个很 tricky 的问题,如果一家独立的机构或者一个独立的项目搭建出非常漂亮的去中心化 Sequencer 方案,但是它在大项目的采用性上可能就会存在问题。很多大项目,比如说 OP 它们自己也在做去中心化的 Sequencer 方案,那大家就会面临一个为什么要采用你的问题。很多的可能自己的方案出来了之后,就也有可能会被其他的大的 L2 的一些项目所采用。所以这里面我在想的可能性的一个问题就是当 AA 也形成方案性的垄断,比如某些机构形成方案性的垄断优势之后,它可能会涵盖上下游,比如说它自己去做一个去中心化的类似于 Bundler 的方案之类的。这个问题感觉也可以探讨一下。
Yuxing
我很赞同 Audrey 说的这个事情。就是我们一直在想,4337它是从下往上走还是从上往下走?从下往上走,就是指先去做基础设施。入口点合约基本上是被垄断了(Ethereum Foundation),不会有人去做,但是 Bundler 它是有很多商业化公司去做,并且有不同的解决方案,然后大家去进行竞争,有点像以太坊的客户端。从下往上走是指我做完了这个之后,占据了市场,我会不会去做 C 端?另外一个是我现在有 C 端流量入口,我先去采用一些公共的方案,然后当所有的用户都通过我作为一个流量入口,最后我再去采用自己的这个 Bundler 方案。因为其实 Bundler 可以挣钱,只是现在不挣钱。
我们当时也做过这样子的一个思考,我们最后心里的答案,也不一定是对的,还是觉得可能是一种从上往下的方式,现在是从下往上的方式是暂时的(注:「下」指基础设施,「上」指 C 端)。那最后肯定还是 C 端掌握流量为王,然后它去下沉做自己的基础设施。我们有这个想法源于我们是从经济的角度去思考这个问题的,当 C 端具有足够的议价权的时候,如果他采用自己自研的方案,成本会更低,并且还能自己赚钱。所以综合来讲,我觉得这是一块面包的问题。就是当这个面包在目前这个阶段没有这么吸引人的时候,他就让别人去做,当它很吸引人的时候,如果他是有议价权的,他就一定会自己去做,能够增加营收何乐而不为呢?我觉得商业的本质,终局就是垄断。
Audrey
对,所以最后有可能从这里面也会跑出来一个新的 Flashbots,然后开始搞自己的 MEV, chain, L2, 这也挺有意思的。
Yuxing
对,关键这个时间点可能就没有那么好把握了。
Qiang
我觉得这里面可能有一个 Bundler 的商业模式的问题。我觉得刚才 Yuxing 说的有两点挺对的,现在 Bundler 有两种商业模式,一种是说做的比较大的这种 dApp,它靠流量去变现,不需要运行 Bundler 获得收入。另外一种就是纯纯的就是说我帮助用户去打包上链,这部分可能有部分盈余,那这部分是我的收入。这两种我觉得都有一个比较核心的问题,就是说如果你想做成去中心化的,那必然要公开这个 Mempool 或者说 Bundler 的 Operation pool。这样的话得看现在的 Bundler 他们有没有去传播这种 User Operation 的一个动力,或者激励。
但现在来说,比如像刚才提到的,我依靠去为用户的 User Operation 上链,我的收入来自于这部分服务的费用,那我可能是没有太大的动力去把它传播出去,让别人去拿到这部分收入,对吧?另外一种如果是我自己的 dApp 的话,那我可能也没有什么其他动力去传播,因为我可能希望一部分是维护这个流量,另外一部分我也想有更好的服务质量。
另外刚才也说到,这里面其实还有很多技术上的问题需要去解决。比如说如果你想公开内存池的话,你需要有一个技术去防止 DDoS 的攻击。比如说有恶意的人用根本没法上链的 User Operation 在网络里面去肆意传播的话,那整个网络就瘫了。另外还有一些比如说 MEV 的问题。如果它有很严重的 MEV 的话,当有恶意的夹子把用户的 User Operation 夹了的话,那对于普通用户来说,我觉得也是一个非常糟糕的用户体验。
所以我觉得如果想做去中心化的方案的话,这些问题可能都要有比较好的一个解决方案,才有可能有大规模的去中心化的方案能被行业所接受。
Jane
刚刚 Yuxing 提到经济利益,我记得前几天看 Dune 的时候,现在 Bundler 的收入应该大部分都还是负的。也希望通过刚刚这几个问题,大家能够对4337的基本的一些信息有所了解。4337像刚刚讲的主要还是一个功能层面的改变,只有融入到场景里才会发挥它真正的作用。所以第二个问题想问一下大家,大家觉得在哪些场景里4337会显著地提升现有的体验?或者大家也可以分享一下看到哪些产品已经融合了4337,并且取得了不错的初步的用户的反馈?
Audrey
我们在说账户抽象这个问题的时候,其实很多年前大家就开始讨论,然后包括我们在很早期的时候,包括 18, 19 年也看到了很多像早期的 EOS 等,大家都是从不同的层面上尝试在解决账户抽象的问题。因为以太坊是 14, 15 年的设计,所以它有非常重的历史负担。后面 17, 18, 19 年的一些新的 L1 的项目出来的时候,大家都从各种层面在尝试解决一部分账户抽象的问题。18, 19 年已经有一些钱包项目,比如 mykey 在尝试用社交恢复,或者是多层面的密钥的管理来实现一部分账户抽象的功能,但是那个时间点相对来说还比较早。
我们最开始看到有一些爆发的迹象,其实是随着 DeFi 的爆发开始,当更多的用户需要使用到链上的功能的时候。这个功能不是说类似于传统的,可以用很简单的方式就可以在中心化的交易所进行一些交易,那它的登录方式其实跟 Web2 没有任何区别。而是当 DeFi 爆发的时候,大量的用户需要使用链上钱包来解决它现实层面的一些需求。这个时候开始,它给账户抽象带来了现实应用层面的意义。如果你没有用户的需求,即使再早阶段地做一些尝试,那可能还是成为被拍在沙滩上的一些项目。
说回到21年底,我们会投 UniPass 的原因就是因为当时我们看到了大规模应用的需求。一方面是 DeFi 的爆发,另外一方面 Web3 并不单是金融属性的需求。金融性交易你可以用中心化交易所,也可以用 DeFi 。但是随着大量的用户,他如果要使用到链上交互,比如要把很多内容文章发布到链上,或者进行游戏等等一系列的操作涉及到链上账户的时候,这个时候我们必须面临的一个问题就是降低用户门槛的问题。所以这个也是为什么我们在21年的时候就关注到 UniPass,并投了他们的原因。
当然到现在我们才真正地看到 AA 的爆发。一方面 EIP 的出现,给大家带来更加标准化的协议和模板,大家都可以遵循同一套方式来实现大规模的降低用户门槛的可用性。同时我们也可以看到,AA爆发也经历了时间和技术方案的累积量变。记得大概从去年10月份 Devcon 的时候开始有一些关注AA,到今年2月 ETHDenver、6月份EDCON、7月ETHCC的持续讨论和进展探索。它都有一个时间关注度和技术发展的过程。而当所有基础设施和底层的标准 ready 的情况下,最近大家(比如 CyberConnect)开始使用一些真实的可以应用到用户的场景。当技术的方案解决并实施完备后,才可能给大规模用户真正的进入带来更低层面的门槛和可能性。
Zhimao
4337功能性层面的根本改变在我看来可以分成两个逻辑,第一个逻辑是对比起 EOA,账户抽象以后,它本质上是把 Authentification 中 Auth 的路径和 Account 本身拆离开了。第二个方面,是 Alternative Mempool 解决了 gas 代付的问题。围绕这两个点的话,就有一些新的有意思的 feature 出现,比如说一个是账户抽象,一个是 gas fee 的抽象,甚至是网络层面的抽象。因为在 EOA 的话,它还是绑定到一个网络状态上,然后现在有可能出现整个底层的网络都可以抽象出来。
所以说新的体验围绕着这两点来说的话,我觉得比较有意思的是核心的两个逻辑。第一个逻辑就是登录和验证的场景,就比如说你管理你的区块链的账户,不用去管理你的私钥,不用去管理你的助机词,而是一些比较新的 authentification 的逻辑,就比如说用 NPC TSS 去做这个私钥的分片,然后以 Web2 的 login 方式去管理你的account,或者说比较新的是你可以使用比如说 passkey加上 Turnkey 解决方案,你可以以你的生物信息,比如说你的 face ID、你的指纹来去登录或者验证你的状态。这个是一个我在我看来比较有意思的点。然后第二个点的话就围绕刚才我提到过的支付场景,就是能够有更灵活的支付策略,比如说用 Visa 的 credit card,第三方代付,或者 referral program,然后这些很有意思的东西累加起来它都可以有更灵活的去帮用户代付 gas 的这个策略。然后这两点的话结合起来就可以更进一步地把这个账户抽象出来, gas 抽象出来,以及未来有可能把这个网络状态抽象出来,然后能够有一些功能层面的改变,从而发挥一些更大的作用。
Jane
你刚刚提到支付场景,其实可能再延伸一下,也可以比方说授权委托一些代付的场景,比方说提前授权一些小额代付,这个也会使他的体验更便捷。
Zhimao
是的。
Qiang
我举一个我们实际正在探索的一个小点,我们现在在围绕我们的存储做一些 dApp 的尝试,那我觉得这种 dApp 尝试它并不是类似于像 DeFi 的金融化应用,更多的是类似于大家平常在 Web2 用的非常高频的一些应用。这里面它会有一些不同于 DeFi 应用的特性,比如用户做的活动没有那么高的金融价值,他可能对安全性要求没有那么高。第二个它可能会比 DeFi 应用的操作更高频。举个例子,我们用户在上传一个比较大的文件的时候,比如现在我们正在做的4844,它会把用户的文件切片,切成 128K 这样的大小一个一个去上传。当我上传的时候我使用的还是以太坊的这种 transaction,那我还是要做签名。如果我上传比较大的一个文件,每一个 128K 的上传我都要去做一个签名的话,对用户来说是非常不好的体验。所以我们在结合 AA 看解决方案,AA 里面有一个小的功能可以去临时授权一个 session key,然后由这个 session key 来做签名操作。但是 session key 因为安全性不高的话,可以由主的智能合约钱包给这个 session key 授权一段时间,就是说他不能做任何的转账操作,只能做上传操作。这样的话其实可以极大地改善用户的体验。所以我觉得未来大家围绕着 AA 的这些尝试,可能最重要的一个方向就是说怎么能更好地去使那些不是特别重度的,或者说对区块链这个领域缺乏 domain knowledge 的用户可以轻松 onboard。这是我觉得非常非常重要的一个方面,像 Vitalik 他讲的那个 three transitions 似的,这样它可以迎来数亿用户。
Jane
刚刚提到的 session key,在一些游戏或者说社交场景里,因为它是一个重度沉浸的场景,用户也不希望频繁被打扰,所以如果有 session key 的话,他的体验也会有大幅的提升。
Yuxing
刚刚几位把这一块囊括的比较完善了,我个人最喜欢的功能也是 session key。因为账户抽象本身是交易来源和签名的一个分离。之前在这个以太坊上没有办法实现,就是交易来源和签名可以理解为必须是同一个私钥,那引入账户抽象之后它就实现了这个功能,所以它就可以去实现这个 session key。我可以去授权一个key,这个 key 可以在符合某种条件的情况下,不需要我的最原始的这个 key 的签名就可以进行一个交易。然后这个条件可能是金额的条件、场景的条件,或者说时间的条件,这个是我最喜欢的功能。除此之外它还有很多其它的功能,也是之前的智能合约钱包在一定程度上也实现了的,比如说社交登录,代付 gas,虽然他们实现的方案不一样,但其实没有4337也是可以实现这些东西的。
我最喜欢的可能也是伴随着 AA 一起出来的是模块化区块链,所谓的一个插件的概念。就是我有一个盒,然后我在这个盒上有各种各样的插件。这有点像 Chrome,Chrome 是一个盒,浏览器的盒, Chrome 上面可以安装各种各样的浏览器插件去增强浏览器的功能。4337里边,尤其是引入了这么一个模块化的智能钱包之后就出现了类似的一个概念。基于4337的一个智能合约钱包有个最小化功能的盒,这个最小化功能可能包括代付 gas, 社交登录,session key,以及一些账户管理等功能。在此之上我有一个 plugin,这个 plugin 可以去做各种各样的你可以想象到的和其他的智能合约类似的特定的,或者说是通用化的一些功能。这个概念我觉得可以去看看这个 ZeroDev, Zerodev 他们在这一块是走得比较领先的,包括 session key 他们也是走得比较领先的。
3. AA 钱包能否在 L2 打开局面
Jane
第三个问题是涉及到 L2 相关的,因为 L2 它没有以太坊的技术债务,所以它是可以直接把账户抽象引入进来的,刚刚也有提到像 Starknet 等有自己的账户抽象的实现。原来在 L1 里面可能还是 EOA 钱包为主。像现在 L2 也非常多,所以想问问大家的想法,AA 钱包它能不能在 L2 真正打开局面?未来基于 L2 的这种 AA 钱包,以及更接近于 Web2 的体验会不会成为 L2 竞争的重要的分水岭之一?
Zhimao
在我们 (CyberConnect) 的假想里面,还是想把整个 gas 的概念,网络切换的概念,以及未来 blockchain 的概念做得更加抽象化一点。在 L2 的话,比如说你是 EVM compatible 的Blockchain,你的合约钱包就应该在每条链上都存在。这样的好处是如果在所有的链上都共用一个账户体系的话,它其实可以在未来 onboarding 的时候把 blockchain 的 network 的感知降到很低。比如你可以发起任意一笔 transaction,然后用任意一个 blockchain 的 gas fee,这在我看来还是很重要的。
Audrey
像刚才说的,其实很多之前的 L1,其实大家也尝试从各个角度解决账户抽象的问题,比如使大家可以无感登录的一些方式。甚至有一些之前的 L1,可以实现类似于密码原语级别的定义,那就意味着可以直接使用 pass key 调用手机里面的安全芯片,然后用生物识别登录的方式来登录到链上钱包地址。所以这个问题衍生的就是 AA 很重要,但是对于一个 L2 或者是 L1 的公链是否能够最终走向成功,它只是一方面。可能会需要非常多各种的因素,包括类似于先发的优势。比如说我们现在看到 OP Stack,它已经出现了可用性的 L3 的方案。所以 Coinbase,Worldcoin,大家都在使用 OP 这套方案。虽然说 zkSync 也在出,但是先发优势有的时候是不可比拟的,同时背后的相关的支持方也非常的重要。所以我们就说有的时候技术很重要,但是技术也并不是完全决定性的因素,这个是我的大概的一点想法。
Qiang
我觉得现在去观察 L2 的竞争还是非常有意思的,因为现在整个市场的一个主线就是在做 L2 的竞争。当然我觉得支持这个 AA 非常重要,但它在我看来可能还是更偏一个基础设施类型的东西。然后如果是 L2 中能有一个比较大的领先优势的话,我觉得还是看在上面能够出现什么样的能够去 onboard 更多用户的一个应用。比如说当时 Arbitrum 它们能够比 OP 更先一步做起来,是因为它们上面有了比如说做 NFT 的游戏,比较独特的 DeFi (GMX)这些应用,其他链没有这种应用。所以我觉得对于 AA 钱包来讲,重点还是在于它的使用场景,比如说有一个非常好玩的游戏,它利用 AA 提供了一个非常非常丝滑的好的用户体验。大家可以看到有些分析说在 Polygon 上面 AA 钱包有巨量的激增,因为 CyberConnect 这样的一个社交网络应用能够引领大家或者说吸引用户过来用。所以我觉得还是要看用户的使用场景,能不能把这个 AA 钱包用好,最终能够给用户提供一个更好独特化的体验和服务。这是综合来讲更重要的一个问题。
Yuxing
我感觉4337更多是给以太坊打补丁,因为以太坊它的技术债使得它不能做一些事情,所以由4337帮它打个补丁。4337并不是一个很创新的东西,只是对于太坊来讲它是一个很有用的东西。我和一些朋友讨论,他们是 Solana 坚定的支持者,他们对于4337不以为然,比如说像 Solana ,它们天然也有账户抽象。接近 Web2 的一个体验,速度很快,对吧?你说它没有那么去中心化,那 BSC 更没有那么去中心化,对吧?现在以太坊也没有那么去中心化。所以我自己也是一直在思考的,就像 Audrey 说的,技术肯定不是决定它能否成败的关键,那最后决定它能否成败的关键到底是什么?也许是先发优势,也许有的人说是有一个强有力的领导者,比如说以太坊有 Vitalik, Cosmos 没有,Polkadot 的 Gavin Wood 不是一个很好的 CEO,对吧?
一个东西能成或具有竞争力的原因是什么会有各种各样的观点,大家都会列出来。这就跟我们在分析成功的公司它是因为什么是一样的,没有人能够说得清楚。同样,我觉得4337对于 L2 最终会不会是一个重要的东西,L2 能够带来像 Web2 一样的体验,会不会成为一个重要的分水岭,我觉得是一样的概念。可能 L2 它的天然优势在于它能够站在以太坊的这个巨人上去做自己的事情,它是属于以太坊生态的,它不需要跟以太坊竞争。那或许它可能只需要和 L2 互相之间竞争。那么下一个问题就是,能够决定哪个 L2 能跑出来的这个因素是什么?我自己觉得大概率不会是4337,可能是别的很多的因素在里边。
Jane
是的,是很多维度决定的。除了 Qiang 刚刚提到的一些基于场景的用户体验,之前和 CyberConnect 的内容负责人讨论的时候,他提到其实 social 里面也看你具体切到了什么样的场景,可能是 Web3 里面提供了 Web2 没法提供的体验,因为这样你才能切到 Web3 的 social 用户。所以可能到最后我们如果 bottom up 来看的话,可能还是看你找到了什么点,能给用户提供差异化价值,再结合 Audrey 刚刚说的一些先发优势以及其他的一些点,从这些综合层面才能去判断说大家最后谁能跑出来。
4. ERC-4337 的实践难点和改进方向
Jane
下一个问题是想问问大家,刚有提到一些 AA 实践中的难点,比方说 Gas fee 高等,大家觉得4337的改进方向会有哪一些?
Zhimao
其实我觉得4337目前其实还是有很多问题的,就是不管它导致的 User Onboarding 或者说 UI/UX 的改变,其实都会制造挺多麻烦的。特别是我们最近大量经历了在4337的开发,以及和所有的核心4337的开发者们的交流来看,其实很多方面都大家都在 active 地去探索一些解决方案或更好的 Proposal。举几个点来说的话,在我看来目前来说最大的就是用户的习惯还是以 EOA 出发,EOA 其实本身是没有状态的,这点就导致了很大的障碍,特别是在多链的假设下。比如说现在用户的假设就还是他的 EOA 钱包在所有 EVM blockchain 下面,它都是同一个地址,都是同一个钱包来接收他的资产。但是对于一个 AA 钱包或者4337钱包来说的话,它本身这个钱包是有状态的。举个例子,比如说控制这个 account 的 Signer 是谁,登录方式是什么?然后比如说它底下像刚才有一位嘉宾提到了模块化 ERC-6900,它底下的 plugin 是什么?然后它在每个链上的状态会导致它的管理成本会非常高。举个例子,比如说我在 OP 上,我把我底下 authentification 的方式换了,把我的 plugin 换掉,但是这个状态是不能被 reflect 到其他 blockchain的,这就会提高对钱包的管理成本以及一些现有的 UI/UX 的假设。比如说现在大家会假设你在一个 EOA 地址去接收资产,但是对于一个合约钱包来说的话,有可能未来是不成立的,因为你即使是能够 deterministic 地计算出 counterfactual address,但是你在那个 blockchain 的状态和你在现在这个 blockchain 初始化的状态可能不一样,就导致有可能整个 UI/UX 会非常复杂。
另外的一些问题的话,我可以举两个例子,就是应用上的不兼容。就比如说一些著名的 DeFi 协议,或者一些老的协议,它依赖于直接以 EOA 作为 message sender,但是现在变成了一个合约,这样的话会导致整个 protocol 的不兼容。另外一个大家很 activite 去探索的问题,在4337领域的话就是验签的问题。刚才说了 auth 的逻辑和 account 逻辑是拆开的,现在的一个方案叫 ERC-1271,它其实就是说怎么有一个标准能够在合约钱包的情况下,去验证它底下的签名者是谁。但是这个就要求你必须要部署这个合约,你才能去验证它的签名,但是这个兼容性非常差。比如说你在 OpenSea 上或者很多 dApp 上 log in 的时候,你要用很多 wallet 的connector,比如说 Rainbow,或者说大家有很多有验签的逻辑,比如说用 SIWE(sign in with ethereum) 的逻辑,这些 middleware 在里边。如果你需要一个合约先在那个 blockchain 上部署的话,就会导致整个 UI/UX flow 的不完整性。
所以在这一点上的话,未来的 proposal 像 ERC-6492 就是在解决这个问题,怎么在不部署合约的情况下能够进行验签,还有很多整个 industry 在一起探索的问题,比如说 indexing 也是一个问题,比如你现在用 AA 钱包,有可能你 deposit 1 笔 native token 或者 ERC20 到一个中心化交易所,有可能它就没办法观察到这笔资产,因为它的 indexing infrastructure 的逻辑在 EOA 和抽象账户上是完全不一样的。所以其实像刚才我提到的验签,6492,还有刚才有位嘉宾提到的6900模块化的账户设计,都是大家在非常积极去探索或者想解决的问题。
Jane
Zhimao,正好想请教你一下,前几天我看 Twitter 的时候,我看 Alchemy 他们写了好多文章是关于 gas 预估的(https://www.alchemy.com/blog/erc-4337-gas-estimation),这一块在你们实际的操作中会是一个难点吗?
Zhimao
是的,这个其实是非常困难的一件事情。因为你做预估的话,在整个4337的 gas 模型是完全发生变化的。它的 gas 分成了三个不同的gas,有比如说你真正执行这个 transaction 的 gas,还有一个无法预测的叫 preVerification gas,然后这部分 gas 它比较 tricky 的部分是它会作为 compensate 去给 Bundler 带来利益,所以这个 gas 的设置以及 gas price 的估计是非常困难的一件事情。比如说你在 Polygon 上和你在一个 L2,比如说 OP 或者 Arb 上,因为你 L1 的 gas fee 的问题,导致在 L2 上你去计算 gas price 的方式会非常不一样。所以 Alchemy 那篇文章他们所想描述的就是在整个4337里面,有一个精准的 gas 预估,并且能够保证 bundler 的利益,是一件非常困难的事情。
Jane
明白了。Qiang,你觉得呢?因为你们也在做很多4337的实践,你们对改进方向怎么看呢?
Qiang
前两周以太坊在他们的 ACDE (开发者会议)里集中讨论了两个 EIP,5806 和7377。我看很多 AA 的社区里面也在比较多地去讨论7377。我觉得就跟 Zhimao 说的有一点就类似,就是说现在大部分用户使用的都是 EOA 的这种钱包,所以一个关键的问题是怎么能把这些用户顺利地 migrate 给到 AA 钱包上来。以太坊的核心团队他们也意识到这是非常需要去解决的一个问题。刚才说到5806,它就是想说能不能在一个 EOA 钱包里面,以这种 delicate call 的方式去执行任意的代码,以及像7377的话,它是说能够一次性地部署代码,然后把一个 EOA 里面的所有资产一次性转移到一个 AA 钱包里面去。刚也有提到以太坊它是有一个技术负债的,我觉得 EOA 钱包本身也是一个技术负债或者没有被解决得那么好的一个账户抽象的问题。那怎么能把已有的这些用户顺利地过渡到 AA 的话,我觉得这是需要大家去关注的一个事情。
5. 其他对 Onboarding 有深刻影响的协议
Jane
接下来是我们一个延伸讨论的问题,像 Web3 大规模层采纳是大家基本上每天都会听到的一个命题,不知道除了4337之外,大家个人有没有关注到其他什么底层协议,觉得也会对 onboarding 有深刻影响的?另外一个维度来讲,因为大家应该都是 EIP 的资深的读者,从大家的经验来看,什么样的协议会更容易被采纳?因为像4337它是不需要进行协议层面的修改的,它不需要硬分叉,但像之前的3074之类的就涉及到协议层的修改。好奇大家对这两个问题的看法。
Audrey
我觉得现在除了 4337还有一个很重要的是6551。我觉得最重要的点在于身份的可转移上,比如说原先的话我们一个身份其实是跟地址强绑定的关系,如果6551实现,那大家就完全实现了 DID 的可转移。我所有的 DID 或我所有相关的一些资产转绑定到一个 NFT 上,同时我可以实现的是资产和身份的可转移。我觉得这一点是非常重要的,应该有一些团队已经在就6551进行一些相关的实践和开发。
Yuxing
我非常赞同 Audrey 说的这个6551,我看了那个也非常喜欢。稍微给大家简单介绍一下6551,它是一个可以让 NFT 去持有资产的一个协议。比如说刚 Audrey 有提到说这个相当于你的 ID 可以被转移,也就是说 NFT 就是你的一个ID,因为 ID 它就是非同质化的,然后在这个 ID 上你可以去拥有一些资产。我能够想到非常天然的应用场景是在游戏里边我创建了一个角色,我就创建了一个 NFT,它是我的一个ID,然后这个角色在这个游戏里面去打了装备,去赚了钱,相应的一些身份都是和这个 NFT 进行绑定的,都是一个ID。那这个时候在传统世界可能说我去卖我的账号,我去卖我大话西游的账号,有的人可以卖几十万,对吧?那我就卖我的 NFT。我想用清真这个词,就非常清真,这个 NFT 卖出去了,就相当于某个资产卖出去了。它不像 Web2 里面你去交割你的这个账号的时候,很不清真,拖泥带水,有各种各样很麻烦的事情,它就彻底将你的 ID 变成了资产一样的存在,这个 ID 是可以转移和交易的。它如果是你自己的个人身份 ID,那你可以转到你相应的一些地址上去。如果是一个交易类型的ID,资产类型的ID,它就可以放到市场里面去进行交易。所以这个事情我觉得它可以 unlock 很多很有意思的场景,所以当时看完我也特别喜欢,也非常期待之后有一些团队能够去做出一些很有意思的东西,会持续关注。
Jane
对,在我们经济模型小组内部我们也经常讨论6551,因为它意味着你给 NFT 的设计层面会有很多的设计空间出来,你刚刚也提到在游戏里面它会延展出很多的场景。刚刚 Audrey 和 Yuxing 都提了6551,Qiang 你这边有什么别的想法吗?
Qiang
我这边可能换一个可能更大的角度去看,就是说我们现在其实比较喜欢的一个叙事或者看待这个事情的方式,就是说把整个以太坊当作一个世界计算机,当然这也是以太坊它对自己的一个宣传。所以在我们看来可能 AA 去改善用户体验的一个方向就类似于比如说微软在做 Windows 之前,它们是一个终端的方式。这个体验非常差,所以如果换成这种窗口式的这种操作系统的一个进阶的话,对于整个的用户体验,或者说 onboard 更多的这种普通用户来说,我觉得也是非常好的一个事情。
但是现在大家看待以太坊这个世界计算机,因为它性能不行,更多的是一个世界计算器。所以我觉得现在行业最大的一个主线还是在做这种基础设施的扩容。所以我觉得比如说我们现在比较关注的像这个 4844 以及未来 Danksharing,它是为了这个以太坊 L1 的一个扩容。在此基础上,比如说 9 月份或者今年下半年4844上了之后,会不会 L2 的用户成本,就是它的交易成本会进一步的下降。这样的话我觉得可能会在上面有更多的这种用户活动,包括现在大家都在探讨 L3,用户交易手续费更低的一种场景,这样它才能会支撑起来比如说大家现在做的更更能让 Web2 用起来的各种游戏或者社交应用。所以我觉得整体来说还是要围绕着这个世界计算机去在各个方面做提升,不管是用户体验还是它的性能。
Zhimao
其实前面的嘉宾讲的也很多了,整个6551以及 onboarding 的成本更低,大多数都是围绕 EIP 或者以太坊来的。我可以讲一些简单的但也比较有意思的,今年特别火的就是 L2,比如说 OP stack 里的 super chain 和 Arbitrum 的Orbit,它们的一个 ideology 的话是说不同的 L2 之间是像一个联盟链一样。它其实有一点类似于几年前 Cosmos Hub 的design。这个底层的 infrastructure 能带来的好处是在未来可能有更多的 AppChain 的出现。这些 APP chain 如果都是用同一个标准化的 Stack 开发出来的,比如像 Base,比如整个 OP Stack 可以有不同的 customization,你可以去 hack 自己的那一层,在未来很有可能出现的就是不同的 application、不同的协议它有一个自己的 AppChain。因为区块链的设计本质上是有一个 Trilemma 在里面的,你可以根据自己的需求去定制化一个自己的 L2。像比如说 Paradigm 前段时间投的一些项目,它也是做一个 RaaS (Rollup as a service)。
所以在未来我觉得这些协议的出现能够让这个 L2 的世界没有这么 isolated,它在 super chain 的假设下有更好的 interoperability。这些 L2 之间如果它有一个 shared sequencer,shared bridge,然后有一个类似于 Layer Zero 一样的 messaging 的 communication channel,这样的话整个用户体验会上升到另外一个 level,比如说它的资产的可组合性,它的 transaction 的可组合性,它甚至可以做到一个跨 L2 的 atomic transaction,就比如说它可以在链 A 上闪电贷,在另外一个链上买卖。我觉得这些本质上都还是一些非常有意思的探索,可以在未来带来一些完全不一样的用户体验。
Jane
正好问一下 Zhimao,像 CyberConnect 现在已经是 Web3 最大的一个社交网络,其实你们一直在做的就是 onboarding 的事情。你能给我们分享一些观察 CyberConnect 它大规模 onboarding 过程的心得体会吗?
Zhimao
一些印象比较深刻的事情的话,就是其实在我们设计整个协议的过程中,gas 费的确是一个很大的问题,大家都很关心它的 gas 费。特别是我们的 ideology 在未来是想做到一个 fully on chain 的状态,比如说你的社交关系,你的社交身份,你的 relationship,所有都是一个 identity data。如果都是 fully on chain 的话,现在的任何一个 L2 都无法支撑,哪怕是我们现在这样百万级用户的体量都是非常非常难以实现的。哪怕是 Polygon 0.02美金一笔 transaction 费,如果你把这些身份信息、有价值的资产,或者你的有价值的社交关系、社交身份都搬到链上去的话,都是一个非常困难的事情。
所以说我们在积极探索的就是一个,比如说利用 OP Stack 这个技术去定制化我们自己的 blockchain。因为它本质上把 blockchain 分成了很多,可能在一个社交场景下,你对区块链的需求不在于安全性、可扩展性和它的应用性,可能对于我们来说这条区块链的它的 scalability 是更重要的。所以对于我们来说,我们其实也非常喜欢 OP Stack 的这个愿景,就是我们在未来也会考虑有自己的 Cyber Network 去做一条属于我们自己这个场景下的一个社交网络,一个社交链,并且它和其他的 L2 有个应很好的 interoperability。
Jane
最后一个问题大家要不来聊一聊对 Mass Adoption 的展望。
Audrey
刚才在开始之前我还发了一条朋友圈说最近很多的事情串了起来。我记得我在5月份的时候大概写了一篇 Mass Adoption 的愿景,当时对那个愿景的定义不是说单是以人为基础的 Mass Adoption,而是可能更多我们接下来是以 AI assistant,甚至下一步扩展到 AI agent 方向的 Mass Adoption。那当每一个人拥有一个 AI 助理,甚至是 AI 代理,这其实就跟之前 Paradigm 他们提出的以意图为中心的基础设施的扩建就有关系了。当发展到 AI agent 的时候,我们给出一个命题,打比方我要用1000美金来实现年化10%的收益。那在这个层面上我们可以给 AI 这么一个命题,然后它就可以设计各种路径和方式在不同的协议之间相互调用,那当我们说到这里的时候,我们看到的可能现阶段的愿景就在前方了。
这个愿景不是说只是人和人之间链上信息的交互,更多的可能也是 AI 助理相互之间的直接使用到我建立一个账户,然后我调用相关的一些协议,因为如果没有 AA 的情况下,我没有办法 assign 给一个 AI 相关的一些权限,比如说你可以调用1000美金以下的资产,可以在哪些 DeFi 或者各种类似的协议之间相互调用。所以我们在看这件事情的时候就发现愿景是越来越明晰了。半年之前,可能当时大家还处于一个比较模糊的方向,但是随着这半年迅速的发展,AA 的发展,AI 的发展,叙事层面的发展,那我们看到的可能性的愿景就在不远的将来。
Jane
是的,人机结合应该是未来一个很有意思的方向,AA 可能会在这其中发挥很大的作用。Qiang 你觉得呢?
Qiang
前段时间看到以太坊核心团队在他们第十次还是第几次 AMA 上(他们每半年有一次 AMA 回答用户提问),有个用户问 Vitalik,在他看来以太坊接下来想去 Mass Adoption 的话,他觉得哪里有一些问题,就是说未来最需要解决的问题是什么?Vitalik 就回答说,那你就去看我 The Three Transitions 那篇文章就好了,那里面就是他认为的三个核心的问题。其实这里面刚才有两点我们已经讨论非常充分了,比如说像 L2 扩容的 transition,第二个是 AA 的 transition。第三个就是 privacy,其实也是最近非常火的 ZK 赛道,如果用户想在链上做一些偏有 privacy 需求的应用。他认为这也是三大方向之一。他还画了一张图,上面画了一个三角。如果大家对这个问题感兴趣的话,可以仔细地去看看这篇文章。我觉得在 Vitalik 看来的这三个方向,是值得大家仔细地去琢磨和品味的方向。
其实这里面刚才有两点我们已经讨论非常充分了,比如说像 L2 扩容的 transition,第二个是 AA 的 transition。第三个就是 privacy,其实也是最近非常火的 ZK 赛道,如果用户想在链上做一些偏有 privacy 需求的应用。他认为这也是三大方向之一。他还画了一张图,上面画了一个三角。如果大家对这个问题感兴趣的话,可以仔细地去看看这篇文章。我觉得在 Vitalik 看来的这三个方向,是值得大家仔细地去琢磨和品味的方向。
https://vitalik.ca/general/2023/06/09/three_transitions.html?ref=0xtrends.com
Yuxing
我们这个话题主要是聊4337和大规模采用,我之前在跟4337项目聊的时候,我最大的感想是4337它的目标用户不是现在的圈内用户,它不是让现在圈内的用户去转变他的习惯,因为大家现在还是非常习惯 EOA 钱包的。
我觉得原因主要是两个,一个是圈内用户他的习惯的问题,以及他对于安全性的考量的问题,圈内用户他对于 transfer 到另外一个完全不一样的账户体系,会存在一些切换成本。另外一个是4337要做的一些事情,在没有4337之前,很多已经可以完成了,只有少数几个不能完成。但是少数几个并不是现在圈内的主流场景,比如说 plugin 和 session key,现在都是很小的场景。这种很小的场景它注定不能带来一个很大规模的采用和和效应。我觉得4337最后能够去面向更大的一个客户群体是当它综合来说是一个性能更优、更低门槛的面向普通用户的账户方案。
我觉得它更多会偏向于新进来的用户,就是一些 Web2 的用户。他在刚接触这个区块链领域的时候,他能够像以前用支付宝或 Paypal 那么简单。那基于4337的解决方案其实是可以接近于实现这一点的。那它可能会先去引入一些 B 端的比如说华尔街的一些用户,再去引入一些 C 端的用户,普通的散户。所以我能够去预期和希望4337能够带来的效应就是用低门槛的方式去吸引一些圈外的用户,而不是去转变一些圈内的用户。
我相信这个故事和社交的故事是比较类似的,我记得前段时间和和 Jane 讨论的时候也有说到类似的观点。我很感兴趣的是从 CyberConnect 的角度怎么去思考这个问题,关于 onboarding 一些 Web2 的用户。因为 social 也是一个很低门槛去 onboarding Web2 用户的方案,你们在采用 4337 的时候,有没有考虑到这一点,或者说你们去做4337的时候,你们的出发点是什么?
Zhimao
好的,我可以简单分享下我们的一些想法。总体来说, Mass Adoption 在我看来是有两个必要条件的,第一个是有一个很易用的 infrastructure,这也是我们目前在尝试的一个方向。像前面嘉宾所提到的 Vitalik 的文章也说得很清楚了,不管是 onboarding 的方式,管理账户的方式,或者整个 gas fee 的方式,代付的方式,所有这些归根到底就是有一个更丝滑的 onboarding 的体验进入到 Web3 这个世界。我觉得这首先这是一个必要条件。
第二个必要条件的话,我觉得还是需要一个非常好的场景,一个很好的 Use Case,且这个所谓的场景必须是结合了 Web3 的一些核心假设的。Web3 的核心假设包括比如说对数据的所有权,资产的所有权,你能够有一个很好的方式去 monetize 你的数据, monetize 你的身份信息,或者 monetize 你的社交关系。在我看来的话,这一点的探索也非常困难。因为就算有一个很好的用户体验的情况下,就算你让用户对区块链、gas fee、登录系统都没有感知,但是你需要一个很强的 use case,这个 use case 是 Web2 的应用所达不到的。它能够天生地结合 Web3 的 tokenomics,要么能够很好地进行价值分配,鼓励一些用户从 Web2 的场景转移过来,或者说用户能够从这个 Web3 的场景 benefit 一些事情。我觉得这两点都是就是必不可少的。
对于未来的 Mass Adoption 的话,就我们自身来说,CyberConnect 目前还是更多 focus 在 infrastructure 的建设上。我们的协议核心部分现在分成三块,一块就是账户抽象,为了解决 gas 和 onboarding 的问题。另外一部分, CyberGraph 是一个 on chain 的 social 的身份,是为了解决社交数据的所有权,以及提供一个很好的 monetization channel。但是我们也需要一些很好的 Use Case 的进入,和我们一起做这个事情。我们自己也有一些产品端的尝试,比如 Link3 就是一个产品端的尝试,一个场景的探索。我觉得反而也是非常重要的。
Jane
谢谢 Zhimao。Zhimao 刚刚分享的,包括你们从 V1 到 V3 的迭代,让我想起有一个建筑师 Christopher Alexander 的一句话,大概的意思是一朵花不能制造,但只能从种子中产生,所以你能做的是设计好你的目的和环境,剩下的交由它自己去发生。就跟你刚刚讲的,你们把 Infra 层面做好,然后可能得让上层的采用 CyberAccount 的 dApp 来探索大家刚刚讲的合适的场景是什么,什么样的应用能够真正吸引 Web2 的用户上来。
好的,晚上我们也讨论了一个多小时了,非常感谢4位嘉宾的分享,也感谢周日晚上来参与我们讨论的听众朋友们!