详解以太坊最新技术路线：以 Rollup 为中心，分片或成为开发主轴

IOSG Venture2022-07-18热度: 40310

时间线拉长到未来几年，Rollup的整体价值将变大。

原标题：合并在即：详解以太坊最新技术路线
作者：Jiawei，IOSG Ventures

tl;dr：

如果「The Merge」进展顺利，分片将成为以太坊在2023年及之后的开发主轴，而距离2015年分片被提出，其含义已经发生了很大变化。
在Vitalik提出「以Rollup为中心的以太坊路线图」和以太坊的「Endgame」之后，以太坊的大方向发生了事实上的转变——「退居幕后」，作为Rollup的安全性保证和数据可用性层。
Danksharding和Proto-Danksharding是一系列的技术组合，表现形式在于「发现问题」、引入或提出新技术来「解决问题」的一套组合拳。
时间线拉长到未来几年，Rollup的整体价值将变大：以太坊上呈现多Rollup的发展格局、跨Rollup基础设施高度完善、Rollup生态高度繁荣——甚至超越以太坊本身。

引言

信标链

图片来源：https://consensys.net/blog/blockchain-explained/the-roadmap-to-serenity-2/

转眼2022年已走过一半。我们回看Vitalik在2018年Devcon演讲中提出的Serenity Roadmap，容易发现以太坊的发展路径几经更迭 — 对比当前的路线图，分片被赋予新的含义，eWASM亦少有人提及。

为了避免潜在的欺诈和用户误导问题，今年1月底，以太坊基金会宣布弃用「ETH2」的说法，而是把当前的以太坊主网改称为处理交易和执行的「执行层」，把原ETH2的说法改称为协调和处理PoS的「共识层」。

信标链

当前，以太坊官方的路线图涵盖了三部分内容：信标链、合并与分片。

其中，信标链（Beacon Chain）作为以太坊向PoS迁移的前置工作，以及共识层的协调网络，于2020年12月1日启用，迄今已运行近20个月。

合并（The Merge）指当前以太坊主网与信标链的最终合并，也即执行层与共识层的统一，标志着以太坊正式迁移到PoS。在IOSG的文章「黎明将至：以太坊合并近在咫尺」中，我们介绍了合并相关的重要进展：当前以太坊Ropsten与Sepolia测试网成功完成了合并，紧接着是Goerli的合并；如果一切顺利，意味着我们离主网合并不远了。

信标链

图片来源：https://medium.com/decipher-media/blockchain-scaling-solutions-4-1-ethereum-sharding-e88e8cacdfc

本文我们将着重讨论分片（Sharding）。原因在于：

其一，假定主网合并能够在年内顺利实现，那么分片将紧随其后，作为2023年以太坊的开发主轴。

其二，以太坊分片的概念最早由Vitalik在2015年的Devcon 1中提出，此后GitHub的Sharding FAQ中提出了分片的6个发展阶段（如上图）。然而，随着以太坊路线图的更新和相关EIP的推动，分片的含义和优先级都产生了很大变化。当我们在讨论分片时，需要先确保对其含义的理解达成一致。

综上两点，梳理清楚分片的来龙去脉是很重要的。本文将着重讨论以太坊原分片、 Danksharding和Proto-Danksharding的由来、进展和未来路线，而非具体到每个技术细节。关于Danksharding和Proto-Danksharding的详细内容，可参考IOSG此前的文章：「扩容杀手锏 Danksharding 会是以太坊分片的未来吗」、「EIP4844：即将开启L2交易费降低可预见的洼地效应」。

Quick Review

这篇文章中将会多次提到Rollup、数据可用性和分片。

我们在这里快速回看一遍三者的基本概念。

信标链

当前主流Rollup分为zkRollup和Optimistic Rollup。前者基于有效性证明，即批量执行交易，依赖密码学证明SNARK来保证状态转换的正确性；后者「乐观地」假设所有状态转换是正确的，除非被证伪；即需要一段时间窗口来确保错误的状态转换能够被发现。

信标链

数据可用性对zkRollup和Optimistic Rollup都非常重要。对前者而言，用户可以基于数据可用性重建二层的所有交易，以确保抗审查；对后者而言，需要使二层的所有数据都被发布，没有被隐藏任一交易。至于当前数据可用性面临的瓶颈与相应的解决方案，在下文中会提到。

信标链

图片来源：https://www.web3.university/article/ethereum-sharding-an-introduction-to-blockchain-sharding

以太坊全节点对EVM的完整状态进行存储，并参与所有交易验证，这样确保了去中心化和安全性，但随之而来的是可扩展性的问题：交易线性执行，且需要每个节点进行逐一确认，这样无疑是低效的。

此外，随着时间推移，以太坊网络数据不断积累（当前达786GB），运行全节点的硬件要求随之水涨船高。全节点数量下降将引发潜在的单点故障，并削弱去中心化的程度。

直观地看，分片相当于分工合作，即对所有节点进行分组，每笔交易只需要由单组节点进行验证，并定期向主链提交交易记录，以此实现交易的并行处理（比如有1000个节点，原来每笔交易都必须由每个节点进行验证；如果把他们分为10组，每组100个节点来验证交易，效率显然大大提升了）。采用分片使得在提高可扩展性的同时，也降低了单组节点的硬件要求，从而解决上述两个问题。

原分片

信标链

图片来源：https://vitalik.ca/general/2021/04/07/sharding.html

以太坊原方案中有64个分片，每个分片中都有独立的提议者和委员会，提议者是被随机选择的一个验证者，收集交易并进行排序；委员会是一组验证者的集合（至少由128个验证者组成），每隔一定时间被随机分配到各个分片上，并验证交易的有效性，如果委员会的2/3投票通过，则调用验证者管理合约（VMC）向信标链提交交易记录。区别于下述的「数据分片」，这种分片也被称为「执行分片」。

背景

在聊Danksharding之前我们不妨先花点时间了解其背景。个人猜想，Danksharding推出的社区氛围基础主要来自Vitalik的两篇文章。这两篇文章为以太坊的未来发展方向定下了基调。首先，Vitalik于2020年10月发表了「以Rollup为中心的以太坊路线图」，提出以太坊需要在中短期内对Rollup进行集中支持。其一，以太坊基础层扩容将聚焦于扩大区块的数据容量，而非提高链上计算或IO操作的效率。即：以太坊分片旨在为数据blob（而非交易）提供更多空间，以太坊无需对这些数据进行解释，只确保数据可用。其二，以太坊的基础设施进行调整以支持Rollup（如ENS的L2支持、钱包的L2集成和跨L2资产转移）。长远来看，以太坊的未来应该作为安全性高的、人人可处理的单一执行分片，以及可扩展的数据可用性层。

信标链

图片来源：https://vitalik.ca/general/2021/12/06/endgame.html

此后，Vitalik在2021年12月发表的「Endgame」中描述了以太坊的最终图景：区块产出是中心化的，但区块验证实现去信任且高度去中心化，同时确保抗审查。底层链为区块的数据可用性提供保证，而Rollup为区块的有效性提供保证（在zkRollup中，通过SNARK来实现；在Optimistic Rollup中，只需有一个诚实参与者运行欺诈证明节点）。类似于Cosmos的多链生态，以太坊的未来将是多Rollup共存的——它们都基于以太坊提供的数据可用性和共享安全性。用户依赖桥在不同Rollup之间活动，而无需支付主链的高额费用。

上述两篇文章基本确定了以太坊的发展方向：优化以太坊的基础层建设，为Rollup服务。以上论点也许基于这样一个看法：既然Rollup已经被验证有效并且得到良好的采用，那么「与其将花上几年时间等待一个不确定且复杂的扩容方案（注：指原分片），不如将注意力放在基于Rollup的方案上」。

在此之后，Dankrad提出了新分片方案Danksharding。以下我们把Danksharding的具体技术组成拆分出来理解。

Proto-Danksharding

信标链

图片来源：https://l2fees.info/

Proto-Danksharding提出的背景在于，虽然Rollup方案对比以太坊主链而言显著降低了交易费用，但还没有到足够低的理想程度。这是由于以太坊主链上提供数据可用性的CALLDATA仍然占据较大的花费(16gas / byte)。在原先的设想中，以太坊提出在数据分片中提供每个区块16MB的专用数据空间给Rollup使用，但距离数据分片的真正实施仍旧遥遥无期。

今年2月25日，Vitalik和DankRad等提出了EIP-4844（Shard Blob Transactions）提案，也即Proto-Danksharding，旨在以简单、前向兼容的方式扩展以太坊的数据可用性，使其在Danksharding推出之后仍然可用。该提案的改动仅发生在共识层上，不需要执行层的客户端、用户和Rollup开发者进行额外的适配工作。

Proto-Danksharding实际上并未执行分片，而是为将来的分片引入了一种称为「Blob-carrying Transactions」的交易格式。这种交易格式区别于普通交易在于其额外携带了称为blob的数据块（约为125kB），使区块实际上变大，从而提供比CALLDATA（约为10kB）更加廉价的数据可用性。

然而，「大区块」的普遍问题是对磁盘空间的要求不断累加，采用Proto-Danksharding将使以太坊每年额外增加2.5TB的存储量（当前全网络数据仅为986GB）。因此，Proto-Danksharding设置了一段时间窗口（例如30天），在此之后对blob做删除操作，用户或者协议可以在这段时间内对blob数据进行备份。

即，以太坊的共识层仅仅作为一个高度安全的「实时公告板」，确保这些数据在足够长的时间里是可用的，并使其他用户或协议有足够的时间来备份数据，而非由以太坊永久保留所有的blob历史数据。

这么做的原因是，对存储来说，每年新增的2.5TB不在话下，但对以太坊节点却带来不小的负担。至于可能导致的信任假设问题，实际上只需有一个数据存储方是诚实的（1 of N)，系统就可以正常运作，而不需要实时参与验证、执行共识的验证者节点集（N/2 of N）来存储这部分历史数据。

那么，有没有激励来推动第三方对这些数据进行存储呢？笔者暂时没有发现激励方案的推出，但Vitalik本人提出了几个可能的数据存储方：

1、针对应用的协议（例如Rollup）。它们可以要求节点存储与应用相关的历史数据，如果历史数据丢失，会对这部分应用造成风险，因此它们有动力去做存储；

2、BitTorrent；

3、以太坊的Portal Network，这是一个提供对协议的轻量级访问的平台；

4、区块链浏览器、API提供者或者其他数据服务商；

5、个人爱好者或者从事数据分析的学者；

6、The Graph等第三方索引协议。

Danksharding 数据可用性采样（DAS）

信标链

图片来源：https://notes.ethereum.org/@hww/workshop_feb_2022

在Proto-Danksharding中我们提到新的交易格式使得区块实际上变大了，并且Rollup也累积了大量数据，节点需要下载这些数据来保证数据可用性。

DAS的想法是：如果可以把数据分为N个块，每个节点随机地下载其中的K个块，就能验证所有数据是否可用，而无需下载所有数据，这样就能大大减少节点的负担。但如果某个数据块丢失了怎么办？仅仅通过随机下载K个块很难发现某个块丢失了。

为了实现DAS，引入了纠删码（Erasure Coding）技术。纠删码是一种编码容错技术，基本原理是把数据分段，加入一定的校验并使各个数据段之间产生关联，即使某些数据段丢失，仍然能通过算法将完整的数据计算出来。

如果把纠删码的冗余比例设置为50%，那么意味着只需要有50%的区块数据可用，网络中的任何人就可以重建所有区块数据，并且进行广播。如果攻击者想要欺骗节点，则必须隐藏掉超过50%的区块，但只要进行多次随机采样，这种情况几乎不会发生。

既然节点不下载所有数据，而是依靠纠删码来重建数据，那么首先需要确保纠删码被正确编码，否则用错误编码的纠删码当然没法重建数据。

这样，进一步引入了KZG多项式承诺（KZG Polynomial Commitments），多项式承诺是一个「代表」多项式的简化形式，用于证明多项式在特定位置的值与指定的数值一致，而无需包含该多项式的所有数据。Danksharding中通过采用KZG承诺来实现对纠删码的验证。

如果我们可以把所有数据都放在一个KZG承诺中当然很省事，但是构建这个KZG承诺，或者一旦有部分数据不可用，重建这个数据——两者的资源要求都是巨大的。（实际上，单个区块的数据需要多个KZG承诺来保证）而同样为了降低节点负担从而避免中心化，Danksharding中把KZG承诺进行了进一步的拆分，提出了二维KZG承诺框架。

当我们依次解决上述问题之后，依靠DAS，节点或者轻客户端只需要随机下载K个数据块，就能够验证所有数据是可用的；这样一来，即便引入「大区块」之后，也不会过多地加重节点的负担。

（注：特别地，Danksharding中采用的纠删码算法是Reed-Solomon编码；KZG承诺是由Kate、Zaverucha和Goldberg发表的多项式承诺方案。在此暂不做展开，对算法原理感兴趣的读者可自行拓展。此外，确保纠删码正确性的方案还有在Celestia中采用的欺诈证明）

区块提议者与构建者分离（PBS）

在当前情况下，PoW矿工和PoS验证者既是区块构建者（Builder），又是区块提议者（Proposer）——在PoS中，验证者可以用MEV的利润获取更多新的验证者席位，从而有更多机会去实现MEV；此外，大型验证池显然比普通验证人有更强大的MEV捕获能力，这样导致了严重的中心化问题。于是，PBS提出把Builder和Proposer进行分离。

PBS的想法如下：Builder们构建一个排好序的交易列表，并且把出价提交给Proposer。Proposer只需要接受出价最高的交易列表，且任何人在拍卖的获胜者被选出之前，无法知道交易列表的具体内容。

这种分离和拍卖的机制引入了博弈和Builder之间的「内卷」：毕竟每个Builder捕获MEV的能力不尽相同，Builder需要权衡潜在的MEV利润、以及拍卖出价之间的关系，这样实际上减少了MEV的净收入；而无论最终Builder提交的区块是否能够顺利产出，都需要向Proposer支付竞价的费用。这样一来，Proposer（广义上是所有验证者集，一定时间内随机重选）相当于分享了一部分MEV的收入，削弱了MEV的中心化程度。

以上介绍了PBS在解决MEV方面的优势，而引入PBS还有另一个原因。在Danksharding中，对Builder的要求是：在1秒左右计算出32MB数据的KZG证明，这需要32-64核的CPU；并且在一定时间内以P2P的方式广播64MB的数据，这需要2.5Gbit/s的带宽。显然验证者无法满足这样的要求。

于是PBS把两者分开，Proposer仍然作为一般验证者节点，负责选择交易列表，并广播区块头；而Builder作为一个专门的角色，负责上述工作和构建交易列表。

信标链

图片来源：https://ethresear.ch/t/two-slot-proposer-builder-separation/10980

去年10月，Vitalik提出了双Slot PBS方案（注：每个Slot为12秒，是信标链的时间单位），但具体的PBS方案仍然在讨论中。

抗审查列表（crList）

信标链

图片来源：https://notes.ethereum.org/@hww/workshop_feb_2022

但PBS也带来一个问题，如果某个Builder总是出最高价（甚至宁愿承担经济损失）来赢得拍卖，那么他实际上有了审查交易的能力，可以选择性地不把某些交易包含在区块中。

为此，Danksharding进一步引入了抗审查列表crList（即Censorship Resistance List），即Proposer有权利指定一个交易列表，这个交易列表必须被Builder所包含；在赢得拍卖后，Builder需要证明crList中的交易都已经被包含在内（或区块已满），否则该区块将被视为无效。

小结

信标链

图片来源：https://notes.ethereum.org/@hww/workshop_feb_2022

把上述的数据可用性采样（DAS）、区块构建者和提议者分离（PBS）以及抗审查列表（crList）组合起来，就得到了完整的Danksharding。我们发现，「分片」的概念其实已经被淡化了，尽管保留了Sharding的叫法，但实际上的重点已经放在对数据可用性的支持上。

那么Danksharding对比原分片有哪些优势呢？

（Dankrad本人在这里列举了Danksharding的10个优点，我们选取两个来具体解释）

在原分片中，每个单独的分片都有其提议者和委员会，分别对分片内的交易验证进行投票，并由信标链的提议者收集所有投票结果，这项工作很难在单个Slot内完成。而在Danksharding中只在信标链上存在委员会（广义的验证者集，一定时间内随机重选），由这个委员会来验证信标链区块和分片数据。这相当于把原来的64组提议者和委员会简化为1组，无论是理论还是工程实现的复杂度都大大降低了。

Danksharding的另一个优点是，以太坊主链和zkRollup之间有可能实现同步调用。上文我们谈到，在原分片中信标链需要收集所有分片的投票结果，这会产生确认的延迟。而在Danksharding中，信标链的区块和分片数据由信标链的委员会进行统一认证，也即同个信标区块的交易可以即时访问分片的数据。这样激发了更多可组合性的想象空间：例如StarkWare提出的分布式AMM（dAMM），能够跨L1/L2进行Swap或共享流动性，从而解决流动性碎片化的问题。

在Danksharding得到实施之后，以太坊将变成Rollup的统一结算层和数据可用性层。

Closing Thoughts

信标链

在上图中，我们对Danksharding进行一个总结。

综上，我们大致可以看到，未来的2至3年内，以太坊路线图的指向性是非常明显的——围绕服务Rollup而展开。尽管在此过程中路线图改动与否仍然是未知数：Danksharding 预计将在未来18-24个月内实现，而Proto-Danksharding将在6-9个月内实现。但至少我们明确了Rollup作为以太坊的扩容基础，占据着一定的主导地位。

根据Vitalik提出的展望，在此我们也提出一些预测性思考和猜想：

一是类似Cosmos的多链生态，未来以太坊上将出现多Rollup的竞争格局，由以太坊为它们提供安全性和数据可用性的保证。
二是跨L1/Rollup基础设施将成为刚需。跨域MEV将带来更加复杂的套利组合，类似上述提到的dAMM带来更丰富的可组合性。
三是多Rollup的生态应用将超越以太坊本身。由于以太坊的定位退居其次，作为Rollup的数据可用性层，我们猜测更多的应用会迁移到Rollup上面去做（若第二点成立）；或者至少在以太坊和Rollup上面同时做应用。

本内容旨在传递行业动态，不构成投资建议或承诺。