Web3 后端架构说明书

岛主zisland2022-09-21热度: 22967

Web3 应用的后端架构与 Web2 完全不同，主要原因是 Web2 后端的部分组件被区块链网络取代。

原文作者：岛主zisland

原文来源：Web3 Adventure Island

Web3 应用的后端架构与 Web2 完全不同，主要原因是 Web2 后端的部分组件被区块链网络取代。

Web2 时代

一款 Web2 应用大致可以抽象成 3 部分组成，即：

前端代码：用于定义 UI （ User Interface-用户界面）逻辑；例如刷 Twitter 时向下滑动屏幕，就会触发刷新。
后端代码：用于定义业务逻辑；例如转发 Twitter 时，该内容就会被同步到我们自己的主页里。
数据库：用于存储数据；例如我们发布的每一条内容，收到的每一个点赞都会被存储在数据库里。

这个抽象后的架构如下图所示：

智能合约

现在我们把这三层架构串起来：当你刷到一条感兴趣的 Twitter 并随手点赞时，前端收到了这个动作并告诉后端，后端根据代码规则明确了点赞后需要给该内容+1赞，并告诉数据库记录这件事。数据库完成记录后报告后端，后端再报告前端，前端页面上的小红心就被点亮了。

这就是 Web2 应用高度抽象后的运作方式。

Web3 时代

Web3 应用后端的架构发生了巨大变化，主要是因为数据库和后端代码被改变了。

数据库：Web3 去中心化的区块链网络取代了 Web2 中心化的数据库，大量价值数据被存储在区块链上。这些数据任何人都有权利访问或者利用。
后端代码：Web2 规定了业务逻辑的后端代码也被链上协议和智能合约代替，这些代码均被公开，并且有非常大的可互操作空间。

这样一来，Web3 应用的架构就变成了前端和区块链网络直接交互，其中区块链网络承担了定义业务逻辑、以及存储数据的任务。

这里可以简单展开一下智能合约（定义业务逻辑）在区块链网络的运行方式。以以太坊为例，智能合约通过以太坊虚拟机（EVM），在多种操作环境下，按照相同的共识进行数据计算和处理；然后这些数据被打包进区块永久存储在链上。这一切都是去中心化的，不受任何单一实体的左右。

现在我们已知的 Web3 应用的架构可以抽象成下图的样子。

智能合约

现在我们假设 Twitter 是一款 Web3 应用，来场景化的梳理一下它的运作方式：

首先 Twitter 的后端工程师写智能合约规定了点赞相关的业务逻辑，并将该智能合约部署上链。当你为某个内容点赞时，前端直接调用 Twitter 部署在链上的智能合约，智能合约自动判定为该内容增加一个赞；然后这条数据和其它数据一起被打包进一个区块，被永久存储在区块链上。最后前端收到数据已成功上链的反馈，点赞的小红心被点亮。

这就是 Web3 应用高度抽象后的运作方式（为了便于理解，这里忽略了很多细节）。

Web3 前端如何实现与区块链网络交互？

前面聊到，Web3 应用前端可直接与区块链网络交互，以便调用链上智能合约实现业务逻辑。与链交互是一款 Web3 应用是否能够正常运行的关键点，那么该如何实现呢？

答案是通过节点实现与链交互。

区块链网络依靠众多节点来实现自由访问和去中心化。每个节点都保存着一份链上状态的副本，包括每个智能合约的代码和数据。同样每个节点都有权利发起链上交易，这些发起的交易随后将被矿工确认并同步给其它节点。与链交互可以分为发起交易（写数据）或索引数据（读数据）两个场景，无论哪个都需要通过节点来实现。

目前主流的实现方式有两种：

自己建立和运行节点
使用第三方提供的节点服务

这两种方式有什么差异呢？

我们可以把第三方服务类比为 Web2 的云服务，而自建节点就像是使用传统的物理服务器。选择自建节点可以确保团队对节点运行状况的完全掌控，代价就是需要投入大量的资源和时间。例如：

通常需要组建一个专业团队专注于解决这个问题，至少包含后端工程师和运维工程师。
自建节点依然需要购买云服务来解决存储和计算，这并不便宜。
拿以太坊来说，新建一个归档节点通常需要一周以上的时间以完成历史数据的同步。
单节点基本无法满足业务需求，运维一个多节点集群需要解决数据一致性等诸多问题。
如果业务需要支持多链，则以上工作量会重复叠加（不同公链的技术栈也各有差异）

第三方服务商的本质是一支专业团队运营了一组非常庞大的节点集群，他们负责解决上述问题并将这些节点以 API 的形式提供给项目方使用。这类服务往往是支持多链的，并配套各种运维组件。

在云服务为主流的当下，例如银行的核心业务依然需要使用私有化的物理服务器；Web3 部分领域也需要自建节点确保业务安全。但是在绝大多数场景下，使用第三方服务是性价比最好的解决方案。

我们现在已知的 Web3 应用的运行架构如下图所示

智能合约

发起交易需要签名确认

我们通常把向链上写数据这个交互动作，称之为“发起交易”。

当 Web3 应用通过节点（无论是自建或是使用第三方服务）连接到区块链网络之后，我们可以自由读取存储在链上的数据。但是如果想要写入数据，则需要在发起交易前使用“私钥”进行签名确认。

你一定经历过钱包被唤醒并让你签名的场景。

公钥和私钥涉及“非对称加密学”原理，这里不做过多解释。普通用户可以极为抽象的将“私钥”理解为个人在区块链网络的终极身份证明（这也是为什么私钥不可外泄）。而例如 MetaMask 就是一种密钥管理工具，它将私钥存储在浏览器中，所以你需要发起交易时，它会被唤醒并让你点击签名。

以 Web3 版本的 Twitter 为例，当我们为一条内容点赞时，如果点赞这个行为需要被记录在链上，那么你在前端点赞后，应用需要唤醒钱包并让你额外签名确认。只有通过钱包签名后，这次交易才会被发起。

至此，Web3 应用的运行架构成为下图的样子：

智能合约

去中心化的存储解决方案

把大量数据直接存储在区块链网络上，成本非常高（Gas费）。所以通常我们不会把所有数据上链，这时就需要另外的分布式存储方案。

例如 IPFS 或者 Swarm 就是这类解决方案。

它们均是链下的存储方案，虽然没有把数据存储在链上，但是依靠对等的分布式文件系统，避免了中心化数据库的垄断性，实现了所存数据不可被中心化的篡改。特别需要说的是，有些应用甚至会把前端代码存储在 IPFS 或者 Swarm 上，以追求极致的去中心化。

所以现在我们的 Web3 应用架构变成了下图的样子：

智能合约

使用区块链网络上的数据

我们刚才提到，“与链交互”可分为【写数据】和【读数据】两个场景。而从链上读数据的场景要远远大于往链上写数据。

回想我们使用 Twitter 时看内容和发布内容的比例，就可以理解这一点了。（况且写数据需要支付 Gas 费，而读数据是免费的）

但恰恰是【读数据】这个更大的场景，门槛要比【写数据】高出很多。因为区块链网络是一个分布式的账本，每个区块打包的交易都是不同的（全球用户发起的交易按固定的时间周期被记录，那么每份记录的内容肯定都不同），这种数据特性被称之为“链表式结构”。链表式的数据无法被直接使用，我们需要先对链上数据进行解码和结构化，然后再开发 API 对数据进行查询和索引。

另外不同的业务场景对于数据的需求也不同，解码出来的数据通常不是都有用的，这时还需要工程师根据自己的需求对数据进行清洗加工。