背景介绍
在过去的几个月里,人工智能行业出现众多突破性进展。GPT4和稳定扩散等模型正在改变人们生产软件、互联网以及与之互动的方式。
尽管这些新的人工智能模型表现出杰出的性能,但一些人担心人工智能的不可预测性和对齐问题。例如,在线服务的世界中缺乏透明度,大部分的后台工作由人工智能模型运行。要验证这些模型的行为是否符合预期,将会是很大的挑战。此外,用户隐私也值得关注,提供给模型API的所有数据都可以被用来改进人工智能或者被黑客利用。
ZKML可能是这些问题的全新解决方案。通过向机器学习模型输入可验证和不可信任的属性,区块链和ZK技术可以形成能够实现人工智能对齐的框架。
什么是ZKML?
本文中的零知识机器学习(ZKML)是指使用zkSNARK(一种零知识证明)来证明机器学习推理的正确性,而不透露模型的输入或模型参数。根据信息是否私有,ZKML的用例可以分为以下类型:
公共模式+私人数据:
- 具有隐私性的机器学习:ZKML可以用来训练和评估敏感数据上的机器学习模型,而不向其他人透露数据。这对于医疗诊断和金融欺诈检测等应用非常重要。我们还看到一些公司在生物识别数据认证上使用ZKML,以建立非机器人证明(proof of humanity)服务。
- 证明:在一个大多数在线内容由人工智能生成的世界里,密码学可以作为一种来源保证内容真实。人们正在尝试使用ZKML来对抗深度造假问题。
私人模式+公共数据
- 模型的真实性:ZKML可以用来确保机器学习模型的一致性。这对用户来说很重要,可以确保模型提供者没有偷懒使用成本较低的模型或被黑客攻击。
- 去中心化的Kaggle:ZKML允许数据科学竞赛的参与者在公共测试数据上证明模型的准确性,而无需透露训练时的模型权重。
公共模型+公共数据
- 去中心化推理:这种方法主要是利用ZKML的简洁性,将复杂的人工智能计算压缩到类似于ZK rollup的链上证明。这种方法可以将模型服务的成本分配给多个节点。
由于zkSNARK将成为加密货币世界一项非常重要的技术,ZKML也有可能改变加密货币世界的格局。通过向智能合约加入人工智能功能,ZKML可以解锁更复杂的链上应用。这种整合在ZKML社区内被描述为“为区块链装上双眼”。
技术瓶颈
但ZK-ML也面临几大技术挑战,当下亟待解决。
- 量化:ZKP在场上工作,但神经网络是在浮点上训练的。这意味着为了使神经网络模型对zk/区块链友好,需要将其转换为具有完整计算轨迹的定点算术表示。这可能会牺牲模型的性能,因为参数的精度较低。
- 跨语言翻译:神经网络人工智能模型使用python和cpp书写,而ZKP电路使用rust语言。所以我们需要翻译层来将模型转换成基于ZKP的运行时间。通常这种类型的翻译层需要基于特定模型,很难设计一个通用的翻译层。
- ZKP的计算成本:基本上ZKP的成本会比原来的ML计算高很多。根据 Modulus Labs的一个实验,对于一个拥有2000万个参数的模型,生成证明需要1-5分钟以上,内存消耗约为20-60GB,具体情况取决于ZK证明系统的情况。
发展现状
即使面临上述挑战,我们已经看到ZKML在加密货币社区引起关注,一些伟大的团队正在该领域探索。
基础设施
模型编译器
由于ZKML的主要瓶颈是将人工智能模型转换为ZK电路,一些团队正在研究ZK模型编译器等基础设施层。从一年前的逻辑回归模型或简单的CNN模型开始,该领域已经快速发展至更复杂的模型。
- EZKL项目现在支持高达100mm参数的模型。它使用ONNX格式和halo2 ZKP系统。该库还支持只提交模型的一部分。
- ZKML库已经支持GPT2、Bert和扩散模型的ZKP。
ZKVM
ZKML编译器也属于零知识虚拟机的普遍范畴之内。
- Risc Zero是一个使用开源RiscV指令集的zkVM,所以它可以支持C++和Rust的ZKP。该zkDTP项目展示了如何将决策树ML模型转换为rust并在Risc Zero上运行。
- 我们也看到一些团队正在尝试用 Startnet(Giza) 和 Aleo (zero gravity)和将AI模型引入链上。
应用
除了基础设施方面的举措外,其他团队也开始探索ZKML的应用。
DeFi:
- DeFi的一个用例是人工智能驱动的金库,其机制由人工智能模型而非一成不变的策略来确定。这些策略可以吸收链上和链下数据来预测市场趋势并执行交易。ZKML保证了链上模型的一致性。这可以使整个过程自动和无信任。Mondulus Labs正在建立 RockyBot。该团队训练了一个链上人工智能模型来预测ETH价格,并建立了一个智能合约来自动与该模型进行交易。
- 其他潜在的DeFi用例包括AI驱动的DEX和借贷协议。预言机还可以利用ZKML提供由链外数据产生的新型数据源。
游戏:
- Modulus Labs推出基于ZKML的国际象棋游戏LeeLa,在该游戏中所有的用户一起与一个受ZK验证、由人工智能模型驱动的机器人对弈。人工智能可以为现有的完全链上游戏带来更多的互动功能。
NFT/创造者经济:
- EIP-7007:该EIP提供了一个接口,可以使用ZKML来验证人工智能为NFT生成的内容是否确实来自使用一定输入(提示)的模型。该标准可以赋能人工智能生成的NFT集合,甚至为新类型的创作者经济注入动力。
身份:
- Wordcoin项目正在提供一个基于用户生物识别信息的非机器人证明解决方案。该团队正在探索使用ZKML,让用户以无权限的方式生成IRIS(国际修复信息系统)代码。当生成IRIS码的算法升级后,用户可以下载模型并自行生成证明,而不需要前往对象请求代理站。
采用的关键
考虑到人工智能模型零知识证明的高成本。我们认为ZKML的采用可以从一些信任成本高的加密货币原生用例开始。
值得考虑的另一市场是数据隐私非常重要的行业,如医疗保健。尽管存在联合学习和安全MPC等其他解决方案,但ZKML拥有区块链可扩展激励网络的优势。
更广泛地大规模采用ZKML可能会是由于人们对现有大型人工智能供应商失去信任。是否会发生一些事件,从而提高整个行业的意识,促使用户考虑可验证的人工智能技术?
总结
ZKML仍然处于早期阶段,仍有许多挑战需要克服。但随着ZK技术的改进,我们认为人们很快就会发现几个具有强大产品市场适应性的ZKML用例。这些用例在开始时可能看起来十分小众。但随着中心化人工智能取得越来越多的发展,渗透到每个行业甚至人类生活中,人们可能会发现ZKML的更大价值。
如果你正在建立ZKML应用程序或基础设施,请在推特上联系 @alanwwu。我们将乐于与您交谈