AI和加密货币的结合可以提供透明、trustless的解决方案,激励和治理机制可以提升交易公开透明度、降低成本、提高效率。ChainML是一个去中心化的AI平台,AI市场可以将模型全链路金融化,激励用户选择和支持有潜力的模型,用户在乎的是模型给出的结果是否满意。AI可以提升用户体验和开发效率,AI marketplace的玩法可以创造出web3特有的价值捕获方式,允许用户用独特的方式参与到AI的浪潮中。
原文作者:Ian
原文来源:Foresight Research
在深入研究AI和加密货币结合的领域数月后,对这个方向的理解更加深入。本文对早期观点和目前的赛道走向进行了对比分析,对赛道熟悉的朋友可以从第二个section开始看。
在过去几个月我对AI + crypto这个话题进行了深度的研究,经过几个月的沉淀,很高兴自己在比较早的阶段洞悉到了一些赛道的走向,但也能看到有一些现在看来并不准确的观点。
这篇文章只讲观点不做intro,会覆盖web3里AI的几个大方向并且展示之前和现在我对赛道的观点和分析。不同的视角可能会有不一样的启发,可以对比辩证地来看。
先来回顾一下在上半年定下的AI + crypto几个主要的方向:
在“理性看待去中心化算力网络”中,基于算力将成为未来最有价值的资源的大逻辑,分析了crypto能为算力网络赋予的价值。
虽然去中心化的分布式算力网络在AI大模型训练上的需求是最大的,但是也面临最大的挑战和技术瓶颈。包括需要复杂的数据同步和网络优化问题等。此外,数据隐私和安全也是重要的制约因素。虽然有一些现有的,技术能提供初步解决方案,但在大规模分布式训练任务中,由于计算和通信开销巨大,这些技术仍无法应用。显然去中心化的分布式算力网络在模型推理上更有机会落地,可以预测未来的增量空间也足够大。但也面临通信延迟、数据隐私、模型安全等挑战。和模型训练相比,推理时的计算复杂度和数据交互性较低,更适合在分布式环境中进行。
在“去中心化AI Marketplace的最佳尝试”中,提到了一个成功的去中心化AI marketplace需要将AI和Web3的优势紧密结合,利用分布式、资产确权、收益分配和去中心化算力的附加值,降低AI应用的门槛,鼓励开发者上传和分享模型,同时保护用户的数据私有权,构建一个开发者友好,且满足用户需求的AI资源交易、共享平台。
当时的想法是(现在看来可能也不完全准确)基于数据的AI marketplace有更大的潜力。死磕模型的marketplace需要大量高质量模型的支撑,但早期平台缺乏用户基数和优质资源,使得优秀模型提供者的激励不足,难以吸引优质模型;而基于数据的marketplace通过去中心化,分布式地采集、激励层设计和数据所有权的保证,可以积累大量有价值的数据和资源,尤其是私域数据。
去中心化AI marketplace的成功依赖于用户资源的累积和强大的网络效应,用户和开发者可以从市场中获得的价值超过他们在市场之外能够得到的价值。在市场的早期,重点在于积累优质模型以吸引并保留用户,然后在建立起优质模型库和数据壁垒后,转向吸引和留住更多的终端用户。
在ZKML的话题被广泛讨论之前就在“AI + Web3 = ?”中对链上AI的价值进行了讨论。
在不牺牲去中心化和trustless的基础上,onchain AI有机会带领web3世界进入“next level”。目前的web3就像是web2的早期阶段,还没有承接更广泛应用或者创造更大价值的能力。而onchain AI恰好为了提供一种透明的、trustless的解决方案。
在“AI + Crypto出发聊聊Web3女性向游戏—HIM”中,结合portfolio项目“HIM”解析了大模型在web3应用上带来的价值;什么样的AI + crypto能给产品带来更高回报?除了硬核地从基建到算法,开发链上trustless的LLM,另一个方向是在产品中淡化推理的过程黑盒带来的影响,找到契合的场景来将大模型强大的推理能力落地。
算力网络的大逻辑依然没变,但是仍然面临市场需求的挑战,谁会需要效率和稳定性更低的解决方案?因此,以下这几点我认为需要想通:
去中心化是为了什么?
要是现在去问一个去中心化算力网络的founder,他八成还是会告诉你我们的算力网络可以增强的安全性和抗攻击能力、提高透明度和信任、资源优化利用、更好的数据隐私和用户控制、抵御审查和干预……
这些都是common sense,任何web3项目都能扯到抗审查、去信任、隐私等等,但我的观点是这些都不重要。仔细想一下,论安全性难道中心化的服务器不能做的更好?去中心化的算力网络本质上也没有解决隐私的问题,诸如此类的矛盾点还有很多。所以:一个算力网络去中心化终极目的一定是为了更低的成本。去中心化的程度越高,使用算力的成本越低。
所以,从根本上看“利用闲置算力”更多是一种长远的叙事,而一个去中心化算力网络能不能做成,我认为很大程度上取决于他有没有想明白以下几点:
Web3提供的价值
一套巧妙的token设计以及随之而来的激励/惩罚机制显然是去中心化社区提供的强有力value add。相比传统互联网,token不仅作为交易媒介,和smart contract相辅相成能让protocol实现更复杂的激励和治理机制。同时,交易的公开透明、成本的降低、效率的提升都得益于crypto带来的价值。这种独特的价值为激励贡献者提供了更多灵活性和创新空间。
但同时也希望可以理性看待这种看似合理的“契合”,对于去中心化算力网络来说,Web3和区块链技术带来的这些价值从另一个角度看仅仅只是“附加值”,而不是根本性的颠覆,并不能改变整个网络的基本工作方式和突破现在的技术瓶颈。
简而言之,这些web3的价值在于增强了去中心化网络的吸引力,但不会完全改变其核心结构或运作模式,如果希望去中心化网络在AI浪潮里真正占据一席之地,仅仅靠web3的价值是远远不够的。因此,就像后面会提到的,合适的技术解决合适的问题,去中心化算力网络的玩法绝不是单纯地去解决AI算力短缺的问题,而是给这个沉寂已久的赛道一个新的玩法和思路。
可能是像pow挖矿或者存储挖矿一样,把算力作为一种资产进行货币化。在这种模式下,算力的提供者可以通过贡献自己的计算资源来获取代币作为报酬。吸引力在于它提供了一种直接将计算资源转换为经济收益的方式,从而激励更多的参与者加入网络。也可能是基于web3创造一个消耗算力的市场,通过将算力的上游金融化(比如模型),开辟出能接受不稳定、且更慢的算力的需求点。
想明白怎么和用户的实际需求结合,毕竟用户和参与者的需求不一定只是高效的算力,“能赚到钱”永远是最有说服力的动力之一。
去中心化算力网络的核心竞争力是价格
如果一定要从实际价值上讨论去中心化算力,那web3带来最大的想象空间就是有机会被进一步压缩的算力成本。
算力节点的去中心化程度越高,单位算力的价格越低。从以下几个方向可以推演:
Case: ChainML
简单来说:ChainML是一个为inference、finetuning提供算力的去中心化平台。从短期看,chainml会实现基于开源的AI代理框架Council,通过Council的尝试(一个chatbot,可以integrate到不同application中)为去中心化计算网络带来需求的增长。从长期看,chainml会是一个完整的AI + web3平台(后面会详细分析),其中就包括模型市场和算力市场。
我认为ChainML的技术路径规划非常合理,之前提到的问题他们想的也很明白,去中心化算力的目的一定不是和中心化的算力相提并论,给AI industry提供充足的算力supply,而是逐步降低成本让合适的需求方接受这种品质更低的算力来源。那么,在项目初期,在协议无法获取大量去中心化算力节点的情况下,重点就是找到一个稳定且高效的算力来源,因此,从产品路径看,应当是先从中心化的方式做起,在早期阶段就把产品链路跑通,并且通过强大的bd能力开始积累客户,拓展和据市场,然后逐步将中心化算力的提供者分散到更成本的小公司,最后把算力节点大范围地铺开。这就是chainml divide and conquer的思路。
从需求端的布局看,ChainML构建了一个中心化的基础设施协议的MVP,设计理念是可移植的。并且从今年2月开始就在和客户一起运行这个系统,在今年4月开始在生产环境中使用。目前正Google Cloud上运行,但基于Kubernetes和其他开源技术,很容易移植到其他环境(AWS、Azure、Coreweave等)。后续会逐步去中心化这个协议,分散到小众云,然后最后是提供算力的矿工。
这个sector叫AI markerplace多少有点限制了想象空间。严格意义上来说,一个真正具备想象空间的”AI市场”应该是一种将模型全链路金融化的中间平台,涵盖从底层的算力和数据,到模型本身和相关的应用。之前提到去中心化算力在早期的主要矛盾是如何创造需求,而一个闭环的将AI全链路金融化的市场正好有机会诞生出这类需求。
大概是这样:
一个web3加持下的AI市场以算力和数据为底层,吸引开发者通过更有价值的数据搭建或者微调模型,进而发展出相应的基于模型的应用,这些应用和模型在开发和使用的同时也为算力创造了需求。在代币和社区的激励下,基于bounty的实时数据采集任务或者常态化的对于贡献数据的激励都有机会扩充并且扩大该市场中数据层的独特优势。同时,应用的普及也返回给数据层更多有价值的数据。
社区
除了之前提到的token带来的价值,社区无疑是web3带来的最大增益之一,是推动平台发展的核心动力。社区和token的加持使得贡献者和贡献内容的质量有机会超过中心化机构,比如,数据多样性成就是这类平台的一个优势,这对于构建准确、无偏见的AI模型是至关重要的,同时也是目前数据方向的瓶颈所在。
整个平台的核心我认为就在于模型,我们在很早的时候就意识到,一个AI marketplace是否成功取决于是否存在高质量的模型,以及开发者有什么动力来一个去中心化的平台提供模型?但我们似乎也忘记思考了一个问题,拼基建不如传统平台硬,拼开发者社区不如传统平台成熟,拼声誉也没有传统平台的先发优势,那么相比传统AI平台庞大的用户基数和成熟的基建,web3的项目只能弯道超车。
答案可能就在AI模型金融化
ZKML:需求和供给两端双双踩雷
可以肯定的是on-chain AI一定是一个充满想象空间,并且值得深入研究的方向。链上AI的突破能为web3带来前所未有的价值。但同时,ZKML极高的学术门槛和对底层基建的要求确实不适合大多数初创公司死磕。大多数项目也不一定需要融入trustless LLM的支持才能达成自身价值的突破。
但并不是所有AI模型都需要搬到链上用ZK来做trustless,就像大多数人并不关心chatbot是怎么对query进行推理并给出结果的,也不在意使用的stable diffusion是否是某个版本的模型架构或者特定的参数设置。在大多数场景中,大多数用户关注的是模型是否能给一个满意的output,而不是推理的过程是否trustless或者透明。
如果proving system并没有带来百倍的overhead或者更高的推理成本,或许ZKML还有一战之力,但在高昂的链上推理成本和更高的成本面前,任何需求方都有理由质疑Onchain AI的必要性。
从需求端看
用户在乎的是模型给出的结果是不是make sense,只要结果合理,ZKML带来的trustless可以说一文不值;试想一下其中一个场景:
从供给端看
开发足以支撑大预言模型的proving system任重而道远,从现在头部项目的尝试看,几乎看不到大模型上链的一天。
参考我们之前关于ZKML的文章,从技术上看ZKML的目标是将神经网络转化成ZK电路,难点在于:
从当前进展看:
ZKML的发展进度并没有达到预期,从目前赛道头部项目modulus lab和EZKL发布的proving system的进度看,都能将一些简单的模型转化成ZK电路做模型的上链或推理证明上链了。但这还远远没有达到ZKML的价值所在 not event close,并且技术的瓶颈似乎也没有核心的动力去突破,一个严重缺乏需求的赛道从根本上无法获得学术界的关注,也就意味着更难以做出优秀的poc来吸引/满足仅存的需求而这可能也是杀死ZKML的死亡螺旋。
OPML:是过渡还是终局?
OPML和ZKML的差异在于ZKML证明了完整的推理过程,而OPML会在推理受到挑战时重新执行部分推理过程。很显然,OPML解决的最大的问题就是成本/overhead过高,这是一种非常务实的优化。
作为OPML的开创者,HyperOracle团队在“opML is All You Need: Run a 13B ML Model in Ethereum”中给出了one-phase到multi-phase opML的架构和进阶过程:
但显然这样的设计有一个关键缺陷,就是所有计算必须在虚拟机内执行,这阻止就阻碍了利用GPU/TPU加速以及并行处理,局限了效率。因此引入multi-phase opML。
Reference: https://mirror.xyz/hyperoracleblog.eth/Z__Ui5I9gFOy7-da_jI1lgEqtnzSIKcwuBIrk-6YM0Y
LET’S BE REAL
有观点认为OPML是一种实现全面ZKML前的一个过渡,但更现实的说不如把它当作一种Onchain AI基于成本结构和落地预期的取舍,或许ZKML全面实现的一天永远不会到来,至少我对此持悲观的态度,那么Onchain AI的hype最终还是要面对最现实的落地和成本,那么OPML可能就是Onchain AI的最佳实践,就像是OP和ZK的生态也从来不是替代的关系。
虽然但是,不要忘记了,之前需求的短板仍然存在,OPML基于成本和效率的优化并不从根本上解决“既然用户更在意结果的合理性,为什么要把AI搬到链上做成trustless”南辕北辙的问题,透明、所有权、去信任,这些buff叠加在一起确实很花里胡哨,但用户真的在乎吗?相比之下,价值的体现应该是在模型的推理能力上。
我认为这种对成本的优化从技术上是一个创新且solid的尝试,但从价值上看更像是一种蹩脚的圆场;
或许Onchain AI这个赛道本身就是在拿着锤子找钉子,但这也没错,一个早期行业的发展就是需要不断探索跨领域技术的创新结合,在不断磨合中找到最佳的契合点,错的从来都不是技术的碰撞和尝试,而是缺乏独立思考的盲目跟风。
不得不说AI在web3应用层的尝试确实前赴后继,好像大家都在fomo,但其中99%的integration还是就停留在integration吧,没必要借着gpt的推理能力映射项目本身有多大价值。
从应用层看,大致有两种出路:
如果真的有什么需要强调或者总结的:AI仍然是web3最值得关注也是机会最大的赛道之一,这个大逻辑一定不会变;
但我认为最值得关注的是AI marketplace的玩法,从根本上看这种平台或者infra的设计是符合价值创造的需求以及满足各方利益的,宏观来说,在模型或者算力本身以外创造出了一种web3特有的价值捕获的方式就足够有吸引力,同时,这也允许用户用一种独特的方式直接参与到AI的浪潮中。
或许再过三个月我又会推翻我现在的想法,所以:
以上只是我关于这个赛道很real的观点,真的不构成任何投资建议!