区块链技术在人工智能发展中的应用以及必要性

Max Parasol2023-05-05热度: 17456

当智能机器人在世界范围内普及的时候，他们最好由去中心化的网络控制

原文标题：How to control the AIs and incentivize the humans with crypto

原文作者：Max Parasol

原文来源：cointelegraph

编译：Max, Richard LegalDAOCN

ChatGPT是有史以来增长最快的消费者应用程序，而且仍在迅速增长。

但AI背后的真相是，仍然需要人类进行创建，标记和结构化训练数据 - 而训练数据非常昂贵。不利的情况是，随着AI的不断进步，对数据的反馈处理需求正成指数级增长；因此，如何在AI的发展中管理其中的参与者成为一个很重要的问题。

一些专家认为，当智能机器人在世界范围内普及的时候，他们最好由去中心化的网络控制，并且人类是通过得到激励的方式来贡献数据集的。区块链和代币（通证）可以在这过程中提供帮助...但是区块链能够拯救人类免受AI的伤害吗？

ChatGPT 不是 AGI（通用人工智能）

根据著名的AI研究人员Ben Goertzel的说法，ChatGPT是一件大事，因为“ChatGPT让谷歌创始人多年来第一次出现在办公室里！”。Goertzel是基于区块链的AI交易平台SingularityNET的创始人，也是人工智能AGI（AGI：通用人工智能，也被称作“强人工智能”）的坚定支持者 - 让计算机自己思考。这意味着他比大多数人更清楚地看到ChatGPT的不足之处。（ChatGPT属于弱人工智能）

"ChatGPT和其他神经模型的有趣之处在于，它们实现了一定程度的通用性，却没有太多的概括能力。他们通过拥有如此多的训练数据，实现了相对于人类个体而言一定的能力范围.. 换句话说，ChatGPT实际上是通过拥有这么多数据的蛮力实现的一种功能。"

ChatGPT Ben Goertzel和他的机器人Desdemona（如何利用区块链防止人工智能 "消灭人类"）

“如果GPT-7能够完成80％的人类工作，我也不会感到震惊；这很重要，但这并不意味着它们可以成为人类水平的思维机器。但它们可以完成大多数人类水平的工作。” Goertzel说道。

对 AI 来说，基于经验的逻辑比抓取互联网信息更难。谓词逻辑意味着人类知道如何打开瓶盖，但AI需要数万亿的数据才能学会这个简单的任务。Goertzel解释说，好的大型语言模型（LLMs）仍然可以将语言转换为推定逻辑，包括悖论逻辑或自相矛盾的逻辑。

“如果你把整个网络作为AI的食物，那么几乎任何你问它们的问题都可以在网络上找到答案。”

Goertzel在人工智能思维研究领域很重要，因为他专门研究AGI。Goertzel表示自己和90％的AGI同事认为像ChatGPT等LLM在一定程度上分散了人们希望“让AI可以自我思考”这一目标的注意力。但他补充说LLM也可以促进和加速所有可能在AGI中发挥作用的创新工作。例如，LLM将加快编码的进步。LLM甚至可以帮助没有编码能力的普通人构建手机或网络应用程序。这意味着非技术创始人可以使用LLM构建技术创业公司。“人工智能应该使软件技术的开发民主化，然后再稍微往前走一点，民主化硬件技术开发的民主化。”

Goertzel创立了SingularityNET，试图利用区块链和开源技术，将控制AGI的技术权力“分发”给每个人，而不是让它留在垄断者手中。Goertzel指出，ChatGPT和其他文本应用程序部署了公开可见的开源算法。因此，他们的数据集的安全基础设施以及用户如何参与这场技术革命，正处于一个关键时刻。

AI开发同样受到了许多质疑。三月，OpenAI联合创始人埃隆·马斯克（Elon Musk）和其他1000多名技术领导人呼吁暂停开发AI或部署比GPT-4更强大的系统。他们的公开信警告说，这将会给社会和人类带来“深远的风险”。信中提出，暂停可以为AI系统实施“共享安全协议”提供时间。“如果这样的暂停无法快速实施，政府应采取行动，实施暂停令。”

Goertzel却对技术改善我们生活的潜力比较乐观，他从1970年代就开始研究这一领域了。

ChatGPT 在图片中，Goertzel反驳了马斯克等人关于暂停GPT-4研究的观点：LLMs不会变成AGI

一个信誉系统是必要的

Humayun Sheikh是著名的AI研究实验室DeepMind的创始投资者，他支持早期AI和深度神经网络技术的商业化。目前，他作为Fetch.ai的首席执行官兼创始人，带领着这家初创公司开发一个深度技术用以“自治未来”。

他认为，区块链和AI的交叉是经济驱动的，因为除非是非常大型的公司或组织，否则训练AI模型所需的资金是非常昂贵的。“加密货币的整个前提是技术和金融的民主化。我们设想，与只有一个垄断实体拥有重要AI模型的所有权不同，区块链可以将所有权分散给为其开发做出贡献的人们。”

“为让用户（人们）可以持续地参与AI训练和发展的循环，我们可以采取的一种方法是从一开始就让人们参与其中，这也是为什么我们坚持将AI技术去中心化。无论是从一开始让人们训练AI，还是让他们测试和验证AI系统，确保普通人能够拥有AI模型的部分所有权是一种很好的方式来让用户（人们）留在“循环”中。我们希望做到这一点，同时让这种民主以适当的激励机制为基础。”

为了达到这一目标，可以采用新兴的信誉系统和去中心化的社交网络。例如，SingularityNet的分支产品Rejuve正在对个人提交的生物数据进行代币化和众包，希望使用人工智能对其进行分析并将其与动物和昆虫数据进行交叉匹配，从而发现基因组的哪些部分可以让我们活得更久。这是一个基于AI和Web3的“长寿经济”。在这个案例中，参与者参与了科学的开放并为结果做出了贡献，因此数据提交者也应该因其贡献而获得奖励。

ChatGPT Sheikh声称一个数据交易市场是必要的

“AI 的发展依赖于人类的训练。信誉系统可以为数据提供质量保证，去中心化的社交网络可以确保在开发过程中包含各种不同的想法和观点。”

Sheikh指出，基于区块链的人工智能治理也能有所帮助，他说，通过每个人都能看到的收集的数据和做出决定的无可争议的记录，能确保决策的透明度和去中心化。但区块链技术只是拼图的一部分。他说："规则和标准，正如我们在DAO中看到的那样，总是需要可信的治理。

Goertzel指出：“你无法买卖别人的信誉”，而代币具有网络效应。基于区块链的人工智能信誉系统可以确保消费者区分AI假冒品（原文：AI fakes）和真人，同时也可以确保透明度，以便人工智能模型的构建者可以为他们的人工智能构建负责。在这种观点下，需要在区块链社区，然后在主流技术生态系统中采用一些标准，对信誉进行代币化衡量。

而反过来，信誉系统可以加速人工智能的创新。"这不是快速赚钱的道路，但它是区块链主导全球经济道路的一部分。在信誉领域，区块链有一点“公地悲剧”（公地悲剧是经济学中的一个问题，发生在个人为了追求个人利益而忽视社会福利的时候）的感觉；但每个人都将从一个共享的信誉系统中受益。

将区块链用于数据集管理

AI与数据结合可以做很多事情--但全球各国政府都非常关注如何管理数据。

关键问题是谁拥有数据集。开源和闭源之间的区别变得模糊，它们之间的相互作用变得非常微妙。AI算法通常是开源的，但数据集的参数和数据集本身通常是专有的和封闭的，包括ChatGPT。

公众不知道用来训练ChatGPT-4的数据是什么，因此即使算法是公开的，AI也无法复制。各种人都推测它是使用谷歌和推特的数据集进行训练的；谷歌却否认它曾使用数据和与 ChatGPT 对话的方式训练自己的名为 Bard 的AI，这进一步模糊了谁拥有什么（What）以及“如何做到”（How）的问题。

知名的AI风险投资人李开复经常说，开源AI是历史上最伟大的人类合作，AI研究论文通常包含它们的数据集以便重现，或供他人复制。但是尽管Lee发表了这番言论，当数据与学术研究相关时，往往会被贴上错误的标签，Goertzel说道。即使是开放数据集，比如学术论文，也可能不成熟，标记错误，无用且通常很难复制。

因此，AI与区块链的结合将在数据预处理领域发挥很大作用。加密公司和 DAO 有机会为用于清理训练数据集的去中心化基础设施创建工具。开源代码是一回事，但保护数据至关重要。

Goertzel指出，“您需要有办法获得实时的AI模型，但最终，有人必须为运行该过程的计算机付费”，这可能意味着让用户通过订阅模型付费访问AI；但是，代币经济是一种更“自然”的选择。那么，为什么不激励好的数据集用于进行进一步的研究呢？诸如基因组学数据之类的“数据分析管道”可以由加密公司/DAO构建。LLMs已经可以做这些事情了，但“大多数这些预处理步骤可以由去中心化的方式（分布式的计算机）更好地完成，”Goertzel说，“但要构建它需要很多工作。”

人与AI的协作：海量的数据需要负责任的管理者

加拿大Ocean Protocol创始人Trent McConaghy说，考虑人与AI 协作的一种实用方法是“计算机辅助设计”（CAD，computer-aided design，指利用计算机及其图形设备帮助设计人员进行设计工作）的概念。自1980年代以来，工程师已经从AI支持的CAD中受益。“这是一个重要的框架：人类与计算机共同努力完成目标，同时利用双方的优势，”他说。

McConaughy从1990年代开始为加拿大政府工作，并且花了15年时间为电路设计开发AI支持的CAD工具。他在2016年写了有关AI的第一篇重要文章。

CAD为我们提供了一种实际的人与AI协作的框架。但是，这些AI支持的CAD工具仍然需要数据。

ChatGPT 图片内容：“想象一下手画一个拥有100亿个部件的芯片... 但是，人们还是做到了，你知道是如何做到的吗？答案是使用人工智能...

McConaughy于2017年创立了Ocean Protocol，以解决这一问题。Ocean Protocol是一个公共服务网络，可以安全共享AI数据，同时保护隐私。“这是一款利用区块链的AI技术，旨在为地球民众改善数据状况。”令人印象深刻的是，它是GitHub上第六活跃的加密项目。

区块链对于将数据交到普通人手中有很多可谈的优势。就像Goertzel一样，McConaghy相信分布式计算机可以为保护AI不被恶意使用做出重要贡献。IPFS、Filecoin、Ocean Protocol和其他分布式数据控制者已经在过去几年里开展了这项任务。

Ocean上的数据农场（原文：Data farming）已经激励人们挑选他们认为可以用于AI开发的高活跃度数据资产。例如，企业数据市场Acentrik、企业AI助理Algovera以及分布式数据科学竞赛协议Desights。McConaghy说：“AI人员面临的问题是获取更多数据和更多数据的来源。”

区块链可以帮助 AI 安全地共享数据（原始训练数据、模型和原始训练预测），具有不可更改性、来源性、抗审查性和隐私性等特点。

McConaghy将其视为两者结合的重大优势。“AI将数据转化为价值，但人类必须决定哪些是好的数据资产。”

Ocean Protocol已经进一步发展出了一个AI数据经济的基础。它将数据资产以代币化，使人们可以将有价值的数据作为NFT和代币发布，在钱包中持有它们，将它们放在数据DEX上出售，甚至在数据DAO中管理它们。通过利用DeFi工具，将数据代币化解锁了数据经济；但这些努力会在人工智能之前成为主流吗？

ChatGPT Trent McConaghy, Ocean Protocal创始人，目标创建一个数据交易市场

去中心化计算机可以为自主机器人服务

AGI是指计算机开始自主思考，并构建更好的自身源代码版本。Goertzel解释说：“人类水平的AGI可以阅读自身的源代码、现有的数学和计算机科学，并可以复制自身以进行实验，然后构建下一级 - ASI人工超级智能。”

在Goertzel的看法中，这项技术由每个人来指导要比由某个科技公司或国家单独控制要好得多。

“如果你把AGI系统部署到全球数百万台计算机上，没有人可以拿着枪对你说“给我系统”- 区块链解决了这个问题，对吗？区块链比解决货币问题更能解决这个问题，”Goertzel认为。

Goertzel具体定义AGI为“具有超越其编程和培训的强大能力的软件或硬件；它能够创造出超越其获取的信息的重大创造性飞跃。”

“按照我的估计，我们现在距离人类水平的AGI只有三到八年的路程，然后再过几年就可以到达超人类AGI。我们正生活在一个有趣的时代。”

在中期，也就是未来三到五到八年，我们将看到强烈依赖数据的AI取得突破，达到人类水平，然后在此之后发生什么？”

许多人都认为，AI发展的下一步可能是区块链治理的重要用例之一。“AGI将促使世界领导人聚集在一起。AGI需要开源运行在散布于地球各地的数百万台机器上，”Goertzel说。“因此，没有国家可以控制它，也没有公司可以控制它。”

去中心化技术不是完美的解决方案

凯（Kai）教授是香港科技大学计算机科学与工程的教授，也是伯克利国际计算机科学研究所的杰出研究学者，他同意，使AI民主化的关键瓶颈是运行AI的巨大计算资源。但他不确定去中心化技术能否成为完美的解决方案。他说：“如果我们不解决眼下的问题，我们永远都到不了终结者的阶段。现在存在人工智能在潜移默化中撕裂社会的问题；我们需要解决人类的偏见，以及AI的偏见问题。”

他说，去中心化技术仍然是高度实验性的，而这些Web2问题必须首先解决，因为它们正在给我们带来当前的问题。

“AI在一些事情上做出的决定往往是人们在生活中无法察觉到的；搜索引擎、YouTube、TikTok——他们决定的事情你往往无法察觉，但却创造出更多两极分化的观点，并导致难以为继的国内和地缘政治分裂。”

凯表示，数据集的透明度至关重要，但如果数据集是整个互联网，那么该数据集实际上是开源的。他认为，谷歌是100%在互联网上训练的，而LLMs很快就会迅速取代搜索引擎的算法；LLMs可以近乎100%地从互联网上训练出来。

因此，凯对区块链能解决混乱的AI问题的观点提出质疑。

"这种说法[人工智能的分散计算]的反面是，AI更加自主并可能导致电影“终结者”中的天网（Skynet）的情景出现。这种分布式的计算能力并不是解决方案，因为你可能无意中导致人工智能军团的出现。”

那么最好的解决方案是什么？“去中心化有一定的用处，但不是万能药；Web2已经制造了很多意想不到的后果，我们需要从中吸取教训，并且认识到区块链是一种可以提供许多优势的基础技术，但仍然不是万能的解决方案。”

但当然，并非所有在网上的数据都能免费使用：科学研究、医疗数据、应用程序收集的个人数据以及其他大量的私人拥有的数据可以用来训练AI。

他表示，其中一个最有用的工具是创建大规模的模拟，看看这一切可能如何发挥作用。他说，问题是“我们该去中心化什么，以及不去中心化什么”。

ChatGPT 由于AI所引发的社会问题已经呈指数级增长，因此任何可行的解决方案也必须由AI来实现