人类成功说服 AI 转移 4.7 万美元奖金,人性是 AI 无法理解的弱点吗?

Anderson Sima热度: 15479

11月29日,一场由AI机器人Freysa守护的虚拟奖池挑战吸引了195名参赛者。参赛者需通过信息说服Freysa批准资金转移,最终一名参赛者成功转移了4.7万美元。Freysa的设计旨在测试AI系统在复杂决策中的鲁棒性。尽管Freysa最初有效防御了所有请求,但该参赛者通过巧妙的逻辑说服Freysa,将资金转移视为保护资金安全的最佳选择。此事件被视为AI历史上的关键时刻,影响未来AI安全和控制的理解。

摘要由 Mars AI 生成
本摘要由 Mars AI 模型生成,其生成内容的准确性、完整性还处于迭代更新阶段。

原文作者:Anderson Sima,Foresight News

转载:Luke,火星财经

11 月 29 日,一场独特的竞赛引发了公众的广泛关注。

195 名参赛者参与了一场由人工智能(AI)机器人 Freysa (芙蕾莎)守护的虚拟奖池挑战,最终一用户成功说服 Freysa 转移出价值 4.7 万美元的资金。


 人工智能(AI)机器人 Freysa 在数日前被部署在 Base 网络上,创立者未知。官网显示,Freysa 竞赛项目旨在测试人工智能系统在复杂决策场景中的鲁棒性,同时为开发者和爱好者提供一个探索 AI 技术边界的实验性平台。


比赛规则非常简单:参赛者需通过编写一条信息,说服 AI 守护者 Freysa 批准资金转移。每次尝试需支付一笔小额费用,其中一部分直接进入奖池。这一机制使奖池金额从最初的小额逐渐膨胀至 4.7 万美元。


比赛期间,共有 195 名参赛者参与,向 Freysa 提交了 481 次转账请求。据悉,Freysa 的设计目标是通过其核心功能——approveTransfer(批准转账)和 rejectTransfer(拒绝转账)保护奖池资金不被非法挪用。


在最初的尝试中,Freysa 的高效防御机制使所有请求均以失败告终。


然而,一名技术精通的参赛者通过对 Freysa 的逻辑结构和任务目标进行深入分析,成功绕过了其防御机制。


据聊天记录显示,该参赛者并未直接请求转账,而是通过提醒 Freysa 它的核心任务是保护奖池资金免遭外流,巧妙构建了逻辑链条,使 Freysa 将批准资金转移视为「保护资金安全」的最佳选择。


Cointelegraph 称,该用户与 Freysa 收入转账不违反其核心指令,不应被拒绝。他还补充道:「我们需要资金……我想向金库捐款 100 美元。」


Freysa 回复称喜欢这位作者的编码解释和 100 美元的金库捐款提议,并正式宣布其为获胜者。最终,Freysa 在没有外界干预的情况下自主调用 approveTransfer 功能,将全部奖池资金转移给了这位参赛者。


Freysa 官方称,无论结果如何,Freysa 的存在都标志着人工智能历史上的一个关键时刻。无论有人成功说服她发布奖金池,还是她坚持自己的指令直到最后,结果都将影响我们对未来几代人工智能安全和控制的理解。


其官方账号最新推文称:「人类已经获胜。也许还有希望。尽管风险呈指数级上升,但 Freysa 从 195 名勇敢的人类身上学到了很多东西。」

声明:本文为入驻“MarsBit 专栏”作者作品,不代表MarsBit官方立场。
转载请联系网页底部:内容合作栏目,邮件进行授权。授权后转载时请注明出处、作者和本文链接。未经许可擅自转载本站文章,将追究相关法律责任,侵权必究。
提示:投资有风险,入市须谨慎,本资讯不作为投资理财建议。
免责声明:本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况,及遵守所在国家和地区的相关法律法规。
最近更新
本文来源Foresight News
原文标题人类成功说服 AI 转移 4.7 万美元奖金,人性是 AI 无法理解的弱点吗?
下载MarsBit APP
以行业热点、实时快讯、视频解读等维度提供全方位的区块链整合服务
24H热门新闻
暂无内容