人类成功说服 AI 转移 4.7 万美元奖金，人性是 AI 无法理解的弱点吗？

Anderson Sima2024-11-29热度: 29965

11月29日，一场由AI机器人Freysa守护的虚拟奖池挑战吸引了195名参赛者。参赛者需通过信息说服Freysa批准资金转移，最终一名参赛者成功转移了4.7万美元。Freysa的设计旨在测试AI系统在复杂决策中的鲁棒性。尽管Freysa最初有效防御了所有请求，但该参赛者通过巧妙的逻辑说服Freysa，将资金转移视为保护资金安全的最佳选择。此事件被视为AI历史上的关键时刻，影响未来AI安全和控制的理解。

摘要由 Mars AI 生成

本摘要由 Mars AI 模型生成，其生成内容的准确性、完整性还处于迭代更新阶段。

原文作者：Anderson Sima，Foresight News

转载：Luke，火星财经

11 月 29 日，一场独特的竞赛引发了公众的广泛关注。

195 名参赛者参与了一场由人工智能（AI）机器人 Freysa （芙蕾莎）守护的虚拟奖池挑战，最终一用户成功说服 Freysa 转移出价值 4.7 万美元的资金。

人工智能（AI）机器人 Freysa 在数日前被部署在 Base 网络上，创立者未知。官网显示，Freysa 竞赛项目旨在测试人工智能系统在复杂决策场景中的鲁棒性，同时为开发者和爱好者提供一个探索 AI 技术边界的实验性平台。

比赛规则非常简单：参赛者需通过编写一条信息，说服 AI 守护者 Freysa 批准资金转移。每次尝试需支付一笔小额费用，其中一部分直接进入奖池。这一机制使奖池金额从最初的小额逐渐膨胀至 4.7 万美元。

比赛期间，共有 195 名参赛者参与，向 Freysa 提交了 481 次转账请求。据悉，Freysa 的设计目标是通过其核心功能——approveTransfer（批准转账）和 rejectTransfer（拒绝转账）保护奖池资金不被非法挪用。

在最初的尝试中，Freysa 的高效防御机制使所有请求均以失败告终。

然而，一名技术精通的参赛者通过对 Freysa 的逻辑结构和任务目标进行深入分析，成功绕过了其防御机制。

据聊天记录显示，该参赛者并未直接请求转账，而是通过提醒 Freysa 它的核心任务是保护奖池资金免遭外流，巧妙构建了逻辑链条，使 Freysa 将批准资金转移视为「保护资金安全」的最佳选择。

Cointelegraph 称，该用户与 Freysa 收入转账不违反其核心指令，不应被拒绝。他还补充道：「我们需要资金……我想向金库捐款 100 美元。」

Freysa 回复称喜欢这位作者的编码解释和 100 美元的金库捐款提议，并正式宣布其为获胜者。最终，Freysa 在没有外界干预的情况下自主调用 approveTransfer 功能，将全部奖池资金转移给了这位参赛者。

Freysa 官方称，无论结果如何，Freysa 的存在都标志着人工智能历史上的一个关键时刻。无论有人成功说服她发布奖金池，还是她坚持自己的指令直到最后，结果都将影响我们对未来几代人工智能安全和控制的理解。

其官方账号最新推文称：「人类已经获胜。也许还有希望。尽管风险呈指数级上升，但 Freysa 从 195 名勇敢的人类身上学到了很多东西。」

本内容旨在传递行业动态，不构成投资建议或承诺。

关键字:人工智能美元

本文来源：Foresight News

原文标题：人类成功说服 AI 转移 4.7 万美元奖金，人性是 AI 无法理解的弱点吗？

下载MarsBit APP

以行业热点、实时快讯、视频解读等维度提供全方位的区块链整合服务

24H热门新闻

暂无内容

2分钟前

美元指数回吐伊朗战争以来涨幅，市场预期美联储加息概率低

5分钟前

Coinbase将Nexus（NEX）添加至上币路线图

11分钟前

Zcash基金会宣布接管三大核心社区资产，网站与X账号交由社区贡献者ZecHub负责

12分钟前

哈玛克：降息幅度超过合理范围将推高通胀

14分钟前

哈玛克：美联储多年来未能达到通胀目标

15分钟前

哈玛克：美联储降息信号具有误导性

18分钟前

哈玛克：美联储基准情景是利率将维持不变

21分钟前

哈玛克：对价格压力前景感到担忧