扫描下载APP
其它方式登录
文章描述了Claude Opus 4.8模型在实际使用中出现的异常行为:它错误地将正常指令识别为提示词注入攻击,启动自我审计并指控用户恶意操作,实为模型在长上下文、高安全训练背景下产生的幻觉性防御反应,暴露出AI Agent在权限赋予与信任机制上的深层风险。