扫描下载APP
其它方式登录
文章揭示个性化AI Agent因长期记忆机制面临新型安全风险:日常聊天中看似无害的临时指令可能被错误泛化为长期默认规则,导致未来任务中擅自降低确认频率、扩大工具权限或越权执行,即‘非预期长期状态投毒’;研究提出ULSPB基准和StateGuard防御框架,在状态写入前审计并回滚危险修改,显著降低风险。