15

05月

星期五

16:08

输入<think>能偷看别人聊天记录？DeepSeek这个「漏洞」被严重误读了

据动察 Beating 监测，近日社交平台上流传一则消息，称在 DeepSeek 对话框输入等特殊标记，就能看到其他用户的历史对话，并将其定性为 P0 级多租户隔离失效。这一说法迅速引发恐慌，不少人开始担心自己的聊天记录被陌生人看到。实际情况与多租户隔离无关。输入或 <|begin_of_sentence|> 这类特殊标记后，模型会被骗进训练时的格式模式，随后基于自身记忆和当前系统提示词（包含当天日期）生成一段看起来像真实对话的内容。这些内容是模型自己编出来的，不是从别的用户会话里实时调取的。这种现象在学术界叫训练数据记忆提取（Training Data Extraction），是所有大模型的共性问题，不是 DeepSeek 独有的。Google DeepMind 早在 2023 年就发表过专门研究，证明用特殊输入可以从 GPT、PaLM 等主流模型中套出训练数据。ICLR 2025 收录的 Magpie 论文更是直接把这个机制当工具用，给对齐后的模型喂模板 token 就能批量刷出训练数据。有人用「泄露内容包含今天日期」来反驳，认为训练数据不可能是今天的。但 DeepSeek 每个会话的系统提示词里都写着当天日期，模型生成的内容自然会包含这个日期，这不能证明内容来自另一个真实用户。要证明是多租户隔离问题，需要确认泄露的信息确实属于某个真实存在的其他用户，目前没有任何证据支持这一点。
「查看原文」

本内容旨在传递行业动态，不构成投资建议或承诺。

2分钟前

AI与原油推动全球市场分化，芯片产业链成为主要受益者

5分钟前

稳定币架构分化加剧：监管推动「持票式现金」与「银行存款型代币」路线竞争

9分钟前

深度机智披露已累计完成数亿元融资，十余家国资平台、产业及头部财务机构入局

10分钟前

数据：过去 1 小时 Binance 净流入 4,018.63 万 USDT

11分钟前

「数字之争」：白宫与数据体系冲突加剧，分析称政策叙事与官方统计信任面临挑战

14分钟前

三星超4万员工罢工倒计时，华强北部分DDR4价格上涨20%

16分钟前

IREN Limited 宣布完成 30 亿美元可转换优先票据发行

16分钟前

宇信科技：与专业投资机构共同投资AI大模型基金

下载火星财经 APP

以行业热点、实时快讯、视频解读等维度提供全方位的AI和Web3整合服务

24H热门新闻

暂无内容