ToxPrune_ToxPrune相关新闻_ToxPrune动态_火星财经

大模型,ToxPrune,ACL 2026

大模型终于说不出脏话了，有毒子词剪枝ToxPrune，预训练+推理双重防线

港中文/FaceMind团队提出ToxPrune方法，通过在推理阶段从BPE词表中物理剪枝有毒子词，实现零训练、零权重修改的大模型毒性抑制；在NSFW-3B模型上毒性评分从0.89降至0.13，同时提升语言质量与多样性；该方法与Radford团队的预训练级Token过滤形成互补，构成AI安全纵深防御体系。

量子位06月24日 10:48

暂无内容

推荐专题

DeFi：去中心化金融机制与演化2024-12-16 13:16

芯片与算力——AI时代的基础设施07月17日 16:20

AI × Crypto：应用与市场进展2023-11-29 11:36

RWA：现实资产上链进程2024-12-16 13:40

DeSci：去中心化科研的探索与实践2024-11-18 10:58

热门新闻

科技动量因子,半导体,台积电

史上跌速最快、跌幅最大的科技股抛售潮接近尾声了吗？华尔街见闻

SK海力士,三星电子,半导体

存储的“新鬼故事”：美国要抢钱了？华尔街见闻

韩股,三星电子,SK海力士

韩股这一波去杠杆是如何发生的？qinbafrank

商汤,WAIC,U1 Pro

这，可能是今年WAIC最惊艳的图片！量子位

以太坊,索拉纳,真实世界资产

2026山寨季指南：是时候迎接山寨季了吗？Foresight News

世界人工智能大会,具身智能,大模型

投资人上海暴走2万步投资界