26

03月

星期四

10:45

谷歌推出压缩算法TurboQuant，宣称实现约6倍内存节省

谷歌推出一种可能降低人工智能系统内存需求的压缩算法TurboQuant。TurboQuant压缩技术旨在降低大语言模型和向量搜索引擎的内存占用。该算法主要针对AI系统中用于存储高频访问信息的键值缓存（key-value cache）瓶颈问题。随着上下文窗口变大，这些缓存正成为主要的内存瓶颈。TurboQuant可在无需重新训练或微调模型的情况下，将键值缓存压缩至3bit精度，同时基本保持模型准确率不受影响。对包括Gemma等开源模型的测试显示，该技术可实现约6倍的键值缓存内存压缩效果。（财联社）
「查看原文」

本内容旨在传递行业动态，不构成投资建议或承诺。

5分钟前

富途控股宣布旗下持牌虚拟资产交易所“猎豹交易所”正式展业

14分钟前

数据：445.23 枚 BTC 从匿名地址转出，经中转后转至另一匿名地址

19分钟前

傲意科技完成C1轮1.5亿元融资

19分钟前

英矽智能：与元羿生物拓展AI驱动CNS领域研发合作，总金额最高可达9475万美元

23分钟前

币安已开放 United Stables (U) 的充值提现业务

28分钟前

数据：加密市场多数上涨，Meme 板块上涨 5.09%，仅 GameFi 及 PayFi 板块下跌

35分钟前

昨日美国比特币现货 ETF 净流入 780 万美元，以太坊 ETF 净流出 850 万美元

41分钟前

德州法官驳回一加密开发者寻求其软件豁免货币传输法的诉求

下载MarsBit APP

以行业热点、实时快讯、视频解读等维度提供全方位的区块链整合服务

24H热门新闻

暂无内容