扫描下载APP
其它方式登录
Google Research推广的TurboQuant算法通过极坐标量化与1比特残差校正,将KV Cache压缩至3比特,显著降低大模型长上下文推理的内存需求,冲击存储硬件厂商股价;该突破挑战AI算力扩张依赖存储增长的核心叙事,引发市场对硬件需求长期逻辑的重估。