26

05月

星期二

12:48

阿里Qwen3.7-Max上线自动隐式缓存，最高减免80%输入成本

据动察 Beating 监测，阿里 Qwen 团队宣布在阿里云百炼平台为旗下旗舰模型 Qwen3.7-Max 默认开启自动隐式缓存。开发者无需修改代码或额外指定参数，即可直接享用缓存降本。在全新的计费机制下，系统会自动识别并提取请求中的重复上下文前缀。一旦发生缓存命中，命中部分的输入 token 费用仅按原单价的 20% 收取，直接免去八成输入成本。隐式缓存直接针对长文本与 Agent 智能体场景下的巨额开销。拥有 100 万 tokens 长上下文窗口的 Qwen3.7-Max 在运行自主编码等高阶任务时，需要高频、重复读取庞大的代码库或知识文档。一名开发者测试 Qwen3.7 后反馈，仅花不到一小时构建坦克大战网页 demo，就消耗了接近 100 万 tokens。如果放手让智能体在后台自主执行代码审查与循环迭代，单日用量能轻松冲上数亿 tokens。同行在缓存定价上的内卷，是促成阿里降价的另一个直接诱因。此前，DeepSeek V4-Pro 凭借极低的缓存命中价格吸引了大量开发者。在五月底宣布转为永久降价后，DeepSeek V4-Pro 的缓存命中计费被压到了每百万 tokens 仅 0.003625 美元（约合人民币 0.025 元），相当于在标准输入价格基础上直接免去 99.17% 的成本。大量开发者配合 Reasonix 等专属工具，将单次会话的缓存命中率最高推至 99% 这一极限，使得长会话智能体的运行账单几近为零。面对竞争压力，Qwen3.7-Max 不仅上线了无需任何配置的隐式缓存，还保留了需要手动声明 cache_control 标识的显式缓存模式。相比于自动缓存，显式缓存的命中确定性更高，命中费用低至标准输入单价的 10%（一折），但首次创建缓存时需支付 125% 的溢价，且缓存块仅有 5 分钟的生命周期（每次发生命中可重新计时）。
「查看原文」

本内容旨在传递行业动态，不构成投资建议或承诺。

刚刚

施纳贝尔：通胀存在上行风险，经济增长面临下行风险

3分钟前

深圳“十五五”规划纲要：推动集昇腾软硬件生态和标准规范于一体的“中国人工智能体系”整体出海

3分钟前

美元兑日元突破 159，日内涨幅达 0.07%

12分钟前

慢雾余弦：Squid 安全事件问题不在私钥，而是 Safe 钱包模块存在漏洞

14分钟前

今年河北推进68个亿元以上电子信息项目建设

17分钟前

阿里Qwen3.7-Max上线自动隐式缓存，最高减免80%输入成本

33分钟前

比特币步入高风险区间，机构资金持续撤离凸显抛压隐忧

33分钟前

数据：当前加密恐慌贪婪指数为 33，处于恐慌状态

下载火星财经 APP

以行业热点、实时快讯、视频解读等维度提供全方位的AI和Web3整合服务

24H热门新闻

暂无内容