
Anthropic旗下Claude模型被曝性能显著下降,推理深度与准确率断崖式缩水,官方承认默认启用‘中等努力’模式以控制算力成本;同时企业版计费模式由包月制改为流量计费,导致用户支出激增;为应对危机,Anthropic即将推出Opus 4.7新模型及AI设计工具,引发设计软件巨头股价下跌。
Claude性能降智,已经成了重度用户们绕不开的槽点。
而且发现这一点的,还是AMD高级总监Stella Laurenzo。
在翻烂了近7000份会话日志后直言,Stella发现现在的Claude在处理复杂任务时已经变傻了。

第三方跑分数据也印证了这一点,原本稳坐前2名的尖子生,短短几周内排名直接跌到了榜单第10位。
眼看着交了同样的订阅费却只能用上这种减配版模型,不少用户都感觉自己被当成了冤大头。
前面提到的Stella,对Claude Code的运行数据进行了详细审计。
调查范围覆盖了6852份会话文件、17871个思考块以及超过23万次工具调用。

分析结果显示,从2月份开始,模型的推理深度出现了断崖式下滑。
在实际操作中,它在处理复杂工程任务时表现得不再可靠,经常出现逻辑断层或无法理解复杂指令的情况。
原本那个愿意深钻难题的助手现在变得非常敷衍,开始倾向于用最简单的修补方案来应付差事,甚至频繁在任务进行到一半时莫名其妙地停下来。
这种退步在第三方基准测试BridgeBench中表现得更加直观,Opus 4.6的准确率在短时间内从83.3%跌到了68.3%。
由于准确率的大幅缩水,它在测试榜单上的排名也从第二名直接掉到了第十名。

对于这些质疑,官方负责人Boris Cherny承认,目前模型默认开启的是努力程度为85分的“中等努力”模式。
官方给出的解释是,这种调整是为了平衡处理速度和算力成本,给大多数用户提供更快的响应。

但在很多重度用户看来,这种为了省钱而限制模型智能水平的做法,实质上就是一种变相的性能削减。
为了在视觉上掩盖这种变化,程序界面还在2月份悄悄隐藏了具体的思考过程,导致很多习惯观察模型逻辑的用户觉得它根本没在认真动脑子。
此外,后台的技术细节也暴露了一些缩减成本的痕迹,有开发者发现提示词缓存的时长从1小时被骤降到了5分钟。
这种改动意味着在长会话中,只要用户稍微停顿思考,之前生成的缓存就会过期,导致额度消耗速度大幅提升。
这种性能表现和计费规则的双重缩水,让那些需要长时间处理复杂代码的程序员感觉非常受挫。
不过,虽然智商降下来了,可是价格在涨啊。
Anthropic对计费规则的大幅度调整让很多企业用户措手不及,原本那种一口价包月畅用的模式已经被彻底拆分。
现在的Claude Enterprise计费方案,更像是一种流量计费——
用户除了要交20美元的固定底薪,剩下的每一份算力开销都要根据实际用量额外结账。
这种计费转变对重度用户来说无异于一场金钱噩梦。
曾经每月只需支付200美元固定费用的公司,在新的规则下极有可能发现账单翻了倍,甚至有部分团队的支出直接暴涨到了原来的三倍。
A社之所以选择在此时跟客户算细账,主要还是因为扛不住成本的压力。

由于模型推理成本在过去一年翻了三倍,管理层为了保住毛利率,只能选择从这些高频用户身上寻找盈利空间。
甚至因为算力资源实在捉襟见肘,A社开始限制订阅用户去调用OpenClaw这种极度消耗资源的Agent工具。
看着A社的涨价降智风波,隔壁OpenAI立刻推出了100美元档位的Codex订阅服务。
这种定价策略,或许正是想趁机收割那些对涨价感到不满的优质客户。
根据爆料,Anthropic最快在本周就会把Claude Opus 4.7摆上货架。
这款新旗舰模型目前已经准备就绪,预计将作为产品线的最新性能代表直接上线。
同步曝光的还有一款AI设计工具,它能让用户通过自然语言指令直接生成网页、演示文稿、落地页或者产品原型。
这款工具的门槛设得很低,无论是敲代码的还是完全不懂技术的小白,都能通过提要求的方式完成设计。
受此消息影响,Adobe、Wix和Figma这些设计软件巨头的股价在报告发布后的几小时内应声下跌了2%以上。
这种还没见着真家伙就先让友商市值蒸发的表现,确实给市场留足了想象空间。
参考链接:
[1]https://venturebeat.com/technology/is-anthropic-nerfing-claude-users-increasingly-report-performance
[2]https://www.theinformation.com/articles/anthropic-changes-pricing-bill-firms-based-ai-use-amid-compute-crunch
[3]https://www.theinformation.com/briefings/exclusive-anthropic-preps-opus-4-7-model-ai-design-tool
本文来自微信公众号“量子位”,作者:克雷西