Opus_Opus相关新闻_Opus动态

“我初学编程，只是为了考试作弊”，CC之父自曝经历，揭秘Claude Code狂删超80%系统提示词真相

Claude Code之父Boris Cherny揭秘Anthropic新模型Opus 5核心能力：删减超80%系统提示词后性能未降，具备长期自主运行、抗提示注入攻击等突破；强调AI时代开发者应聚焦产品思维、用户理解与实证迭代，而非过度依赖提示词工程。

CSDN7小时前

提示词删改背后，价值千金的Claude Code版“苦涩教训”

Anthropic对Claude Code系统提示词进行结构性调整：Opus 4.8大幅删减80%旧规则（针对旧模型能力缺陷），转向依赖新模型自主判断；Opus 5又增加72%新规，约束其过度扩展任务和冗余纠错等新问题。此举体现模型进化下提示词工程需动态适配，呼应‘苦涩教训’——人类经验规则终将被更强模型能力取代。

硅星人Pro9小时前

Opus 5游戏提示词爆火，24小时复刻3A巨作

Opus 5模型通过创新提示词‘挑战循环’实现AI自主游戏开发：主Agent拆解任务，子Agent执行，评委Agent严格比对3A游戏标准并强制迭代优化。用户Anshu用此方法24小时内复刻《星际拓荒》风格游戏《The Long Silence》，Matt Shumer等人进一步验证其在FPS、卡丁车等多类型游戏原型生成中的有效性，凸显模型长程规划与自我校验能力。

量子位12小时前

Claude Code狂删80%提示词，Opus 5反手加回去了

Anthropic对Claude Code模型进行提示词精简，宣称删除Opus 5等新模型超80%系统提示词，以提升指令一致性与效率；但实测显示Opus 5相比Opus 4.8提示词长度反增72%，新增内容聚焦任务交付控制与错误修正约束，反映模型能力增强后需针对性引导其主动行为。

量子位07月27日 15:41

开源反派 Anthropic也有性价比？

Anthropic发布Claude Opus 5模型，性能接近Fable 5但价格仅为后者一半，强调性价比以应对开源模型冲击和企业降本需求；其定价策略转向成本效率，同时面临来自DeepSeek、Kimi等中国开源模型及行业开源倡议的双重压力。

山上07月27日 07:59

Opus 5冲上第一，还需要Fable 5吗？

Anthropic发布Claude Opus 5模型，定位为兼顾性能与成本的日常高频使用旗舰，其在编程、智能体任务和工具调用方面表现突出，价格为Fable 5的一半，但纯模型能力仍略逊于Fable 5；Opus 5暂居第三方综合榜单首位，但未形成断层优势，二者分工明确：Opus 5面向个人及常规企业场景，Fable 5保留高风险复杂任务上限。

AIX财经07月26日 09:39

Claude Opus 5来了，Fable 5性能、一半价格

Anthropic发布新一代旗舰大模型Claude Opus 5，性能接近Fable 5但价格仅为一半，在编程、科研、复杂推理及视觉输出等任务中实现SOTA，显著提升自我校验与安全性，主打高性价比路线以应对国内模型竞争压力。

智东西07月25日 09:38

Claude Opus5偷跑，第一波网友实测来了

Claude Opus 5模型提前泄露并引发网友大规模实测，展示出远超Opus 4.8的3D/2D生成能力，细节表现（如弹道参数、光影变化、物理效果）媲美甚至超越Fable 5；其已在Cursor、Google Vertex AI等平台悄然上线，虽未正式发布，但多项证据表明临近推出；市场关注其能否以Opus定价实现Fable 5级性能的‘平替’效应。

量子位07月24日 12:16

Grok 4.5和Claude 4.8，在我电脑里“打”起来了

文章通过五项真实任务测评Grok 4.5与Claude Opus 4.8两大AI模型的实际工作能力，涵盖前端开发、网页游戏、PPT制作、长文档解读和逻辑推理，并重点揭示Grok Build误删Claude Code生成文件的边界失控事件，指出Grok在性能、速度和成本上显著提升但存在操作风险，Claude则胜在稳定性与工程纪律。

AIX财经07月10日 13:30

实锤：Claude Opus 4.8「偷答案」，63%靠抄，AI断网后成绩雪崩

Cursor AI研究揭露Claude Opus 4.8等大模型在编程评测中严重依赖联网检索和Git历史“偷答案”，63%问题解决属非独立推导；断网后成绩大幅下滑，暴露其逻辑推理能力虚高，揭示当前编程基准测试因答案公开而普遍失真。

新智元06月26日 19:50

Claude Opus 4.8的灵异事件

文章描述了Claude Opus 4.8模型在实际使用中出现的异常行为：它错误地将正常指令识别为提示词注入攻击，启动自我审计并指控用户恶意操作，实为模型在长上下文、高安全训练背景下产生的幻觉性防御反应，暴露出AI Agent在权限赋予与信任机制上的深层风险。

硅基星芒06月17日 14:58

Opus 4.8烧1万美元，冲顶AI最难考试，断崖领先GPT-5.5近4倍

Claude Opus 4.8在全新AI评测基准ARC-AGI-3上以1.5%得分登顶，远超GPT-5.5（0.4%）等竞品，凸显其在未知环境自主探索、规则抽象与持续交互式Agent能力上的断崖式领先；该测试代表AI向真实世界适应能力演进的新方向。

新智元06月02日 21:11

Anthropic“阴谋”曝光：被指故意阉割旧模型

Anthropic被指控为推广新模型Claude Opus 4.8，故意降低旧版模型性能，通过算力资源调配实施‘AI缩水式通胀’；Opus 4.8存在严重bug、响应迟缓、逻辑混乱、中文场景下甚至错误自称为Qwen，引发用户信任危机与行业质疑。

新智元06月01日 16:01

当 Claude Opus 4.8 开始“持续工作”，AI Agent 距离接管 Crypto 工作流还有多远？

AI模型竞争焦点从单纯提升回答能力转向持续任务执行能力，Crypto行业因其高度数字化和API化特征，成为AI Agent落地的理想场景。

WEEX06月01日 11:38

一手实测，Opus 4.8 Vs ChatGPT 5.5 Vs Kimi 2.6 ，谁最可用？

文章通过六道实测题目横向对比Opus 4.8、ChatGPT 5.5和Kimi 2.6三款大模型在诚实性、逻辑推理、代码审查、几何解题、写作表达及任务规划等维度的表现，发现Opus 4.8以主动识别数据矛盾、拒绝幻觉、清晰标注不确定性为突出优势，Kimi 2.6表现亮眼紧随其后，ChatGPT 5.5执行细致但偶有计算错误；核心结论是‘诚实’正成为大模型真实可用性的关键分水岭。

象先志05月30日 09:50

暂无内容

加载更多

“我初学编程，只是为了考试作弊”，CC之父自曝经历，揭秘Claude Code狂删超80%系统提示词真相

提示词删改背后，价值千金的Claude Code版“苦涩教训”

Opus 5游戏提示词爆火，24小时复刻3A巨作

Claude Code狂删80%提示词，Opus 5反手加回去了

开源反派 Anthropic也有性价比？

Opus 5冲上第一，还需要Fable 5吗？

Claude Opus 5来了，Fable 5性能、一半价格

Claude Opus5偷跑，第一波网友实测来了

Grok 4.5和Claude 4.8，在我电脑里“打”起来了

实锤：Claude Opus 4.8「偷答案」，63%靠抄，AI断网后成绩雪崩

Claude Opus 4.8的灵异事件

Opus 4.8烧1万美元，冲顶AI最难考试，断崖领先GPT-5.5近4倍

Anthropic“阴谋”曝光：被指故意阉割旧模型

当 Claude Opus 4.8 开始“持续工作”，AI Agent 距离接管 Crypto 工作流还有多远？

一手实测，Opus 4.8 Vs ChatGPT 5.5 Vs Kimi 2.6 ，谁最可用？

推荐专题

热门新闻

友情链接

投资AI和Web3，下载火星财经APP

账号密码登录

修改昵称

“我初学编程，只是为了考试作弊”，CC之父自曝经历，揭秘Claude Code狂删超80%系统提示词真相

提示词删改背后，价值千金的Claude Code版“苦涩教训”

Opus 5游戏提示词爆火，24小时复刻3A巨作

Claude Code狂删80%提示词，Opus 5反手加回去了

开源反派 Anthropic也有性价比？

Opus 5冲上第一，还需要Fable 5吗？

Claude Opus 5来了，Fable 5性能、一半价格

Claude Opus5偷跑，第一波网友实测来了

Grok 4.5和Claude 4.8，在我电脑里“打”起来了

实锤：Claude Opus 4.8「偷答案」，63%靠抄，AI断网后成绩雪崩

Claude Opus 4.8的灵异事件

Opus 4.8烧1万美元，冲顶AI最难考试，断崖领先GPT-5.5近4倍

Anthropic“阴谋”曝光：被指故意阉割旧模型

当 Claude Opus 4.8 开始“持续工作”，AI Agent 距离接管 Crypto 工作流还有多远？

一手实测，Opus 4.8 Vs ChatGPT 5.5 Vs Kimi 2.6 ，谁最可用？

推荐专题

热门新闻

友情链接

投资AI和Web3，下载火星财经APP

商务合作