扫描下载APP
其它方式登录
UC伯克利发布全新AI智能体基准测试Agents’ Last Exam(ALE),聚焦真实工作场景,要求模型在Siemens NX、Unreal Engine、Adobe After Effects等专业软件中完成实际任务。结果显示GPT 5.5在通过率、成本和效率上全面优于Claude Fable 5,暴露当前AI智能体在复杂实操任务中的能力局限与高成本低效问题。