12

05

星期二

14:16

Hermes Agent上线macOS计算机控制功能,截图Token消耗压低95%

据动察 Beating 监测,Nous Research 的 Hermes Agent 正式上线 macOS 计算机控制(Computer Use)功能。 这项功能在体验上直接对标了 OpenAI Codex 的「后台控制」。其底层接入了本频道此前报道过的开源驱动 cua-driver,通过逆向苹果私有 API 向目标进程直接下发操作指令。这意味着当 Agent 在后台搜邮件、敲代码时,用户的实体鼠标不会乱跳,当前窗口焦点也不会被抢走,实现了人机在同一台电脑上互不干扰地协同工作。 由于电脑控制重度依赖连续截图,Token 账单往往极速膨胀。Hermes 为此在框架层做了一套四重上下文压缩机制:强制剔除冗余画面,只让模型记忆最近 3 张截图,并配合服务端清理旧缓存。官方测算,在 1568×900 分辨率下连续执行 20 步操作,上下文消耗能从约 60 万 Token 暴降到 3 万左右。

「查看原文」

本内容旨在传递行业动态,不构成投资建议或承诺。