第三方评测出炉:Thinking Machines新模型战平GPT-Realtime-2,登顶音频榜单
据 动察 Beating 监测,数据平台 Scale Labs 今日公布最新的 Audio MC S2S 榜单。评测结果显示,Thinking Machines 刚发布的 TML-Interaction-Small 模型获得 43.4% 的 APR 得分,与 OpenAI 的 GPT-Realtime-2 (xHigh) 并列第一。 在具体跑分上,GPT-Realtime-2 (xHigh) 以 48.45 分占据绝对分数榜首,TML-Interaction-Small 以 43.36 分紧随其后。由于两者分差在统计误差范围内,被官方评定为并列第一。排在其后的第二梯队依次为标准版 GPT-Realtime-2(37.61 分)、开启思考模式的 Gemini 3.1 Flash Live(36.06 分)以及老款 GPT-Realtime-1.5。 Scale Labs 评价称,该模型在保持对话响应速度的同时,展现出了现有全双工模型中少见的长上下文感知能力。
「查看原文」本内容旨在传递行业动态,不构成投资建议或承诺。