14

05

星期四

14:24

便宜20倍性能只降8%!Gemini 3.2 Flash下周I/O发布,直接对标GPT-5.5

据动察 Beating 监测,Google 计划在 5 月 20 日的 I/O 大会上发布新一代轻量模型 Gemini 3.2 Flash,模型整体性能大致与 GPT-5.5 同级,但明确不及 Anthropic 的 Mythos。 Abacus.AI CEO Bindu Reddy 透露传闻称 Gemini 3.2 Flash 在编码和推理任务上达到了 GPT-5.5 的 92%,推理成本却只有后者的十五到二十分之一,大多数查询延迟低于 200 毫秒。她认为 Google 的蒸馏加稀疏化技术正在发挥巨大作用,本质上是把一个前沿模型压缩成了 Flash 级别,但没有出现通常的性能悬崖。 Gemini 3.2 Flash 此前已有泄露迹象。5 月初有人在 iOS 应用构建包和 AI Studio 元数据中发现了该模型的痕迹,随后它以匿名身份出现在 LM Arena 的评测中。早期测试者反馈,该模型在创意编码任务上表现突出,甚至在部分基准上超过了 Gemini 3.1 Pro。

「查看原文」

本内容旨在传递行业动态,不构成投资建议或承诺。