
Google DeepMind发布Gemini3.1Flash-Lite生成式AI模型,实现2.5倍首响提速与每秒超360 Token吞吐,在网页实时渲染、UI原型设计等动态交互场景取得突破,但输出成本升至每百万Token 1.50美元。
Google DeepMind 今日展示了其在生成式 AI 速度领域的突破性成果:Gemini3.1Flash-Lite。该模型凭借极高的推理效率,能够实现几乎“实时”的网页渲染,将 AI 从简单的文本交互推向了动态 UI 构建的前沿。
根据官方数据,Gemini3.1Flash-Lite 的首次响应速度较前代 Gemini2.5Flash 提升了 2.5倍。其吞吐量惊人,每秒可产出超过 360个 Token。在第三方机构 Artificial Analysis 的多模态任务测试中,该轻量化模型的表现甚至超越了如 Claude Opus4.6等体量更大的竞争对手。

然而,速度的提升也伴随着价格的调整。目前该模型的输出成本已从每百万 Token0.40美元上升至 1.50美元,反映了高性能低延迟技术背后的算力溢价。

谷歌同步推出了一个基于该模型的“伪浏览器”演示应用。用户只需输入描述性指令,系统便能在毫秒间直接生成并渲染出对应的网页内容。虽然目前的演示在处理复杂逻辑时仍存在不稳定性(内容可能随时间变得混乱),但其在以下领域展现了巨大潜力:
快速原型设计:瞬间可视化 UI 模型与创意。
动态交互界面:根据用户实时意图调整网页结构。
低延迟多模态任务:在需要极速反馈的场景中替代重型模型。
目前,Gemini3.1Flash-Lite 已正式上线 Google AI Studio 及 Vertex AI 平台,用户可前往体验这一极速生成的魅力。