吊打大模型?谷歌最强“轻量机”Gemini 3.1 曝光,实时渲染 UI 惊艳全场

AIBase
个人专栏
热度: 4703

Google DeepMind发布Gemini3.1Flash-Lite生成式AI模型,实现2.5倍首响提速与每秒超360 Token吞吐,在网页实时渲染、UI原型设计等动态交互场景取得突破,但输出成本升至每百万Token 1.50美元。

摘要由 Mars AI 生成
本摘要由 Mars AI 模型生成,其生成内容的准确性、完整性还处于迭代更新阶段。

Google DeepMind 今日展示了其在生成式 AI 速度领域的突破性成果:Gemini3.1Flash-Lite。该模型凭借极高的推理效率,能够实现几乎“实时”的网页渲染,将 AI 从简单的文本交互推向了动态 UI 构建的前沿。

性能飞跃与成本权衡

根据官方数据,Gemini3.1Flash-Lite 的首次响应速度较前代 Gemini2.5Flash 提升了 2.5倍。其吞吐量惊人,每秒可产出超过 360个 Token。在第三方机构 Artificial Analysis 的多模态任务测试中,该轻量化模型的表现甚至超越了如 Claude Opus4.6等体量更大的竞争对手。

QQ20260325-093300.jpg

然而,速度的提升也伴随着价格的调整。目前该模型的输出成本已从每百万 Token0.40美元上升至 1.50美元,反映了高性能低延迟技术背后的算力溢价。

QQ20260325-093308.jpg

“伪浏览器”演示与应用场景

谷歌同步推出了一个基于该模型的“伪浏览器”演示应用。用户只需输入描述性指令,系统便能在毫秒间直接生成并渲染出对应的网页内容。虽然目前的演示在处理复杂逻辑时仍存在不稳定性(内容可能随时间变得混乱),但其在以下领域展现了巨大潜力:

  • 快速原型设计:瞬间可视化 UI 模型与创意。

  • 动态交互界面:根据用户实时意图调整网页结构。

  • 低延迟多模态任务:在需要极速反馈的场景中替代重型模型。

目前,Gemini3.1Flash-Lite 已正式上线 Google AI StudioVertex AI 平台,用户可前往体验这一极速生成的魅力。

声明:本文为入驻“MarsBit 专栏”作者作品,不代表MarsBit官方立场。
转载请联系网页底部:内容合作栏目,邮件进行授权。授权后转载时请注明出处、作者和本文链接。未经许可擅自转载本站文章,将追究相关法律责任,侵权必究。
提示:投资有风险,入市须谨慎,本资讯不作为投资理财建议。
本内容旨在传递行业动态,不构成投资建议或承诺。