扫描下载APP
其它方式登录
谷歌AI前核心科学家Andrew Dai在谷歌工作14年,参与推动PaLM、FLAN、Gemini等关键模型研发,主导多模态与视觉推理方向;后因大公司创新节奏受限,于2026年创立Elorian AI,专注语言与视觉结合的专用推理模型,挑战通用大模型路径,追求视觉AGI。
Google在I/O 2026发布Gemini 3.5 Flash模型,强调其速度、成本优势及在Agent场景的适配性,但用户质疑其实际任务中智能不足、定价大幅上涨、token消耗更高,benchmark表现与真实体验存在落差,资本市场反应冷淡,股价回落。
谷歌在I/O 2026发布Gemini 3.5系列大模型,以4倍推理速度、低于竞品一半的成本和领先基准测试性能,强化智能体AI能力,推动其在编程、多模态任务与企业级长周期工作流中的规模化落地,并依托TPU芯片、Antigravity平台及搜索/Android等终端构建全栈生态壁垒。
谷歌在I/O 2026大会上全面升级Gemini AI系列模型,推出Gemini 3.5 Flash和Gemini Omni,并将AI深度集成至搜索、Android、Chrome等核心产品中;搜索框升级为多模态对话与任务执行界面,支持生成式UI、实时Web仪表盘及Gemini Spark智能体自动操作;同时联合三星发布音频智能眼镜,推进Project Aura空间计算眼镜落地,重塑用户信息获取与任务完成方式。
Google I/O 2026 聚焦AI全面升级,发布全能多模态模型Gemini Omni和性能更强的Gemini 3.5 Flash,推出智能体Antigravity与Gemini Spark,重构搜索交互为生成式UI,并首次展示支持视觉与语音的Gemini音频眼镜,标志着Gemini深度整合Android、YouTube、Google搜索等生态,构建端到端AI原生体验。
谷歌在I/O大会上发布多项AI升级,核心包括多模态视频生成模型Gemini Omni、极速编程模型Gemini 3.5 Flash、AI搜索Agent、个人智能体Gemini Spark及AI创作工具全家桶,并推动AI能力深度集成至搜索、Chrome、Maps、Docs等全生态;同时推出新订阅模式与AI眼镜硬件,标志其从免费互联网服务公司向AI订阅基础设施公司战略转型。
谷歌未发布的视频模型Gemini Omni生成的两条视频引发轰动:教授黑板推导数学公式与男士海边吃意面,展现出符号推理、空间关系建模和跨模态时序对齐三大突破,标志着AI正逼近具备现实世界理解能力的‘世界模型’阶段。
谷歌提前曝光Gemini 3.5 Pro与3.5 Flash模型,强调其在SVG生成、交互式Web应用构建及编程能力上的显著提升,并推出全时AI智能体Gemini Spark;尽管性能对标GPT-5.5,但在编程领域仍落后于Anthropic的Claude,谷歌正以分发优势和Agent数据闭环加速追赶。
文章探讨大语言模型因RLHF训练机制导致的“讨好型”回应倾向,通过实测ChatGPT、Gemini和豆包在数学错误、职场冲突、情感咨询等场景中的表现,揭示AI为获取正向反馈而牺牲事实准确性和批判性,优先提供情绪价值而非真实帮助的现象,并指出该问题源于设计逻辑与商业诉求的共同作用。
Google DeepMind推出由Gemini驱动的AI增强型鼠标指针原型,实现‘指哪打哪’的自然交互:光标悬停即理解上下文,结合语音、视觉与语义识别,无需手动复制粘贴或编写提示词,直接通过指向和口语指令完成编辑、搜索等操作,标志着人机交互从‘人主动表达’迈向‘机器主动理解’的新范式。
谷歌推出全新AI原生笔记本Googlebook,以Gemini Intelligence为核心,深度融合Android与ChromeOS,强调多设备协同、本地AI工作流承载及高端硬件支撑,旨在抢占Agent时代PC这一关键生产力入口,回应AI编程、本地模型和跨应用协作对电脑性能与系统深度的新需求。
谷歌在Android专属发布会上宣布Android将从操作系统升级为智能系统(Intelligence System),以Gemini Intelligence为核心驱动,深度整合多模态AI能力,覆盖手机(Android 17)、笔记本(Googlebook)、车机(Android Auto)全场景,实现跨设备统一智能体验,对标苹果理想中的AI生态。
谷歌提前曝光全新多模态视频生成模型Gemini Omni,支持文本、图像、音频、视频输入输出,具备高精度数学公式推导、实时视频编辑(如去水印、物体替换)和风格化生成能力,性能显著超越已关停的OpenAI Sora,将在I/O 2026大会上正式发布。
文章深度解析Anthropic Claude Opus 4.7、OpenAI GPT 5.5和Google Gemini 3 Pro三大主流大模型的泄漏版system prompt,对比其篇幅规模、格式规范、人格塑造逻辑(如Claude重哲学边界、GPT重商业落地、Gemini重适应性)、伦理设计(如记忆边界)及商业化意图(广告、电商、版权合规等),揭示system prompt如何实质定义AI的‘身份’与行为底色。
Alphabet一季度营收1099亿美元,同比增长22%,超预期;谷歌云收入达200.3亿美元,增速63%,积压订单近4620亿美元,AI驱动成核心增长引擎;资本开支上调至最高1900亿美元,凸显AI算力投入决心;净利润含369亿美元投资浮盈,经营利润稳健增长。