扫描下载APP
其它方式登录
谷歌开源Gemma 4系列轻量级多模态AI模型,支持手机端本地运行,具备128K上下文和跨平台高性能推理能力,引发端侧AI应用热潮;但其在复杂Agent任务、工具调用和结构化输出方面存在局限,凸显端云协同演进趋势及对现有API/token商业模式的冲击。
Ollama发布0.19预览版,集成苹果MLX机器学习框架,显著提升Mac本地大模型推理性能:预填阶段提速1.6倍、生成阶段速度翻倍,M5芯片机型受益最明显;优化统一内存调度,支持长上下文流畅交互;首发适配阿里Qwen 3.5模型,推动本地AI向毫秒级响应演进。