MoE_MoE相关新闻_MoE动态_火星财经

Cohere,Command A+,MoE

20岁写出Transformer的人，真开源了2180亿大模型

Cohere发布首个Apache 2.0完全开源的2180亿参数大模型Command A+，采用MoE架构与W4A4量化技术，实现单卡（B200）部署、低延迟高吞吐，并原生支持可追溯引用、多模态输入及智能体工具调用，标志着企业级AI模型真正走向开放、可控、高效商用。

新智元6小时前

DeepSeek V4,MoE架构,华为昇腾

别急着All-in DeepSeek V4，先看看这10位从业者的真心话

DeepSeek V4通过混合专家架构、混合注意力机制等工程创新，在百万Token长上下文推理中实现算力降至V3.2的27%、KV缓存压缩至10%，以极低成本达成接近顶级闭源模型的代码与智能体能力，但存在事实性知识弱、幻觉率高等落地短板，需依赖Harness框架补足；其开源性、国产算力全栈适配（如昇腾910B/950）及结构性降本正加速AI应用层从‘卷模型’转向‘卷系统’与垂直闭环。

阿菜cabbage04月30日 01:16

DeepSeek-V4,华为昇腾,MoE

梁文锋的担子更重了

DeepSeek发布万亿参数级大模型V4-Pro，实现国产昇腾与英伟达双平台适配，首创CSA+HCA混合注意力架构，显著降低推理开销；同步启动API价格战，但面临核心人才流失、代码能力待验证、商业化爬坡及国产算力生态攻坚等多重挑战。

中国企业家杂志04月29日 16:29

DeepSeek,V4,MoE

DeepSeek更新“前夜”，有些问题得提前理一理

DeepSeek V4大模型计划于4月下旬发布，聚焦万亿参数MoE架构、原生多模态能力与国产芯片适配，旨在回应算力封锁下的持续进化与商业化落地挑战；其战略意义在于从技术突破转向产品化和自主可控工程实践，标志着公司从‘纯推理’走向企业级AI价值实现的关键分水岭。

凤凰网科技04月10日 20:02

Gemma 4,Google DeepMind,MoE

谷歌开源大模型 Gemma 4 官宣在即：参数量翻 4 倍

谷歌DeepMind即将发布开源大模型Gemma 4，参数达120B并采用MoE架构，兼顾性能与本地运行能力，旨在应对中国公司在开源大模型领域的主导地位，通过时间差策略和端侧优化参与全球AI生态竞争。

AIBase04月02日 14:44

iPhone17Pro,Flash-MoE,MoE

4000 亿参数“生啃”成功！iPhone 17 Pro 挑战本地运行超大模型，但速度只有 0.6 token

iPhone17Pro在仅12GB内存下成功本地运行4000亿参数大模型，依赖Flash-MoE流式加载与MoE稀疏激活技术，但生成速度仅0.6Token/秒、功耗高、发热大；此举验证了终端设备本地大模型的可行性，凸显隐私保护与离线AI潜力。

AIBase03月24日 11:43

Mistral AI,Mistral Small4,MoE

欧洲 AI 霸主祭出“全能王”！Mistral Small 4 发布：推理、多模态、编程我全都要

Mistral AI发布全新开源大模型Mistral Small4，采用MoE架构，参数量119B（激活仅6B），支持256k上下文、多模态理解与编程能力，性能媲美GPT-OSS120B，以Apache2.0协议开源，显著提升推理效率与吞吐量。

AIBase03月20日 15:35

MiniMax,闫俊杰,MoE

MiniMax：一个河南县城青年和他的3000亿

文章讲述MiniMax创始人闫俊杰从百度实习生起步，于2021年提前布局大模型赛道，带领公司以极低投入（5亿美元）实现全模态AI突破，推出M2.5等高效模型，达成2.36亿用户、73%海外收入及B端高毛利增长；其技术路径聚焦MoE架构与极致工程效率，回应芯片封锁下的中国AI自主进化逻辑。

动察 Beating03月18日 11:07

DeepSeek,MoE,Cerebras

AI的下一场地震：为什么真正的危险不是SaaS杀手，而是算力革命？

文章指出AI算力根基正经历一场‘寂静革命’，由算法瘦身（如DeepSeek的MoE架构）和硬件换道（如Cerebras、Groq的专用推理芯片）两条路径交汇驱动，大幅降低AI训练与推理成本，动摇英伟达GPU的垄断地位，预示其高估值逻辑面临根本性挑战。

Bing Ventures02月12日 12:37

DeepSeek,MoE,Cerebras

AI 的下一场地震：为什么真正的危险不是 SaaS 杀手，而是算力革命？

文章指出AI算力根基正经历算法瘦身（如DeepSeek的MoE架构）与硬件换道（如Cerebras、Groq专用推理芯片）双重革命，导致AI训练与推理成本大幅下降，动摇英伟达GPU的垄断地位和高估值逻辑，预示AI算力供应范式发生根本性转移。

深潮TechFlow02月11日 09:56

暂无内容

推荐专题

DeFi：去中心化金融机制与演化2024-12-16 13:16

AI × Crypto：应用与市场进展2023-11-29 11:36

RWA：现实资产上链进程2024-12-16 13:40

DeSci：去中心化科研的探索与实践2024-11-18 10:58

空投策略：链上机会追踪2024-09-02 14:06

热门新闻

Gemini,Google I/O,Android XR

谷歌用 AI“杀死”谷歌，这场发布会看得人缺氧爱范儿

Gemini,Android,Google搜索

Google I/O全盘点：两大新模型上线，音频眼镜登台，Gemini接管一切雷科技

罗永浩,锤子科技,Mixin

曾在比特币上赚了 30 倍的罗永浩，与币圈的纠葛往事Yuliya

比特币,衍生品市场,Binance

链上数据拆解：BTC 从 8 万下跌，未平仓合约创年内新高，三组指标解读当前市场结构深潮TechFlow

以太坊基金会,Protocol Cluster,Mandate

以太坊基金会核心成员集体出走，「去中心化」还是「散伙」？深潮TechFlow

以太坊,形式化验证,ZK-EVM

Vitalik：以太坊下一阶段的关键是什么？深潮TechFlow