扫描下载APP
其它方式登录
DeepSeek发布V4大模型,首次深度适配华为昇腾950芯片,实现推理端国产算力替代,打破对英伟达CUDA生态的依赖;模型在知识、数学、代码及Agent能力上达国际先进水平,支持百万token上下文,但训练环节仍可能依赖英伟达芯片,全链路国产化尚未完成。
DeepSeek V4通过CSA+HCA混合注意力、MoE稀疏激活、KV Cache压缩及国产芯片深度适配等技术创新,首次实现万亿参数级大模型在华为昇腾950、寒武纪等国产算力上的高效稳定推理,显著降低1M上下文场景下的调用成本,推动AI模型从依赖英伟达CUDA生态转向国产化落地路径。
DeepSeek发布V4系列大模型,以1.6万亿参数、百万token上下文和MoE架构实现高性能与低成本平衡;其降价逻辑首次明确绑定国产昇腾950算力规模化部署,标志中国大模型竞争从算法比拼转向模型-芯片-工程-商业闭环能力竞争,并开启外部融资以应对算力投入、人才流失和商业化压力。