30

04月

星期三

04月30日 18:44

DeepSeek发布Prover-V2模型，参数量达6710亿

火星财经消息，4 月 30 日，DeepSeek 今日于 AI 开源社区 Hugging Face 上发布了一个名为 DeepSeek-Prover-V2-671B 的新模型。据悉，DeepSeek-Prover-V2-671B 使用了更高效的 safetensors 文件格式，并支持多种计算精度，方便模型更快、更省资源地训练和部署，参数达 6710 亿，或为去年发布的 Prover-V1.5 数学模型升级版本。在模型架构上，该模型使用了 DeepSeek-V3 架构，采用 MoE（混合专家）模式，具有 61 层 Transformer 层，7168 维隐藏层。同时支持超长上下文，最大位置嵌入达 16.38 万，使其能处理复杂的数学证明，并且采用了 FP8 量化，可通过量化技术减小模型大小，提高推理效率。(金十)

免责声明：本文不构成投资建议，用户应考虑本文中的任何意见、观点或结论是否符合其特定状况，及遵守所在国家和地区的相关法律法规。

1分钟前

特朗普：马斯克帮了很大的忙，但受到不公平对待

19分钟前

分析：美国经济报告好坏参半或刺激美联储转鸽，利好比特币走势

43分钟前

Coinbase将上线Mantle（MANTLE）

46分钟前

Ethena Labs拟于5月1日发放第三季ENA奖励

49分钟前

Coinbase：已停止MPL交易并将支持SYRUP

55分钟前

某新建钱包1小时前从币安提取420枚BTC，价值3920万美元

1小时前

特朗普贸易顾问：媒体在制造关税恐惧，恐惧会随着协议达成而消失

1小时前

Moonshot上线Dog Stolen From Tesla (Lemon)

下载MarsBit APP

以行业热点、实时快讯、视频解读等维度提供全方位的区块链整合服务

24H热门新闻

暂无内容