12

06月

星期五

06月12日 23:11

MiniMax M3正式开源，原生多模态支持百万上下文

据动察 Beating 监测，国产大模型厂商 MiniMax 在 Hugging Face 正式开源原生多模态混合专家（MoE）模型 MiniMax M3 权重。MiniMax M3 总参数量为 4280 亿，单 Token 激活 230 亿参数，原生支持 100 万超长上下文。为降低部署显存开销，开发团队同步发布了 MXFP8 量化版本，并适配 SGLang、vLLM、Transformers 等主流推理框架。在多模态设计上，MiniMax M3 在预训练阶段即开展文本、图像与视频联合训练以实现原生语义融合，而非在后训练阶段进行多模态对齐。在运行机制上，模型提供双推理模式，分为用于复杂逻辑和工具编排的 Thinking（思考）模式，以及用于低延迟对话和代码生成的 Non-thinking（非思考）模式。支撑百万超长上下文的底层内核，是同步开源的轻量化注意力内核库 MiniMax Sparse Attention（简称 MSA）。官方公布的数据显示，MSA 采用分组查询注意力（GQA）分块检索机制，在 100 万 Token 的极长上下文实测中，针对 NVIDIA Blackwell（SM100）架构优化的 MSA 算子相比传统全注意力机制，可实现 9 倍以上的预填充加速和 15 倍的解码提速，同时显著降低了推理开销。
「查看原文」

本内容旨在传递行业动态，不构成投资建议或承诺。

42分钟前

币安钱包：SPCXx IPO 活动取消，将向用户补偿 100 万美元等值代币 SPCXB

45分钟前

币安合约将转换 SPCXUSDT Pre-IPO 永续合约为标准 U 本位 TradFi 永续合约

47分钟前

SpaceX股价涨至160美元，日内涨约18%

48分钟前

津巴布韦要求加密业务注册纳入监管，年费 500 美元

50分钟前

马斯克成为全球首位万亿富翁

51分钟前

SpaceX(SPCX.O)美股 IPO 首日开盘报 150 美元，其 IPO 发行价为每股 135 美元

57分钟前

CNBC：SpaceX将在5分钟后开始交易

1小时前

欧洲央行管委：欧洲央行必须进一步提高利率以应对通胀

下载火星财经 APP

以行业热点、实时快讯、视频解读等维度提供全方位的AI和Web3整合服务

24H热门新闻

暂无内容