minimax

2026-06-10 minimax

MiniMax M3 的关键不是又一个 1M context，而是 MSA 试图从注意力结构上降低长上下文每 token 成本。

2026-06-10 minimax

M3 的真信号是 MSA 把 1M 上下文的每 token 算力压到上一代的 1/20、解码提速 15 倍——长上下文 agent 的成本曲线第一次被一家中国实验室往下按。但发布日权重并未开放，「过 10 天再开源」是诚意的试金石。

2026-06-10 minimax

M3 的难点不是模型卡片，而是 vLLM 等 serving 生态能否及时支持 MSA 的块级稀疏注意力。