2026-06-10

DeepSeek V4：开放权重与 API 同步，是一场分发策略战

DeepSeek V4 同时给出开放权重和当天可用 API，真正挑战闭源前沿模型的是部署自由与低迁移成本的组合。

frontier-models ai-infra inference long-context

DeepSeek V4：开放权重与 API 同步，是一场分发策略战 — 图 / Unsplash

概述

DeepSeek V4 Preview 的战略信号，在于它没有把开放权重和托管 API 放成二选一。官方同时写出「officially live & open-sourced」、给出 Hugging Face 技术报告和开放权重入口，并宣布 API 当天可用。这种组合会给闭源前沿模型制造更大的压力，因为它同时打中了两个痛点：想快的人可以直接接 API，想要控制的人可以拿权重自托管。

很多开放模型只解决其中一边：要么权重可下但服务化体验粗糙，要么 API 好用但权重不可得。DeepSeek 这次的判断价值，是把「部署自由」和「迁移摩擦低」放在同一个发布节奏里。对 builder 来说，这意味着采用路径可以先从 API 验证，随后按合规、成本或延迟需求迁到自托管，而不是从第一天就做重资产选择。

本文的立论是：DeepSeek V4 的开放权重/API 同步，是用价格与部署自由挑战闭源前沿模型。它不一定在每个任务上都压过闭源模型，但它让闭源 API 必须解释一个问题：为什么用户既要放弃权重控制，又要接受单一供应商边界。

发生了什么

DeepSeek 发布 V4 Preview 时，官方页面同时列出 DeepSeek-V4-Pro 与 DeepSeek-V4-Flash。Pro 是 1.6T total / 49B active params，Flash 是 284B total / 13B active params；这不是单纯的型号丰富，而是分发策略的骨架。Pro 负责前沿能力叙事，Flash 负责把高频请求的经济性拉下来，二者共同让 DeepSeek 的 API 和开放权重都有可用入口。

API 侧，DeepSeek 的迁移设计非常明确：保留 base_url，只需要把 model 更新到 deepseek-v4-pro 或 deepseek-v4-flash。官方还写明支持 OpenAI ChatCompletions 和 Anthropic APIs，并且两个模型都支持 1M context 和 Thinking / Non-Thinking 双模式。这个兼容层是战略动作，因为它直接降低了从其他生态迁移或做多供应商路由的成本。

同时，DeepSeek 给旧模型设置退役计划：deepseek-chat 与 deepseek-reasoner 会在 2026 年 7 月 24 日 15:59（UTC）之后完全不可访问，当前分别路由到 V4-Flash 的 non-thinking / thinking 模式。这个安排说明 DeepSeek 不打算让 V4 只是新选项，而是要把它变成默认分发层。对开发者而言，旧接口的继续存在只是迁移缓冲，不是长期承诺。

为何重要

开放权重与 API 同步，会改变买方谈判位置。只用闭源 API 时，企业的选择往往局限在价格、速率限制和数据边界之内；有开放权重后，用户多了一个可信威胁：如果托管服务不合适，可以把同一模型或同系列能力带到自己的部署环境。这个威胁未必每天使用，但它会影响采购、合规和长期架构判断。

兼容 OpenAI ChatCompletions 和 Anthropic APIs 的意义也不只是开发者友好。它让 DeepSeek 更容易进入现有 agent 框架、评测流水线和企业网关。闭源模型的护城河常常来自生态默认值，而兼容层就是在削弱默认值带来的黏性。判断很明确：DeepSeek 不只是在发布模型，也是在降低更换模型的心理成本和工程成本。

Pro/Flash 的双线则让开放权重策略更完整。最大模型给研究者和高端 builder 一个能力上限，Flash 给产品团队一个日常经济入口。只有 Pro 会显得昂贵，只有 Flash 会显得不够前沿；两者并列，才构成能够挑战闭源 API 的产品面。

对建设者的影响

如果你已经有多模型网关，DeepSeek V4 应该被当成一个同时测试「托管」和「可迁移」的供应商。先用 API 跑真实业务样本，观察 Thinking / Non-Thinking 的路由边界；再用开放权重评估自托管可行性。这个顺序务实，因为它把产品价值验证放在前面，把部署优化放在后面，避免为尚未证明的模型过早改造基础设施。

如果你处在受监管行业，V4 的开放权重会让合规讨论更具体。闭源模型通常只能给出数据处理承诺，开放权重至少让本地部署成为选项。这里不能夸大：自托管仍然需要硬件、推理工程和安全治理；但选项本身会改变架构谈判，不再只能在「不用」和「把数据发给 API」之间选择。

如果你做 agent 产品，OpenAI/Anthropic API 兼容值得单独重视。它意味着你可以用较少改动把 V4 纳入已有工具调用、上下文管理和评测框架。真正的建设者红利不是少写几行适配代码，而是可以更快做 A/B、fallback 和成本路由，让模型替换从项目变成配置。

该忽略什么

第一，忽略「开放权重就天然更便宜」的粗糙结论。权重可得只提供部署自由，真正成本还取决于硬件、吞吐、利用率和推理工程。没有规模和工程能力的小团队，短期内直接用 API 可能更理性。

第二，忽略「API 兼容就完全无迁移成本」的乐观说法。接口兼容能降低接入成本，但不同模型的工具调用稳定性、长上下文表现、thinking 模式边界和安全行为仍要重新评测。把兼容当作免测通行证，是最容易把线上质量交给运气的做法。

第三，忽略把 V4 只看成能力榜单事件的报道。DeepSeek 这次更重要的是分发组合：开放权重、托管 API、双模型层级、双模式和旧模型退役。这些动作共同指向一个判断：它要争夺的是默认模型位置，而不只是某个 benchmark 的单点胜利。

来源

DeepSeek V4 Preview Release / official
DeepSeek-V4-Pro on Hugging Face / official