DeepSeek V4:开放权重与 API 同步,是一场分发策略战

DeepSeek V4 同时给出开放权重和当天可用 API,真正挑战闭源前沿模型的是部署自由与低迁移成本的组合。

DeepSeek V4:开放权重与 API 同步,是一场分发策略战
图 / Unsplash

概述

DeepSeek V4 Preview 的战略信号,在于它没有把开放权重和托管 API 放成二选一。官方同时写出「officially live & open-sourced」、给出 Hugging Face 技术报告和开放权重入口,并宣布 API 当天可用。这种组合会给闭源前沿模型制造更大的压力,因为它同时打中了两个痛点:想快的人可以直接接 API,想要控制的人可以拿权重自托管。

很多开放模型只解决其中一边:要么权重可下但服务化体验粗糙,要么 API 好用但权重不可得。DeepSeek 这次的判断价值,是把「部署自由」和「迁移摩擦低」放在同一个发布节奏里。对 builder 来说,这意味着采用路径可以先从 API 验证,随后按合规、成本或延迟需求迁到自托管,而不是从第一天就做重资产选择。

本文的立论是:DeepSeek V4 的开放权重/API 同步,是用价格与部署自由挑战闭源前沿模型。它不一定在每个任务上都压过闭源模型,但它让闭源 API 必须解释一个问题:为什么用户既要放弃权重控制,又要接受单一供应商边界。

发生了什么

DeepSeek 发布 V4 Preview 时,官方页面同时列出 DeepSeek-V4-Pro 与 DeepSeek-V4-Flash。Pro 是 1.6T total / 49B active params,Flash 是 284B total / 13B active params;这不是单纯的型号丰富,而是分发策略的骨架。Pro 负责前沿能力叙事,Flash 负责把高频请求的经济性拉下来,二者共同让 DeepSeek 的 API 和开放权重都有可用入口。

API 侧,DeepSeek 的迁移设计非常明确:保留 base_url,只需要把 model 更新到 deepseek-v4-pro 或 deepseek-v4-flash。官方还写明支持 OpenAI ChatCompletions 和 Anthropic APIs,并且两个模型都支持 1M context 和 Thinking / Non-Thinking 双模式。这个兼容层是战略动作,因为它直接降低了从其他生态迁移或做多供应商路由的成本。

同时,DeepSeek 给旧模型设置退役计划:deepseek-chat 与 deepseek-reasoner 会在 2026 年 7 月 24 日 15:59(UTC)之后完全不可访问,当前分别路由到 V4-Flash 的 non-thinking / thinking 模式。这个安排说明 DeepSeek 不打算让 V4 只是新选项,而是要把它变成默认分发层。对开发者而言,旧接口的继续存在只是迁移缓冲,不是长期承诺。

为何重要

开放权重与 API 同步,会改变买方谈判位置。只用闭源 API 时,企业的选择往往局限在价格、速率限制和数据边界之内;有开放权重后,用户多了一个可信威胁:如果托管服务不合适,可以把同一模型或同系列能力带到自己的部署环境。这个威胁未必每天使用,但它会影响采购、合规和长期架构判断。

兼容 OpenAI ChatCompletions 和 Anthropic APIs 的意义也不只是开发者友好。它让 DeepSeek 更容易进入现有 agent 框架、评测流水线和企业网关。闭源模型的护城河常常来自生态默认值,而兼容层就是在削弱默认值带来的黏性。判断很明确:DeepSeek 不只是在发布模型,也是在降低更换模型的心理成本和工程成本。

Pro/Flash 的双线则让开放权重策略更完整。最大模型给研究者和高端 builder 一个能力上限,Flash 给产品团队一个日常经济入口。只有 Pro 会显得昂贵,只有 Flash 会显得不够前沿;两者并列,才构成能够挑战闭源 API 的产品面。

对建设者的影响

如果你已经有多模型网关,DeepSeek V4 应该被当成一个同时测试「托管」和「可迁移」的供应商。先用 API 跑真实业务样本,观察 Thinking / Non-Thinking 的路由边界;再用开放权重评估自托管可行性。这个顺序务实,因为它把产品价值验证放在前面,把部署优化放在后面,避免为尚未证明的模型过早改造基础设施。

如果你处在受监管行业,V4 的开放权重会让合规讨论更具体。闭源模型通常只能给出数据处理承诺,开放权重至少让本地部署成为选项。这里不能夸大:自托管仍然需要硬件、推理工程和安全治理;但选项本身会改变架构谈判,不再只能在「不用」和「把数据发给 API」之间选择。

如果你做 agent 产品,OpenAI/Anthropic API 兼容值得单独重视。它意味着你可以用较少改动把 V4 纳入已有工具调用、上下文管理和评测框架。真正的建设者红利不是少写几行适配代码,而是可以更快做 A/B、fallback 和成本路由,让模型替换从项目变成配置。

该忽略什么

第一,忽略「开放权重就天然更便宜」的粗糙结论。权重可得只提供部署自由,真正成本还取决于硬件、吞吐、利用率和推理工程。没有规模和工程能力的小团队,短期内直接用 API 可能更理性。

第二,忽略「API 兼容就完全无迁移成本」的乐观说法。接口兼容能降低接入成本,但不同模型的工具调用稳定性、长上下文表现、thinking 模式边界和安全行为仍要重新评测。把兼容当作免测通行证,是最容易把线上质量交给运气的做法。

第三,忽略把 V4 只看成能力榜单事件的报道。DeepSeek 这次更重要的是分发组合:开放权重、托管 API、双模型层级、双模式和旧模型退役。这些动作共同指向一个判断:它要争夺的是默认模型位置,而不只是某个 benchmark 的单点胜利。

来源

  1. DeepSeek V4 Preview Release / official
  2. DeepSeek-V4-Pro on Hugging Face / official