ChatGPT 的 Dreaming:把上下文工程搬进产品默认层

OpenAI 的 Dreaming 记忆机制在后台自动整理、更新、保鲜上下文,这把记忆工程从开发者手里移到了产品默认层。

ChatGPT 的 Dreaming:把上下文工程搬进产品默认层
图 / Unsplash

概述

OpenAI 6 月 4 日推出的 Dreaming,真正的看点不是“ChatGPT 更懂你了”,而是它把一件原本属于开发者的工作——上下文工程——挪进了消费级产品的默认层。Dreaming 是一个在后台运行的记忆整理机制:它不再只在你明说“记住我七月去新加坡”时写一条笔记,而是持续从大量对话里提炼、合并、更新你的偏好、项目和约束,让上下文随时间自动保鲜。

这件事值得盯着看,是因为记忆和长期上下文恰恰是 Agent 走向实用的关键瓶颈。模型够聪明早已不是问题,问题是它每次开口都像第一次认识你。Dreaming 给出的答案是:把上下文的维护交给一个用户既看不见、也基本不用操心的后台过程。这对终端体验是减负,对“记忆该由谁来工程化”这个问题却是一次默默的归属转移。

对建设者来说,结论有两面。一面是平台正在把“跨会话记住用户”做成开箱即用的能力,套壳产品里那套手工拼接上下文的活儿会迅速贬值;另一面是后台自动整理记忆,把准确性、时效性和隐私可控性这几个老问题,从开发者的工程边界推到了产品默认行为里——它们没消失,只是换了个地方继续存在。

发生了什么

OpenAI 把 ChatGPT 的记忆描述成一条清晰的演进线。2024 年 4 月首次上线的是 saved memories:它只在对话进行中写入,且依赖很强的指令信号才会触发,比如你得明说“记住”。官方自己的比喻是,这像在跟一个“记了几笔笔记、但凡没写下来的就全忘了”的人打交道,而且这些笔记会随时间变陈旧、最终失准。

2025 年 4 月,OpenAI 让模型能够引用 saved memories 列表之外的聊天上下文,并第一次引入了 Dreaming——一个在后台自动整理记忆、从历史对话里学习的过程。它不依赖你显式说“记住”,能把对话里自然出现的上下文也纳进来。但官方明确承认,那一版 Dreaming 始终只是 saved memories 的补充,单独撑不起一套记忆系统。这次发布的是建立在 Dreaming 之上、官方称为 V3 的新架构,比此前“更强、也更省算力”。

机制上有三个被反复强调的目标。其一是把有用上下文带下去:你说过一次相机配置,之后问“适配我这套摄影器材的产品”,它能直接给出匹配建议,而不是让你从头交代。其二是遵循偏好和约束:你说过“我吃素”,往后的餐饮建议就该一直守着这条。其三是随时间保鲜,这点最具体——当你说“七月去新加坡”,行程结束后 Dreaming 会把这条记忆自动改写成“2026 年七月去过新加坡”,于是回到家后,它推荐的是你常住地、你所在时区的选项,而不是还以为你在新加坡找宵夜。

可控性方面,Dreaming 整理出的记忆会汇总到一个 memory summary 页面:你能在那里快速看到 ChatGPT 对你的认知概要,自行增改信息,还能指示它该在什么时候提起哪些话题。算力上,OpenAI 称把服务 Free 用户所需的计算量降到了约原来的五分之一。落地节奏是:美国的 Plus 和 Pro 用户当天可用,Free、Go 用户和更多国家在接下来几周陆续开放。

为何重要

这次发布真正的信号,是上下文工程的归属正在转移。过去两年里,“怎么让模型跨会话记住用户”几乎是每个做个性化产品的团队都要自己解决的工程题:你得设计存什么、何时写、怎么检索、如何随时间衰减或更新。Dreaming 把这套逻辑收进了 ChatGPT 的默认行为,用户不必管,开发者在 ChatGPT 这一层也插不上手。它不再是一个你需要构建的功能,而是一个你默认就会得到的环境。

这层转移有具体的产品后果。它意味着记忆的质量曲线,从“各家产品自己拼”变成“平台统一拉一条基线”。OpenAI 给出的演进对照——2024 saved memories、2025 saved memories 加 Dreaming V0、2026 Dreaming V3——本质上是在说:记住你这件事,正从一个差异化卖点退化成一项基础设施。对依赖“我们能记住你”作为护城河的产品,这是个坏消息;对希望站在好记忆之上做更上层价值的产品,这是地基被人垫高了。

更要紧的是,Dreaming 把记忆系统里最难的部分——时效性——做成了主动行为。saved memories 的老毛病是只增不汰,旧上下文堆着不动,慢慢从有用变成误导。Dreaming 让记忆随时间被改写,这在工程上是一个明确的进步:它把“记住”和“知道何时该忘、何时该更新”区分了开。这一步也悄悄改变了护城河的形状——当“记得准、记得新”成了平台兜底的基线,差异化就只能往“你能多大程度看清、约束、审计这套记忆”那一侧走。

技术要点

技术上最该记住的一点:Dreaming 是把记忆从“写入时整理”改成了“后台异步整理”。saved memories 是同步的、由显式信号触发的、且基本不动的;Dreaming 是一个跨大量对话持续运行的合成过程,目标是始终给出最新鲜、最相关的上下文。这两种范式的差别,跟缓存里“写时计算”和“后台批量重算”的差别是同构的——后者更可扩展,但也更难让人在任一时刻精确说清状态。

OpenAI 把约五倍的算力下降单独拎出来讲,这不是细枝末节。一套要服务数亿用户、跨多年时间跨度的记忆系统,成本就是它能不能成为默认能力的前提。Dreaming 能下放到 Free 用户,靠的正是这次算力效率的改进——这也提醒做记忆产品的人,记忆的真正约束往往不在“记得准不准”,而在“按这个体量持续整理记得起不起”。

还有一个值得建设者拆开看的设计选择:记忆的可见面只是一个摘要页,底层那一条条原始记录并不直接暴露。OpenAI 给的可控性,是让你在概要层看见、增改、并指示“何时提起什么”,想深入某块就直接和模型聊。这是个务实的折中——把后台合成出的复杂记忆状态,压缩成人能扫一眼的摘要。这就把记忆切成了两层:一层是后台持续合成、改写的状态,一层是给人看和操作的摘要。两层不重合,正是后面所有可控性与隐私问题的技术根源。

对建设者的影响

如果你在做记忆或个性化产品,这次发布应该改变你的判断坐标。把“能跨会话记住用户”当作核心差异化,正在失去意义——平台会把这条基线一路抬高,而且免费用户也吃得到。值得守的位置往上挪了:你能不能在好记忆之上,提供领域深度、可控性,或是 ChatGPT 默认行为给不了的明确边界。

更具体地说,机会落在 Dreaming 有意不碰的地方。一个自动、对用户基本透明的后台记忆,天然不适合需要严格审计、显式同意、按用途隔离的场景——合规、医疗、财务、企业知识管理都属此类。在这些场景里,“它在后台默默改写了你的画像”会被直接读成风险。做这类产品的团队,差异化的位置应当从“我们也能记住你”,移到“我们能让你精确看见、约束、并审计记住了什么”。

工程上有一条可直接拿走的原则:把记忆的存储和呈现分开设计。Dreaming 教给行业的,是记忆天然有两层——一层是后台合成出的状态,一层是人能看见和操作的摘要。很多记忆产品翻车,是因为把这两层混成一团:用户以为删掉一条就删干净了,底层却还留着影响。无论你做的是消费级还是企业级,让这两层各自清晰、并让人能在呈现层真正改动底层,是值得从第一天就立的规矩。

竞争上,要清醒看待这步的方向:OpenAI 正在把记忆变成平台级基础设施,而不是一个功能。这跟它此前把 Codex 往工作台推、把个人财务做成上下文层是同一套打法——尽量多地把横向能力内置进默认体验。薄封装的“带记忆的聊天”产品会被直接吞掉;活下来的,要么扎进平台默认行为够不着的垂直纵深,要么把可控性本身做成卖点。

该忽略什么

第一个该丢掉的读法,是把 Dreaming 等同于“ChatGPT 更懂你、更智能了”。记忆不是智能。一个能记住你吃素、住在旧金山附近、相机是哪套的系统,是在维护上下文,不是在变聪明。把记忆当智能,会让人高估这步的认知含量,也会让人低估真正变了的那件事——上下文维护的归属,从用户和开发者手里,挪进了平台后台。

第二个要警惕的,是“你始终掌控自己的数据”这类话被当成隐私问题已经解决。一个会在后台自动合成、并随时间自动改写你画像的系统,跟一份你亲手记、想删就删的笔记,在可控性上完全是两回事。这恰恰是官方话术与社区直觉之间的张力所在:发布当天的 HN 讨论(item 48400616,热度不高,只是个早期信号)里,被反复追问的都是些朴素问题:它到底从我的历史对话里合成出了什么、我怎么把这套被自动改写过的画像完整导出、删一条到底是删了呈现还是连底层一起抹掉。换句话说,社区盯的正是“后台自动改写”和“你始终掌控数据”之间那道缝:摘要页给了一个入口,但入口不等于完全的掌控。这里的取舍是真实的——自动化越多,体验越省心,你对状态的精确把握就越弱。别把便利误读成可控。

最后,别被那条约五倍算力下降读成纯粹的工程胜利而忽略它的方向性。算力效率提升,真实意图是让 Dreaming 下放给所有用户、成为默认。把它当一次孤立的优化会看漏方向:这其实是把一套会持续记住你的机制铺向更广人群的前提。该问的不是“它做得多省”,而是“当记住你成为默认、且大多数人不会去翻那个摘要页,这意味着什么”。

来源

  1. Dreaming: Better memory for a more helpful ChatGPT / official
  2. Dreaming: Better memory for a more helpful ChatGPT on Hacker News / hn