Genie 接上 Street View:世界模型的护城河从「逼真画面」挪到「可导航的真实地理」
DeepMind 把 Google 街景灌进 Project Genie,赌的不是更漂亮的画面,而是机器人和自动驾驶的合成数据飞轮。但这次放出的是消费级 demo,不是仿真管线。
阅读全文AI 在科研里没有消除瓶颈——它只是把瓶颈挪了位置,并把这个领域尚未谈拢的争议摆上了台面。Co-Scientist、GPT-Rosalind、以及开放环境之争,说的是同一件事:难点从「生成假设」转移到了「评估证据」,以及「谁有资格造这些工具」。
DeepMind 把 Google 街景灌进 Project Genie,赌的不是更漂亮的画面,而是机器人和自动驾驶的合成数据飞轮。但这次放出的是消费级 demo,不是仿真管线。
阅读全文DeepMind 联合四家机构发起最高 1000 万美元的多 agent 安全研究资助。真问题不在单个模型对不对齐,而在一群各自对齐良好的 agent 凑到一起时涌现的协同失效。
阅读全文新论文证明 transformer 表示某些语言时比时序逻辑、循环网络指数级简洁,比有限自动机双指数级简洁。这是一个关于规模的解释,不是一份工程指南。
阅读全文OpenEnv 从单项目走向技术委员会协调,说明开源 agent 训练需要可信治理,而不只是一个接口实现。
阅读全文Hugging Face 推动 OpenEnv 成为协议层,真正解决的是开源 agentic RL 训练环境碎片化,而不是再造一个奖励框架。
阅读全文GPT Image 2、GPT Realtime 和 GPT-Rosalind 说明,专项模型真正的难题会从能力转向权限、责任、数据边界和评估。
阅读全文GPT Image 2、GPT Realtime 和 GPT-Rosalind 的共同信号,是 OpenAI 正把一个旗舰模型叙事拆成多个可采购、可治理、可嵌入的专业产品表面。
阅读全文DeepMind 的 Co-Scientist 帮 Abudayyeh–Gootenberg 实验室筛出 20 多个逆转细胞衰老的候选基因,几天就读完别人半年的数据——但被验证的只有两条线索,AI 加速的是假设和解读,不是疗效。
阅读全文Hugging Face 联合 PyTorch、Prime Intellect、Unsloth 等把 OpenEnv 交给委员会治理,并把它收窄成 RL 环境的协议层。真信号藏在治理与定位这两步里:开源训练 agent 时环境碎片化这块真痛点,终于有了统一插口。
阅读全文OpenAI 用 LifeSciBench 把科学 AI 的评估锚到工作流,又挑了一个酷似 Elevidys 的 FDA 替代终点难题做样例——这暴露了领域模型真正的考题:在专家都分裂的地方,敢不敢说证据不够。
阅读全文