AI 与科研

2026-06-11 google-deepmind

Genie 接上 Street View:世界模型的护城河从「逼真画面」挪到「可导航的真实地理」

DeepMind 把 Google 街景灌进 Project Genie，赌的不是更漂亮的画面，而是机器人和自动驾驶的合成数据飞轮。但这次放出的是消费级 demo，不是仿真管线。

world-models robotics research

阅读全文

2026-06-11 google-deepmind

DeepMind 下场投多 agent 安全:单体对齐管不住的那块,正式被承认了

DeepMind 联合四家机构发起最高 1000 万美元的多 agent 安全研究资助。真问题不在单个模型对不对齐,而在一群各自对齐良好的 agent 凑到一起时涌现的协同失效。

ai-safety multi-agent research

阅读全文

2026-06-11 theory

Transformer 天生简洁:一个表达力理论结果能说明什么、不能说明什么

新论文证明 transformer 表示某些语言时比时序逻辑、循环网络指数级简洁,比有限自动机双指数级简洁。这是一个关于规模的解释,不是一份工程指南。

theory transformers research

阅读全文

2026-06-10 huggingface

OpenEnv 的治理转向比代码更值得看

OpenEnv 从单项目走向技术委员会协调，说明开源 agent 训练需要可信治理，而不只是一个接口实现。

research agents

阅读全文

2026-06-10 huggingface

OpenEnv 的价值在标准化 agentic RL 环境接口

Hugging Face 推动 OpenEnv 成为协议层，真正解决的是开源 agentic RL 训练环境碎片化，而不是再造一个奖励框架。

research agents

阅读全文

2026-06-10 openai

OpenAI 专项模型越多，治理问题越靠前

GPT Image 2、GPT Realtime 和 GPT-Rosalind 说明，专项模型真正的难题会从能力转向权限、责任、数据边界和评估。

design voice-ai research

阅读全文

2026-06-10 openai

OpenAI 的专项模型正在把能力拆成产品表面

GPT Image 2、GPT Realtime 和 GPT-Rosalind 的共同信号，是 OpenAI 正把一个旗舰模型叙事拆成多个可采购、可治理、可嵌入的专业产品表面。

design voice-ai research

阅读全文

2026-06-09 google

Co-Scientist 把衰老研究的瓶颈往前推了一步

DeepMind 的 Co-Scientist 帮 Abudayyeh–Gootenberg 实验室筛出 20 多个逆转细胞衰老的候选基因，几天就读完别人半年的数据——但被验证的只有两条线索，AI 加速的是假设和解读，不是疗效。

life-sciences research

阅读全文

2026-06-09 huggingface

OpenEnv：开源社区在抢一块闭源实验室不会让出的地基

Hugging Face 联合 PyTorch、Prime Intellect、Unsloth 等把 OpenEnv 交给委员会治理，并把它收窄成 RL 环境的协议层。真信号藏在治理与定位这两步里：开源训练 agent 时环境碎片化这块真痛点，终于有了统一插口。

agents research

阅读全文

2026-06-03 openai

GPT-Rosalind 让 AI 去审一份 FDA 都吵翻的证据

OpenAI 用 LifeSciBench 把科学 AI 的评估锚到工作流，又挑了一个酷似 Elevidys 的 FDA 替代终点难题做样例——这暴露了领域模型真正的考题：在专家都分裂的地方，敢不敢说证据不够。

research agents life-sciences

阅读全文