DiffusionGemma:扩散式文本生成第一次进了主流开源生态
Google 开源了首个主流文本扩散模型。真正的卖点不是「快」,而是它把本地解码的瓶颈从显存带宽挪到算力,用双向注意力并行生成 256 个 token。代价是质量、实验性和那个 26B MoE 的取舍。
阅读全文Google 的前沿故事是分发与触达:Gemini 搭上十亿美元的苹果协议、Antigravity 靠渠道而非应用质量取胜、Omni 作为一个入口——同时还有 Co-Scientist 这样扎实的研究深度。反复出现的信号是:Google 赢在「模型出现在哪」,而不只是「模型有多好」。
Google 开源了首个主流文本扩散模型。真正的卖点不是「快」,而是它把本地解码的瓶颈从显存带宽挪到算力,用双向注意力并行生成 256 个 token。代价是质量、实验性和那个 26B MoE 的取舍。
阅读全文Google DeepMind 发布流式语音到语音翻译,70+ 语言、保留语调语速音高,关键不在演示而在它进了 Gemini Live API。
阅读全文Gemma 4 12B 把视觉和音频直接喂进语言模型主干,放弃了独立编码器。这是一个架构赌注,而不只是又一个端侧模型。
阅读全文Google 给 Gemma 4 放出量化感知训练(QAT)的权重,把 E2B 的内存占用压到 1GB,能在手机和消费级显卡上跑。真正的转折不是「能跑了」,而是它把矛盾从「装不装得下」推到了功耗、隐私边界和质量损失到底有多大。
阅读全文Gemini 在 Apple 生态里的价值不只是给 Siri 供能,而是进入系统级开发者入口;Google 得到的是隐藏但高杠杆的分发。
阅读全文Apple 与 Google 的合作重点不只是 Siri 变强,而是外部模型如何在 Private Cloud Compute 里被去品牌化、被 Apple 叙事吸收。
阅读全文一家德国地方法院认定,Google 的 AI 概览不是搜索结果,而是 Google 自己的言论——因此要对其中的虚假指控直接负责。这推翻了搜索引擎运营方惯有的中介免责,谁生成谁担责的红线,第一次被法律明确划出。
阅读全文DeepMind 的 Co-Scientist 帮 Abudayyeh–Gootenberg 实验室筛出 20 多个逆转细胞衰老的候选基因,几天就读完别人半年的数据——但被验证的只有两条线索,AI 加速的是假设和解读,不是疗效。
阅读全文Google DeepMind 把 Omni 包装成「从任意输入生成、起步于视频」的模型,但它最先落地的是 Gemini app、Flow 和 YouTube Shorts。值得盯的不是全模态营销,是 Google 把视频生成接进自家分发管道这步棋。
阅读全文Antigravity 2.0 砍掉 IDE、做成独立 agent 桌面端。但 Google 在 agentic 编码里的真信号不是产品力,而是分发与模型-harness 协同训练,以及强制升级带来的信任账单。
阅读全文Apple 在 WWDC 把 Siri 和 Apple Intelligence 重做在 Google Gemini 上,却坚称成品是纯 Apple——这套措辞暴露了它真正的战略转向:放弃自造最强模型,死守分发和隐私这一层。
阅读全文