2026-06-11 google
Gemini 3.5 Live Translate:实时语音翻译从演示走进 API
Google DeepMind 发布流式语音到语音翻译,70+ 语言、保留语调语速音高,关键不在演示而在它进了 Gemini Live API。
阅读全文High-signal frontier AI context tagged with multimodal.
Google DeepMind 发布流式语音到语音翻译,70+ 语言、保留语调语速音高,关键不在演示而在它进了 Gemini Live API。
阅读全文Gemma 4 12B 把视觉和音频直接喂进语言模型主干,放弃了独立编码器。这是一个架构赌注,而不只是又一个端侧模型。
阅读全文