AI 基础设施

2026-06-10 anthropic

Cyber Agent 的瓶颈是权限、审计和责任边界

Anthropic Project Glasswing 暴露的核心问题，是前沿 cyber agent 如何被授权、记录和追责，而不只是模型能力。

cybersecurity agents ai-infra

阅读全文

2026-06-10 anthropic

Project Glasswing 的重点是安全运营，而不是攻防炫技

Anthropic 扩展 Project Glasswing 的真正信号，是把 Claude cyber agent 放进漏洞分诊、披露、修补和部署流程。

cybersecurity agents ai-infra

阅读全文

2026-06-10 deepseek

DeepSeek V4：1M 上下文进入成本结构阶段

DeepSeek V4 的核心变化不是把 1M context 写进功能清单，而是让长上下文从能力展示进入成本、路由和产品默认值的重新设计。

frontier-models frontier-progress ai-infra

阅读全文

2026-06-10 deepseek

DeepSeek V4：开放权重第一次站上「效率前沿」，而不是追赶榜单

DeepSeek V4 的真正信号是 1.6T MoE 配上推理侧工程把前沿能力做到可负担、可自托管——开放权重阵营第一次在单位 token 成本与吞吐上拿到领先位，而不是又一个跑分名次。

frontier-models ai-infra

阅读全文

2026-06-10 deepseek

DeepSeek V4：开放权重与 API 同步，是一场分发策略战

DeepSeek V4 同时给出开放权重和当天可用 API，真正挑战闭源前沿模型的是部署自由与低迁移成本的组合。

frontier-models ai-infra inference

阅读全文

2026-06-10 microsoft

MAI-Code-1-Flash 的要害，是微软把自研模型塞进 Copilot 路径

MAI-Code-1-Flash 表面是一个轻量编码模型，真正值得跟踪的是它进入 GitHub Copilot 和 VS Code 后，微软有了让低成本自研模型获得默认路径曝光的机会。

microsoft frontier-models ai-infra

阅读全文

2026-06-10 microsoft

Frontier Tuning 让企业调优路径变成微软平台资产

微软把 MAI 模型、Frontier Tuning、Azure/GitHub 工作流放到一起，核心信号是把企业调优路径和反馈回路沉淀进自家模型体系；这会增加内部路由选项，也会加深客户对微软栈的绑定。

microsoft frontier-models ai-infra

阅读全文

2026-06-10 microsoft

微软发七个自研模型，真正信号是把自己从 OpenAI 身上解绑

Build 2026 上微软一口气发了 7 个 MAI 模型，反复强调不蒸馏任何第三方、从干净授权数据从头训。这不是追平谁，是系统性减少对 OpenAI 的依赖——Azure 上的模型供应链和绑定逻辑该重估了。

microsoft frontier-models ai-infra

阅读全文

2026-06-10 xiaomi

MiMo UltraSpeed：1000 tps 的价值在实时交互成本曲线

MiMo-V2.5-Pro-UltraSpeed 的 1000 tps 价值不是速度炫技，而是让长输出、并行采样和实时交互的单位时间成本重新计算。

inference frontier-models ai-infra

阅读全文

2026-06-10 xiaomi

MiMo UltraSpeed 把 1T 模型推向实时 agent，但还不是通用入口

MiMo UltraSpeed 的实时 agent 想象很强，但 limited capacity 与申请制说明它更像高价值能力通道，而非稳定通用生产入口。

inference frontier-models ai-infra

阅读全文

2026-06-10 minimax

MiniMax M3：MSA 把长上下文成本前移到架构层

MiniMax M3 的关键不是又一个 1M context，而是 MSA 试图从注意力结构上降低长上下文每 token 成本。

frontier-models frontier-progress long-context

阅读全文

2026-06-10 minimax

MiniMax M3：真看点是稀疏注意力把百万上下文从「能跑」做到「用得起」，不是榜单 59%

M3 的真信号是 MSA 把 1M 上下文的每 token 算力压到上一代的 1/20、解码提速 15 倍——长上下文 agent 的成本曲线第一次被一家中国实验室往下按。但发布日权重并未开放，「过 10 天再开源」是诚意的试金石。

frontier-models long-context ai-infra

阅读全文

2026-06-10 minimax

MiniMax M3 的采用瓶颈，会卡在 serving 生态

M3 的难点不是模型卡片，而是 vLLM 等 serving 生态能否及时支持 MSA 的块级稀疏注意力。

frontier-models long-context ai-infra

阅读全文

2026-06-08 xiaomi

小米把 1T 模型推到 1000 tokens/s，靠的不是专用硬件

MiMo-V2.5-Pro-UltraSpeed 在一台 8 卡商用 GPU 上让万亿参数模型解码破 1000 tps。真正的信号是 model-system codesign 打破了「极致速度=专用硬件」的等式，而不是那套手术室生死营销。

inference frontier-models ai-infra

阅读全文

2026-06-02 anthropic

Project Glasswing 把前沿网络能力变成运营问题

Anthropic 扩展 Project Glasswing 说明，强网络模型会把瓶颈从发现漏洞转移到 triage、披露、修补、部署和访问控制。

agents ai-infra cybersecurity

阅读全文

2026-06-01 openai

OpenAI 把模型挂上 AWS，是去微软的城墙外另开一道门

OpenAI 的模型和 Codex 上了 AWS Bedrock。表面是多一个云平台,真实动机是 OpenAI 不再甘心只活在微软的分发渠道里,要直接站到企业最熟悉的那块地盘上。

ai-infra agents ai-coding

阅读全文

2026-04-22 openai

Workspace Agents：治理本身就是 Agent 产品

OpenAI 的 ChatGPT workspace agents 表明，共享、定时、云端运行的 Agent 和模型能力一样需要审批、审计和管理员控制。

agents knowledge-work ai-infra

阅读全文