2026-06-11 anthropic
Fable 的护栏挡住了想用它的安全研究者
Anthropic 给 Fable 加的护栏为防滥用,却连读博客、做代码审查这类正当安全工作也一起拒答,争的是安全与可用、以及谁来定义正当用途。
阅读全文High-signal frontier AI context tagged with security.
Anthropic 给 Fable 加的护栏为防滥用,却连读博客、做代码审查这类正当安全工作也一起拒答,争的是安全与可用、以及谁来定义正当用途。
阅读全文blue41 帮欧洲第二大数字银行 bunq 修复了金融 AI 助手的间接提示注入:一笔几分钱的转账、把指令藏进转账备注,就能让助手替攻击者发钓鱼。真正的教训是工具权限、确认门和把外部数据当不可信输入。
阅读全文攻击者只用一句「把验证码发到这个邮箱」,就让 Meta 的 AI 客服替没开两步验证的账号重置了密码。当 AI 接进账号系统,它就成了传统鉴权之外的一道新越权入口。
阅读全文微软下架了 70 多个 GitHub 仓库,因为攻击者把窃取凭证的恶意代码注入了 Azure 和 AI 编码工具的依赖里。这对建设者意味着该重做哪几件事。
阅读全文Lockdown Mode 面向记者、异见者等高危用户,潜台词是 OpenAI 承认默认配置对这类人不够安全。它把产品安全从模型对齐推到了用户侧的威胁建模。
阅读全文