前沿模型安全警报响起:AI网络攻防能力每4个月翻倍
作者: CBISMB
责任编辑: 宋慧
来源: CBISMB
时间: 2026-05-12 13:50
浏览: 0
点赞: 0
收藏: 0
英国AI安全研究院(AISI)最新发布的评估报告在技术圈引起广泛关注。报告指出,前沿模型在网络攻防任务上的能力提升速度正在急剧加速——当前能力翻倍周期已缩短至约4个月,远低于2025年底时评估的7个月翻倍周期。
这一信号意味着:AI正在快速跨越从"辅助工具"到"执行型系统"的门槛。AISI的测试显示,Anthropic的Claude Mythos Preview成为首个通过其32步"最后防线"(TLO)红队测试的模型,该测试模拟从侦察到完全域控制的完整攻防链条,通常需要人类红队专家20小时才能完成。
更值得注意的是,OpenAI的GPT-5.5仅在三周后便展现出几乎相同的能力水平。这种技术迭代速度让安全界不得不重新审视现有的防御体系。AISI坦承:当前的安全基准已无法有效区分前沿模型的能力差距,亟需引入对抗性防御层作为新的评估标准。
随着AI Agent能力快速进化,开发者需要将关注焦点从模型能力本身扩展到Agent治理层面,包括权限边界设计、Sandbox隔离、工具调用审计以及多步推理安全控制等方面。业界共识正在形成:Agent治理的重要性正在超越单纯的模型能力提升。
来源:Air Street Press等综合报道
发布