前沿模型安全警报响起:AI网络攻防能力每4个月翻倍

作者: CBISMB

责任编辑: 宋慧

来源: CBISMB

时间: 2026-05-12 13:50

关键字: AI安全 模型评估 Agent治理

浏览: 0

点赞: 0

收藏: 0

英国AI安全研究院(AISI)最新发布的评估报告在技术圈引起广泛关注。报告指出,前沿模型在网络攻防任务上的能力提升速度正在急剧加速——当前能力翻倍周期已缩短至约4个月,远低于2025年底时评估的7个月翻倍周期。


这一信号意味着:AI正在快速跨越从"辅助工具"到"执行型系统"的门槛。AISI的测试显示,Anthropic的Claude Mythos Preview成为首个通过其32步"最后防线"(TLO)红队测试的模型,该测试模拟从侦察到完全域控制的完整攻防链条,通常需要人类红队专家20小时才能完成。


更值得注意的是,OpenAI的GPT-5.5仅在三周后便展现出几乎相同的能力水平。这种技术迭代速度让安全界不得不重新审视现有的防御体系。AISI坦承:当前的安全基准已无法有效区分前沿模型的能力差距,亟需引入对抗性防御层作为新的评估标准。


随着AI Agent能力快速进化,开发者需要将关注焦点从模型能力本身扩展到Agent治理层面,包括权限边界设计、Sandbox隔离、工具调用审计以及多步推理安全控制等方面。业界共识正在形成:Agent治理的重要性正在超越单纯的模型能力提升。


来源:Air Street Press等综合报道

©本站发布的所有内容,包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等,除特别标明外,均来源于网络或用户投稿,版权归原作者或原出处所有。我们致力于保护原作者版权,若涉及版权问题,请及时联系我们进行处理。
加载中...

发布