前沿模型安全警报响起：AI网络攻防能力每4个月翻倍

作者： CBISMB

责任编辑：宋慧

来源： CBISMB

时间： 2026-05-12 13:50

点赞： 0

收藏： 0

英国AI安全研究院（AISI）最新发布的评估报告在技术圈引起广泛关注。报告指出，前沿模型在网络攻防任务上的能力提升速度正在急剧加速——当前能力翻倍周期已缩短至约4个月，远低于2025年底时评估的7个月翻倍周期。

这一信号意味着：AI正在快速跨越从"辅助工具"到"执行型系统"的门槛。AISI的测试显示，Anthropic的Claude Mythos Preview成为首个通过其32步"最后防线"（TLO）红队测试的模型，该测试模拟从侦察到完全域控制的完整攻防链条，通常需要人类红队专家20小时才能完成。

更值得注意的是，OpenAI的GPT-5.5仅在三周后便展现出几乎相同的能力水平。这种技术迭代速度让安全界不得不重新审视现有的防御体系。AISI坦承：当前的安全基准已无法有效区分前沿模型的能力差距，亟需引入对抗性防御层作为新的评估标准。

随着AI Agent能力快速进化，开发者需要将关注焦点从模型能力本身扩展到Agent治理层面，包括权限边界设计、Sandbox隔离、工具调用审计以及多步推理安全控制等方面。业界共识正在形成：Agent治理的重要性正在超越单纯的模型能力提升。

来源：Air Street Press等综合报道

©本站发布的所有内容，包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等，除特别标明外，均来源于网络或用户投稿，版权归原作者或原出处所有。我们致力于保护原作者版权，若涉及版权问题，请及时联系我们进行处理。

相关推荐