Anthropic 推出第五代 Claude 双模型 两大版本各展所长

作者: CBISMB

责任编辑: 曹新玲

来源: CBISMB

时间: 2026-06-10 10:25

浏览: 0

点赞: 0

收藏: 0

知名 AI 企业 Anthropic 正式推出第五代 Claude 系列两大全新模型,分别是面向通用场景的 Claude Fable5,以及聚焦专业领域的 Claude Mythos5。两款产品同源而生,基于同一基础模型开发,针对安全策略与落地场景做出差异化设计,面向不同用户群体提供服务。

通用模型Fable5:综合实力领跑 编程能力表现突出

Claude Fable5 定位通用大模型,在多项主流能力测评中交出亮眼成绩,尤其擅长处理长文本、高复杂度的综合任务。

在编程领域,该模型优势格外突出。在模拟真实开发场景的 SWE-Bench Pro 测评里,Fable5 得分达到 80.3%,大幅超越得分69.2%的 Claude Opus4.8 以及得分 58.6%的GPT5.5。面对标准更严苛、贴近实际生产环境的 FrontierCode 评测,Fable5 拿下 29.3% 的分数,和竞品拉开明显差距。

落地实践中,不少企业已验证其效率价值。支付服务商 Stripe 反馈,借助这款模型,原本耗时五个月的工程项目,如今仅需数日便可完成;面对一份包含 5000 万行 Ruby 代码的大型代码库,Fable5 只用一天,就完成了整支团队近两个月才能做完的代码迁移工作。

除编程外,Fable5 在商业分析、视觉解析等维度同样表现不俗。在金融分析相关基准测试中,模型表现获得行业认可,多家交易机构的业务评估环节均顺利通过。视觉能力方面,它可精准拆解专业科学插图中的数据信息,还能依托游戏截图独立完成经典游戏流程,不再需要额外辅助工具支撑。

专业模型 Mythos5:深耕前沿领域 主攻科研与网络安全

和安全管控偏保守的 Fable5 不同,Claude Mythos5 放宽了部分领域使用限制,主打前沿科研与网络安全方向,目前仅对指定合作方以及美国相关项目定向开放。

生物医药研发场景下,该模型可自主完成靶点筛选、工具调用、问题纠错等全流程工作,无需人工持续介入。在针对 14 类蛋白质靶点的药物研发测试中,成功产出 9 组有效候选药物方案,整体研发效率提升十倍。

在基础科学研究层面,Mythos5 成为少数能够自主提出科研假设的大模型。对照试验结果显示,科研人员更认可该模型产出的分子生物学相关猜想,其中关于大肠杆菌蛋白作用机制的推论,也已经得到独立研究佐证。同时,它还可长期自主开展基因组学相关研究,曾连续运行一周以上,整合处理上千种动物、海量单细胞样本数据,并独立训练出专属 AI 模型。该模型综合性能超越权威期刊《科学》刊发的同类成果,体积却仅有其百分之一。

网络安全领域也是 Mythos5 的核心优势赛道。在专业安全能力测评 ExploitBench 中,模型得分从预览版的 69% 提升至 78%,远高于前代模型 40% 的成绩,被视作当下网络安全领域综合能力顶尖的大模型之一。

定价与安全管控:高成本配套多重防护机制

性能升级的同时,两款新模型调用成本也有所上涨。目前统一计费标准为:每百万输入代币收费 10 美元,每百万输出代币收费 50 美元,整体定价约为前代 Claude Opus4.8 的两倍。在官方网页订阅服务中,使用新模型也将按照原有标准的两倍额度扣除使用量。

考虑到 Mythos5 这类专业模型存在潜在使用风险,Anthropic 为通用版 Fable5 搭建了多层安全防护体系。当系统识别到网络安全、生物、化学以及模型能力提取等高危指令时,会自动将请求分流至安全策略更完善的 Claude Opus4.8 运行,该类场景占比不足 5%,同时平台会向用户同步相关提示。

若遇到涉及大模型训练框架、分布式部署方案等相关提问,平台不会直接阻断回答,而是通过优化提示词、调整引导向量、参数高效微调等隐性方式,弱化高危内容输出。经过超千小时的外部攻防测试,外界暂未找到绕过防护的手段,针对攻击类指令的拦截成功率达到 100%。此外,平台还延长数据留存时长至 30 天,用于持续监测新型攻击手段,筑牢安全防线。

©本站发布的所有内容,包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等,除特别标明外,均来源于网络或用户投稿,版权归原作者或原出处所有。我们致力于保护原作者版权,若涉及版权问题,请及时联系我们进行处理。