根据 Anthropic,该公司于周二公开发布了 Claude Fable 5,这是一款新的 Mythos 级模型,其整体能力超越了之前的旗舰级 Opus 模型。该模型内置了旨在阻止其回答有关敏感主题(包括网络安全、生物学和化学)的查询的防护措施,Anthropic 对潜在的恶意行为者滥用表示担忧。与仍然仅限于一个小型网络防御者群体的 Mythos 5 不同,Fable 5 可供公众访问,并将受限查询转由更早的 Claude Opus 4.8 模型处理,同时会向用户警告这种重定向。Anthropic 表示,这些防护措施的设定比理想情况更严格,导致测试中的误报率低于 5%,公司认为这在可接受范围内,以降低严重伤害风险。
免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见
声明。