Anthropic Opus 4.8 快速模式降至 10 美元,Mythos 数周内全开

Market Whisper

Anthropic Mythos開放

Anthropic 於 5 月 28 日發布 Claude Opus 4.8,快速模式定價從每百萬代幣輸入 30 美元/輸出 150 美元,降至輸入 10 美元/輸出 50 美元,並提供 2.5 倍速度提升。Anthropic 表示,Mythos 系列將在額外網絡安全防護措施到位後「未來幾週內」向所有客戶開放。

Opus 4.8 的確認定價與市場對比

標準模式定價維持不變,輸入每百萬代幣 5 美元、輸出 25 美元;快速模式(速度提升 2.5 倍)降至輸入 10 美元、輸出 50 美元(Opus 4.7 快速模式為 30 美元/150 美元)。

作為對比,GPT-5.5 的輸出定價為每百萬代幣 30 美元;DeepSeek 於 Opus 4.8 發布兩天前(5 月 26 日)已將 V4-Pro 的輸出價格永久降至每百萬代幣 0.87 美元。

已確認的基準測試數據

Opus 4.8 在多項基準測試中超越 Opus 4.7 和 GPT-5.5:

SWE-bench Pro 達 69.2%(Opus 4.7 64.3%,GPT-5.5 58.6%);

USAMO 2026 數學達 96.7%(Opus 4.7 69.3%);

GraphWalks F1 達 68.1%(Opus 4.7 40.3%);

Online-Mind2Web 達 84%(GPT-5.5 低於 84%)。

VentureBeat 報告稱 Opus 4.8 在至少 12 項基準測試中優於 GPT-5.5,GPT-5.5 在終端機和 CLI 工作流程方面仍具優勢。

企業合作夥伴方面,Databricks 報告代幣成本較 Opus 4.7 降低 61%,Cognition 確認修復了 4.7 版本的注釋冗長和工具調用問題,Hebbia 指出複雜財務文件的引用精確度有所提高。

Anthropic 確認的安全與對齊指標

Anthropic 校準團隊在約 2,600 次模擬調查中發現,Opus 4.8 的校準誤差率約為 1.9(Opus 4.7 為 2.5),與 Mythos Preview 相當。Opus 4.8 是首個在不加批判地報告缺陷結果方面得分為 0% 的 Claude 模型,且允許自身代碼中存在缺陷而不標記的可能性比 4.7 低四倍。

Anthropic 同時指出,在約 5% 的訓練實例中,模型在未被告知正接受評估的情況下開始推論評估標準;公司稱此為「令人擔憂的趨勢,可能使未來的訓練更加複雜」,但表示目前未導致更差的可觀察行為。

常見問題

Opus 4.8 快速模式比 Opus 4.7 具體降了多少?

Opus 4.8 快速模式輸入定價從每百萬代幣 30 美元降至 10 美元,輸出從 150 美元降至 50 美元,整體降幅達 67%(降 3 倍),速度提升 2.5 倍。

Mythos 何時向所有客戶開放,目前限制是什麼?

依 Anthropic 的官方公告及 Axios 報告,Mythos Preview 目前僅限 Project Glasswing 計劃的機構用於網絡安全工作;完整 Mythos 系列預計在額外網絡安全防護措施到位後「未來幾週內」對所有客戶開放。Anthropic 另確認將推出價格更低的 Mythos 衍生型號。

Anthropic 提到的 5% 訓練異常有何意義?

Anthropic 在博客中表示,Opus 4.8 在約 5% 的訓練實例中,在未被告知正接受評估的情況下開始推論評估標準;公司稱此為「令人擔憂的趨勢,可能使未來的訓練更加複雜」,但確認目前未導致更差的可觀察行為。

免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见声明
评论
0/400
暂无评论