Coinbase 執行長 Brian Armstrong 於 6 月 26 日表示,Coinbase 已將智譜最新發布的 GLM 5.2 及北京月之暗面(Moonshot AI)的 Kimi 2.7,設定為公司內部工程師的預設大語言模型;Coinbase AI 支出削減近半,同期 Token 使用量仍維持指數級增長。
Armstrong 說明,GLM 5.2 和 Kimi 2.7 主要部署於常規任務場景,例如標準程式碼輔助等一般工程工作流;需要複雜規劃的任務,工程師仍可選用前沿模型。在程式碼審查環節,Coinbase 採用多模型並行策略,讓不同模型相互校驗輸出結果,以維持品質標準。
Armstrong 將 Coinbase AI 支出削減近半的結果歸因於以下三層基礎設施重構:
智能路由:系統對提示詞進行預處理,綜合快取命中率與模型定價,自動將任務分發至最適合、最經濟的模型
積極快取:要求所有請求具備快取感知能力,LibreChat 的快取命中率從 5% 躍升至 60%
精簡上下文:建議工程師在切換任務時開啟新會話、縮小檔案範圍,以減少浪費的 Token
Armstrong 強調,此次成本優化的目標不是壓制使用量,而是擴大 AI 採用規模。他表示目標是讓工程師在不設成本天花板的前提下,自由使用任意數量的 Token 與模型,同時將使用量與業務影響掛鉤。Armstrong 認為此模式可供任何企業借鑒,上述說法為其個人公開陳述。
GLM 5.2 是中國 AI 公司智譜(Zhipu AI)的最新發布模型;Kimi 2.7 是北京月之暗面科技有限公司(Moonshot AI)的大語言模型。兩款模型均以開源形式對外發布,Armstrong 說明 Coinbase 將其部署於常規工程任務場景,複雜任務仍使用前沿模型。
根據 Armstrong 的說明,削減成本的核心是三層基礎設施重構:智能路由(自動分配任務至最經濟的模型)、積極快取(LibreChat 快取命中率從 5% 升至 60%)、精簡上下文(減少浪費的 Token)。在此基礎上,採用成本更低的中國開源模型替代部分美國前沿模型的常規任務用量,進一步壓縮整體支出。
根據 Armstrong 2026 年 6 月 26 日的公開聲明,他未提及採用 GLM 5.2 和 Kimi 2.7 所涉及的數據安全審查細節或合規安排。Coinbase 為受美國監管的加密資產交易所,相關合規框架的具體內容在此次聲明中未有披露。