4 月 13 日 abmedia 曾报導 Forrest Chang 把 Karpathy 1 月 Claude 寫程式抱怨整理成「4 條 CLAUDE.md 規則」、当时 GitHub 上累積 15,000 星；5 月 12 日該 repo 星數已突破 126,000、不到 1 个月成长 8 倍。社群随之出现許多「擴充版」嘗試、其中工程師 Mnilax（@Mnimiy）5 月 9 日发表的「在 4 條基礎上加 8 條、變成 12 條完整版」貼文獲得 5,968 次按讚、是近期 Claude Code 社群討論度最高的單篇內容之一。

4 條規則的回顾：Forrest Chang 把 Karpathy 抱怨變成可執行模板

Forrest Chang 原始 4 條規則（每條都对应 Karpathy 1 月在 X 上点名的失敗模式）：

Think Before Coding（先想再寫）：不要做隐性假设、要明说在假设什麼；面对 trade-off 攤开来討論；不確定时直接问、不要猜；存在更簡單做法时要反对複雜方案

Simplicity First（先求簡單）：寫能解決问題的最小程式碼；不寫推測性功能、不为一次性程式碼建抽象層；资深工程師会说太複雜的设计就要簡化

Surgical Changes（外科式修改）：只动該动的、不要「順手改善」相鄰程式碼、註解、格式；不重構沒壞的东西；要配合既有风格

Goal-Driven Execution（目標導向執行）：定義成功標準、迭代到验证为止；不告訴 Claude 步骤、告訴它「成功长什麼樣子」让它自己 loop

Anthropic 官方文件其实寫得很明白：CLAUDE.md 是「建议性」（advisory）檔案、Claude 大约 80% 机率会遵守；超过 200 行后、合規率急遽下降、因为重要規則会被噪音淹沒。Forrest Chang 的方案是把規則壓縮到 65 行、4 條、达到「floor」（最低门檻）。

Mnilax 加的 8 條：補上 2026/5 月 agent 时代的新失敗模式

Mnilax 主張：Karpathy 1 月的抱怨集中在「Claude 寫程式碼」这个情境、但 5 月的 Claude Code 生態已演化到多 agent 協作、hook 串接、skill 載入衝突、多步骤工作流跨 session 等新场景—需要補規則。以下是他增加的 8 條（按原文順序整理）：

Rule 5：只把 Claude 用於需要判斷的任務（分類、起草、摘要、抽取）、確定性決策（重試 503、路由、status code 處理、確定性转換）用一般程式碼處理

Rule 6：Token budget 不是建议—單任務 4,000 tokens、單 session 30,000 tokens 为上限、接近 budget 时要主动摘要重啟、不要无聲突破

Rule 7：两个衝突的程式碼模式要「点明选一个」（取较新、较有測試的）、解釋为什麼选、把另一个標記待清理；混合两種模式是最差选擇

Rule 8：寫程式碼前要先读懂—读檔案 exports、直接 caller、共用 utility；「看起来无关（looks orthogonal）」是最危险的措辭、不確定就要问

Rule 9：測試要验证「意圖」、不只验证「行为」—能寫一个「业務逻辑改變时会失敗」的測試才算合格；否則只是让 Claude 自信、实际保護力为零

Rule 10：多步骤任務要 checkpoint—每完成一步就要總結「做了什麼、验证了什麼、剩什麼」；无法清楚描述狀態时不要继续

Rule 11：配合既有 codebase 慣例、即使你不同意—snake_case 就 snake_case、class component 就 class component；不认同时把它当另一场討論、不要單方面分叉

Rule 12：失敗要大聲—「migration 完成」不对如果跳过 30 筆、「測試通过」不对如果跳过任何一个；预设「主动揭露不確定」、不要「藏起不確定」

Mnilax 自稱在 30 个 codebase、6 週內測試这 12 條規則、宣稱错誤率从 41% 降至 3%、合規率僅小幅下滑（78% → 76%）。本媒體觀察：这些數字是作者自陳測試結果、未经獨立验证；但 8 條規則本身的內容紮实、与当前 Claude Code 多代理使用情境（如Agent View 多 session 管理、六層架構中的 Multi-Agent Layer）对应到的痛点吻合。

适用情境与務实建议

Mnilax 也直白点出哪些做法不該嘗試：

超过 14 條規則：合規率掉到 52%（从 76% 急降）、200 行为实质上限

用範例代替規則：3 个範例的 token 成本等於 10 條規則、Claude 容易过擬合單一範例

「Be careful / think hard / really focus」等抽象指令：可验证性低、合規率僅 30%

叫 Claude「当资深工程師」：identity prompt 对行为改變无效、規則型指令才有效

依賴特定工具：「永远用 eslint」在 eslint 未安裝时会靜默失敗、改用「配合 codebase 既有风格」这類能力中性的措辭

本媒體建议的務实採用方式：CLAUDE.md 是「行为契约」、不是願望清單—每條規則都要回答「这條規則避免哪个具體错誤」。如果你的工作不涉及多步骤 pipeline、Rule 10（checkpoint）就无关緊要；如果 codebase 已有 lint 強制單一风格、Rule 11（配合慣例）是多餘。读 12 條后保留「对应到你实际踩过的坑」的版本、其餘可刪。

后续可追蹤的事件包括：Anthropic 官方是否把 CLAUDE.md 規則化（目前僅是「advisory」）、Forrest Chang repo 是否进入官方推薦範本、社群是否出现針对特定领域（前端／后端／资料工程）的客製版本、以及 Claude 模型版本更新后規則合規率是否變化。

这篇文章 Karpathy CLAUDE.md 衝 126K 星：社群版 12 條进階規則整理最早出现於链新聞 ABMedia。

免责声明：本页面信息可能来自第三方，仅供参考，不代表 Gate 的观点或意见，亦不构成任何财务、投资或法律建议。数字资产交易风险较高，请勿仅依赖本页面信息作出决策。具体内容详见声明。