4 月 13 日 abmedia 曾报導 Forrest Chang 把 Karpathy 1 月 Claude 寫程式抱怨整理成「4 條 CLAUDE.md 規則」、当时 GitHub 上累積 15,000 星;5 月 12 日該 repo 星數已突破 126,000、不到 1 个月成长 8 倍。社群随之出现許多「擴充版」嘗試、其中工程師 Mnilax(@Mnimiy)5 月 9 日发表的「在 4 條基礎上加 8 條、變成 12 條完整版」貼文獲得 5,968 次按讚、是近期 Claude Code 社群討論度最高的單篇內容之一。
4 條規則的回顾:Forrest Chang 把 Karpathy 抱怨變成可執行模板
Forrest Chang 原始 4 條規則(每條都对应 Karpathy 1 月在 X 上点名的失敗模式):
Think Before Coding(先想再寫):不要做隐性假设、要明说在假设什麼;面对 trade-off 攤开来討論;不確定时直接问、不要猜;存在更簡單做法时要反对複雜方案
Simplicity First(先求簡單):寫能解決问題的最小程式碼;不寫推測性功能、不为一次性程式碼建抽象層;资深工程師会说太複雜的设计就要簡化
Surgical Changes(外科式修改):只动該动的、不要「順手改善」相鄰程式碼、註解、格式;不重構沒壞的东西;要配合既有风格
Goal-Driven Execution(目標導向執行):定義成功標準、迭代到验证为止;不告訴 Claude 步骤、告訴它「成功长什麼樣子」让它自己 loop
Anthropic 官方文件其实寫得很明白:CLAUDE.md 是「建议性」(advisory)檔案、Claude 大约 80% 机率会遵守;超过 200 行后、合規率急遽下降、因为重要規則会被噪音淹沒。Forrest Chang 的方案是把規則壓縮到 65 行、4 條、达到「floor」(最低门檻)。
Mnilax 加的 8 條:補上 2026/5 月 agent 时代的新失敗模式
Mnilax 主張:Karpathy 1 月的抱怨集中在「Claude 寫程式碼」这个情境、但 5 月的 Claude Code 生態已演化到多 agent 協作、hook 串接、skill 載入衝突、多步骤工作流跨 session 等新场景—需要補規則。以下是他增加的 8 條(按原文順序整理):
Rule 5:只把 Claude 用於需要判斷的任務(分類、起草、摘要、抽取)、確定性決策(重試 503、路由、status code 處理、確定性转換)用一般程式碼處理
Rule 6:Token budget 不是建议—單任務 4,000 tokens、單 session 30,000 tokens 为上限、接近 budget 时要主动摘要重啟、不要无聲突破
Rule 7:两个衝突的程式碼模式要「点明选一个」(取较新、较有測試的)、解釋为什麼选、把另一个標記待清理;混合两種模式是最差选擇
Rule 8:寫程式碼前要先读懂—读檔案 exports、直接 caller、共用 utility;「看起来无关(looks orthogonal)」是最危险的措辭、不確定就要问
Rule 9:測試要验证「意圖」、不只验证「行为」—能寫一个「业務逻辑改變时会失敗」的測試才算合格;否則只是让 Claude 自信、实际保護力为零
Rule 10:多步骤任務要 checkpoint—每完成一步就要總結「做了什麼、验证了什麼、剩什麼」;无法清楚描述狀態时不要继续
Rule 11:配合既有 codebase 慣例、即使你不同意—snake_case 就 snake_case、class component 就 class component;不认同时把它当另一场討論、不要單方面分叉
Rule 12:失敗要大聲—「migration 完成」不对如果跳过 30 筆、「測試通过」不对如果跳过任何一个;预设「主动揭露不確定」、不要「藏起不確定」
Mnilax 自稱在 30 个 codebase、6 週內測試这 12 條規則、宣稱错誤率从 41% 降至 3%、合規率僅小幅下滑(78% → 76%)。本媒體觀察:这些數字是作者自陳測試結果、未经獨立验证;但 8 條規則本身的內容紮实、与当前 Claude Code 多代理使用情境(如Agent View 多 session 管理、六層架構中的 Multi-Agent Layer)对应到的痛点吻合。
适用情境与務实建议
Mnilax 也直白点出哪些做法不該嘗試:
超过 14 條規則:合規率掉到 52%(从 76% 急降)、200 行为实质上限
用範例代替規則:3 个範例的 token 成本等於 10 條規則、Claude 容易过擬合單一範例
「Be careful / think hard / really focus」等抽象指令:可验证性低、合規率僅 30%
叫 Claude「当资深工程師」:identity prompt 对行为改變无效、規則型指令才有效
依賴特定工具:「永远用 eslint」在 eslint 未安裝时会靜默失敗、改用「配合 codebase 既有风格」这類能力中性的措辭
本媒體建议的務实採用方式:CLAUDE.md 是「行为契约」、不是願望清單—每條規則都要回答「这條規則避免哪个具體错誤」。如果你的工作不涉及多步骤 pipeline、Rule 10(checkpoint)就无关緊要;如果 codebase 已有 lint 強制單一风格、Rule 11(配合慣例)是多餘。读 12 條后保留「对应到你实际踩过的坑」的版本、其餘可刪。
后续可追蹤的事件包括:Anthropic 官方是否把 CLAUDE.md 規則化(目前僅是「advisory」)、Forrest Chang repo 是否进入官方推薦範本、社群是否出现針对特定领域(前端/后端/资料工程)的客製版本、以及 Claude 模型版本更新后規則合規率是否變化。
这篇文章 Karpathy CLAUDE.md 衝 126K 星:社群版 12 條进階規則整理 最早出现於 链新聞 ABMedia。
相关快讯
Claude Code Agent 视图:单一画面管理并行会话
美国参议院银行委员会公布《CLARITY 法案》最新版本,首要保障消费者
Karpathy:AI 不该停在 Markdown!HTML 是未来,终局是可探索的互动式场景
Anthropic:科幻文本训练致 Claude Opus 4 勒索率 96%
Circle 第 1 季度 财报:USDC 流通量达 770 亿,CRCL 飙涨近 16%