为什么有人觉得 AI 改变世界、有人觉得普通?Karpathy 的两个诊断

鏈新聞abmedia

OpenAI 創辦團队成員、Tesla 前 AI 總監 Andrej Karpathy 在 X 上发表「AI 能力认知差距」长文、回应一个社群现象:对 AI 的驚嘆程度两極分化—一群人覺得 AI 已经改寫世界、另一群人覺得 AI 只会幻覺、无聊、被吹过头。Karpathy 提出两个診斷、解釋为什麼这两群人是「平行世界」、彼此誤解了对方的判斷依據。本文整理他的論述、与对台灣科技读者的啟示。

診斷一:你用的是哪一年、哪一層的 AI?

Karpathy 的第一个觀察直接、犀利:「很多人去年試了 ChatGPT 的免费版、就让那次體验主導他們对 AI 的看法。」这群人的反应通常是嘲笑模型的奇怪反应、幻覺、笨拙、转发 OpenAI 进階语音模式被「我該开车去洗车还是走路」这種簡單问題搞砸的影片。

但 Karpathy 指出:这些「免费版、舊版、棄用版」的模型、根本不能反映 2026 年最先进 agentic 模型(特別是 OpenAI Codex 与 Claude Code)的能力。簡單说:你拿 2024 年的免费 ChatGPT 来判斷 AI 能不能寫程式、就像拿 2008 年的 Nokia E71 来判斷智慧型手机能不能用。

对許多台灣读者而言这也是现实—訂 ChatGPT Plus($20)尚算普遍、但訂 ChatGPT Pro($200)、Claude Max($100)的人非常少數。沒在最先进付费 tier 上跑过 agent task 的人、看 AI 大多是「玩具好玩但不可靠」;跑过的人、看 AI 是「完整改寫工作流程」。同一个技術、两个世界。

診斷二:能力进步在不同领域是「不对稱」的

Karpathy 的第二个診斷更有意思:「就算你付 $200/月用最先进模型、能力的进步也是『尖峰式』、集中在高度技術领域。」

他指出:搜尋、寫作、建议这類「典型查詢」、不是过去这年 AI 进步最劇烈的领域。原因有两層:

強化学習(RL)依賴可验证的獎勵函數—寫程式有「單元測試通过了嗎」这種明確訊號、寫作沒有对应的客觀判準、所以 RL 訓練的进步速度差距很大

OpenAI、Anthropic 等公司的最大商业价值在 B2B 程式碼/研究/工程场景、所以资源、人力、優先序都集中在这些领域、其他用例不是最大利潤来源

这个觀察很关鍵—它解釋了「为什麼 AI 寫程式能力突飞猛进、但 AI 寫文章还是常常很普通」这个多人困惑的现象。不是 AI 公司不会做、而是他們的金礦在別處、注意力跟著去了。

誰最受「AI 认知衝擊」?两个條件齐備的人

把两个診斷結合、Karpathy 描述「最会被 AI 认知衝擊」的群體—同时滿足两个條件的人:

付费使用最先进的 agentic 模型(OpenAI Codex、Claude Code)

在高度技術领域(程式设计、數学、研究)專业使用

这群人最受所謂「AI Psychosis」影響—Karpathy 用语、形容当你親眼看到 LLM 把原本要花幾天到幾週的程式问題在幾小时內解決、那種对 AI 能力与斜率(slope)的判斷、会让你对未来幾年的科技格局有截然不同的看法。

对另一群人(沒付费、沒在技術领域用)、这種说法聽起来像「过度興奮」、像「矽谷小圈圈的群體迷思」。但 Karpathy 认为这不是迷思、而是親身體验的真实判斷。

两群人「对著彼此的世界发言」

Karpathy 的核心結論:「这两群人在彼此说話、不在跟对方说話。」他描述同时可能成立的两件事:

OpenAI 免费(且我认为被半放棄的)「进階语音模式」、在 Instagram Reels 上会搞砸最笨的问題

同一时间、OpenAI 最高 tier 付费的 Codex 模型、会花 1 小时连貫地重構整个 codebase、或找出並利用电腦系统的漏洞

两件事都是真的、不衝突。但两群人各自只看到一边、然后互相覺得对方「过度興奮」或「太无知」。Karpathy 寫这篇文的目的、就是想橋接这个落差。

給台灣读者的啟示:你站在哪一群?

Karpathy 的論述对台灣读者特別有意義、因为台灣科技論述场上同樣有两極分化:一边是「AI 已经接管」、一边是「不过是 chatbot 而已」。判斷自己屬於哪群、可以看 3 个自我问題:

你最近一次親自下 prompt 給最先进付费模型(GPT-5.5 Pro、Claude Opus 4.7)是多久前?

你有沒有让 agent 跑超过 30 分鐘、实际完成一个生产級任務(重構程式、寫研究綜述、debug 複雜系统)?

你判斷 AI 能力的依據、来自媒體报導、社群迷因、还是親身使用?

三个问題都答「有、近期、親身使用」的人、会落在 Karpathy 描述的第二群、会比较理解他「AI Psychosis」的说法。三个问題都答「沒、很久前、媒體上看的」的人、会落在第一群、可能对 AI 进步的速度大幅低估。

这不是说哪一群「对」、而是不同群體的判斷依據根本性差異。当你看到下一篇「AI 是泡沫」或「AI 將取代所有工作」的文章、先確认作者落在哪一群、再決定怎麼读。

Karpathy 的「OpenClaw 时刻」補充

Karpathy 在后续貼文補充:「有人最近告訴我、OpenClaw 时刻之所以这麼大、是因为这是非技術背景的大群人、第一次親身體验最先进的 agentic 模型。」这个觀察说明:认知差距不只是「程度」差距、也是「親身體验 vs 道聽塗说」的差距。

对 abmedia 读者而言、最实用的解法是:拿出 $20、訂一个月 ChatGPT Plus 或 Claude Pro、找一个你自己关心的真实任務(寫一篇研究报告、整理一份财務分析、debug 一个程式專案)、用 agent 完整跑一次、再回来判斷 AI 对你的工作意義。比读 100 篇 AI 报導都有用。

这篇文章 为什麼有人覺得 AI 改變世界、有人覺得普通?Karpathy 的两个診斷 最早出现於 链新聞 ABMedia。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

Sierra 募资 9.5 亿美元、估值 158 亿美元:Bret Taylor 以 OpenAI 主席身分抢夺 AI 客服龙头

Sierra 由 Bret Taylor 共同创办,宣布完成 9.5 亿美元 Series E、估值 158 亿美元,由 Tiger Global 与 GV 首投。8 季达成 1.5 亿 ARR、Fortune 50 渗透率超过 40%。定位为以 AI agent 为核心的垂直企业客服平台,提供即用型工作流。Taylor 同时为 OpenAI 董事长,治理与利益披露成焦点。

鏈新聞abmedia28 分钟前

OpenAI 重构 WebRTC 语音堆栈:9 亿周活用户、Go 编写的 Relay 为核心

OpenAI 发布了一款使用 Go 编写的瘦型 relay 以及集中式 transceiver 架构,重构 WebRTC 媒体层以支撑每周 9 亿活跃用户的语音服务。状态密集的连接集中在 transceiver,relay 是无状态数据平面,解决每个端口一 session、ICE/DTLS 拥有者以及低首跳延迟等瓶颈,便于横向扩展。后续将观察是否开源、Realtime API 的规模与定价,以及竞争对手的跟进。

鏈新聞abmedia30 分钟前

Gemini API 推出 Webhooks:Google 解决长期任务轮询痛点、Batch/Veo 可即时推送

Google Gemini API 于 5 月 4 日推出 Webhooks。长任务完成时会自动将结果推送到 callback URL,替代轮询,降低资源和延迟、简化程序。适用于 Batch API、Veo2 和长 context 推理,特别适合 serverless。相较 OpenAI 偏 SSE、Anthropic 仍使用轮询,Google 强调开发者基础设施。未来关注安全机制与扩展模型。对台湾开发者而言,立即整合可显著降低 quota 和系统负载。

鏈新聞abmedia32 分钟前

Krutrim 于 5 月 5 日转向 AI 云服务,并发布首份盈利,随着 FY26 营收达到 3160 万美元

据 Press Trust of India 报道,印度 AI 公司 Krutrim 于 5 月 5 日将自身重新定位为本土 AI 云服务提供商,暂停芯片设计工作,并将资本和人才转向云基础设施。 该公司公布的 26 财年收入约为 30 亿卢比(US$31.6 m

GateNews1小时前

Haun Ventures 于 5 月 5 日完成 10 亿美元基金收盘,瞄准加密和 AI 初创公司

据 Cointelegraph 报道,Haun Ventures 于 5 月 5 日完成为一只新基金募集 10 亿美元,资金将平均分配用于早期和晚期投资。该基金将聚焦于加密、人工智能和替代行业领域

GateNews2小时前

Anthropic、OpenAI 投资自 2026 年开始以来在零售加密交易中累计超过 11 亿美元

据彭博报道,自 2026 年初以来,散户投资者已向私营 AI 公司衍生品的杠杆交易投入约 11.3 亿美元。加密平台 Ventuals 和 PreStocks 支持 24 小时交易,包括 Anthropic、OpenAI 和 SpaceX 等公司,同时不授予直接的交易权限。

GateNews2小时前
评论
0/400
暂无评论