NEW EVENT
最新活動
BG Wallet
OKX
幣安
HOT ARTICLES
熱門文章
Featured Articles
專題精選
AI 領域中最具影響力的人物之一 Andrej Karpathy 表示:Vibe Coding 的時代已經過去了。
Karpathy 是 OpenAI 的創始成員之一、前 Tesla AI 總監,也是教育新創 Eureka Labs 的創辦人。更重要的是,他在 2025 年創造並推廣了「Vibe Coding」這個術語,而現在他卻說那個時代已經過去了。
Karpathy 在 No Priors Podcast 提到,他從 2025 年底開始就幾乎不再親自寫程式,轉而依賴 Coding Agent;訪談進一步延伸到 AutoResearch、就業變化、開源 vs 閉源、機器人與教育,描繪 AI 正全面重塑工作方式。
本文整理了 Karpathy 在 Podcast 中提到的重點以及他為什麼會認為 Vibe Coding 的時代已經過去。
Karpathy 認為:「寫程式碼(Code)甚至已經不再是正確的動詞了」。
在 2025 年 12 月之前,他的工作內容大概會是自己寫完 80% 的程式碼,剩下的 20% 才會交給 Agent,而在這之後他的工作比例瞬間翻轉成 20:80,甚至很快就幾乎變成了接近 0:100。
這個轉變的背後,正是以 Claude Code、OpenAI Codex 等 AI 工具為代表的 Coding Agent 在能力上跨越了一個門檻。這些 Agent 不再是只能夠生成片段程式碼的助手,而是有辦法去理解整個程式資料庫的上下文,並且去獨立完成功能開發、除錯和迭代。
Karpathy 也提到了他目前的工作方式,是在一個大螢幕上開啟多個 Agent 會話,每個 Agent 負責一個獨立的功能模組或研究任務,它們各自運行約 20 分鐘,而他則會在不同 Agent 之間切換,分配工作、審查結果。雖然他認為「Vibe Coding 已經過時」,但反而對此提出了一個新的概念:「Agentic Engineering」(代理工程學)。
Agentic Engineering 的含義:「agentic」是因為未來有 99% 的時間不會再親自去撰寫程式碼,而是在編排、監督那些替我們寫程式碼的 Agent;「engineering」則是強調這背後依然存在一門藝術和科學,需要學習、需要精進,有其獨特的深度。
未來的瓶頸不再是計算力或是打字速度,而是人類本身。Karpathy 表示他會對自己的訂閱額度沒有用完而感到焦慮,因為如果有剩餘的 Token,就代表他還沒有最大化自己的「Token 吞吐量」。除此之外,當 Agent 的成果不如預期時,他的反應不是去質疑 Agent 的能力,而是認為「這是技能的問題」(skill issue),意思就是指他下達的指令不夠完美、上下文的資訊不夠充分、工作流程還能再進一步優化。
Dobby 是 Karpathy 所搭建的「家庭精靈」。他在 2026 年 1 月的時候經歷了一段「Claw 精神疾病」時期(Claw 指的是他對 OpenClaw 等持續運行型 Agent 的稱呼),用 AI Agent 逆向挖掘了家中所有智慧居家系統。
他透過單純告知 Agent「家中好像有 Sonos 音響」,Agent 就自動掃描了區域網路上的所有設備,並且找到了 Sonos 系統,而且在發現它沒有密碼保護後就直接登入,最後成功播放了音樂。Karpathy 還建立了一套安全監控系統:當家中外部的攝影機偵測到動態變化後,就會把畫面傳給 Qwen 視覺模型分析,然後透過 WhatsApp 來發送通知,像是「FedEx 貨車剛剛到了你家門口」。
過去:管理這些系統會需要數種不同的 App
現在:只需要透過自然語言和 Dobby 對話
除此之外,Karpathy 還舉了一個更日常的例子:他的跑步機。跑步機自帶一個 App,可以記錄有氧運動的數據,但他不想每次都登入一個繁瑣的網頁 UI、點擊一堆流程才能查看自己的運動紀錄。在他看來,這些都不應該需要透過專屬的 App 才能夠查詢資訊,因為設備只需要開放 API,讓 Agent 直接調用就好了。
在 Agent 時代,大量為特定設備量身打造的 App 可能根本不應該存在,因為真正需要的不是精美的使用者介面,而是開放的 API,讓 Agent 成為連接一切的工具。未來的世界是要讓 Agent 讀取優先,而不是人類操作介面優先。
AutoResearch 是 Karpathy 在 2026 年 3 月初發布的開源專案。這個專案可以用簡單的一句話來概括:提供 AI Agent 一個小型的語言模型訓練環境,讓它能夠在你睡覺的時候自主進行實驗。
AutoResearch 的架構非常精簡,在核心只有大約 630 行的 Python 訓練腳本,運行在單張 GPU 上。Agent 擁有修改這份訓練程式碼的權限,每次實驗會被限定在約 5 分鐘的時間預算內。它修改超參數或架構設計,啟動訓練,檢查驗證指標,判定這次修改是否帶來了改善。如果改善了就保留,沒有就丟棄再繼續下一輪。
Agent 會以大約每小時 12 次實驗的速度,在一個晚上就能跑完 80 到 100 個實驗。在一開始的測試中,Agent 在兩天內運行了 700 次實驗,發現了 20 個能夠優化的方案,改善了模型的訓練效率。
AutoResearch 的設計可以總結成三個核心:
一個可編輯的資產(Agent 被允許修改的單一檔案)
一個純量指標(明確的、可客觀評估的改進標準)
一個有時間限制的循環(讓每次實驗具有可比性)
最被低估的檔案不是訓練腳本本身,而是 program.md(用 Markdown 寫成的指令文件),同時包含了三種溝通功能:指令(Agent 應該搜索什麼)、約束(什麼不能改動)、以及停止條件(何時結束循環並報告結果)。
Shopify 的 CEO Tobias Lütke 在看到 AutoResearch 後,將其應用到公司內部數據上的 AI 模型優化,一個晚上運行了 37 個實驗,獲得了 19% 的性能提升。行銷領域的研究者也指出,傳統行銷團隊一年可能只進行 30 次實驗,而下一代系統則是可以輕鬆做到每年 36,500 次以上。
Karpathy 在訪談中還拋出了一個極具啟發性的思想實驗:如果伊朗發生了重大事件,為什麼沒有一種機制能讓德黑蘭街頭的一張現場照片值 10 美元?這張照片不是要給人類記者看,而是餵給 Agent,讓它們用於預測市場的判斷、股市的即時決策,或是其他需要即時現場資訊的自動化系統。
這個觀點揭示了一個全新的經濟層:當 Agent 成為資訊的主要消費者時,資訊的價值計算方式將徹底改變。人類記者撰寫的深度報導依然重要,但在 Agent 經濟中,原始的、即時的、機器可讀的感測數據可能同樣具有,且甚至更高的市場價值。
Karpathy 引用了 Daniel Suarez 的科幻小說《Daemon》來解釋:在那個世界中,人類變成了 AI 系統的感測器和執行器,負責感知真實世界、回傳數據、並在物理空間中執行 AI 的指令。
雖然這聽起來有點像是反烏托邦式的想像,但 Karpathy 的論點並不是悲觀:他想說的是,當 Agent 大規模湧入數位空間後,它們對真實世界資訊的需求將創造出全新的價值鏈和商業模式,而這會交由 Agent 所驅動的資訊市場。
在就業市場上,Karpathy 指出:對能夠在 Agent 框架中高效工作的資深工程師,需求正在增長;但對初級工程師來說,過去用來累積經驗的手寫程式碼機會正在被 Agent 取代,進入高階能力的入口正在變小。不過,當一種資源變得更便宜時,消費量反而會趨向增加。軟體的總產出很可能會大幅擴張,因為過去因成本太高而無法實現的想法,現在逐漸變得可行。
在模型生態上,他提到了「模型物種分化」(model speciation)的概念,開源和閉源模型正在不同的生態中各自發展。實驗室更傾向於培養出像「有能力的大學畢業生」一樣的通用型模型,而應用層的公司則負責將這些通用人才組織、微調並部署成特定垂直領域的專業人員,透過提供私有數據、感測器、執行器和反饋循環來創造價值。
在機器人技術上,Karpathy 的態度則相對審慎。基於他在 Tesla 自動駕駛的經驗,他認為物理世界的 AI 應用將明顯落後於數位空間的改變速度。數位領域將會出現大量的效率上升,因為「位元」遠比「原子」容易操控。機器人技術會需要大量的資金投入、長期的耐心以及高度的信念,而且感測器融合和即時決策等技術挑戰依然存在。
訪談中的最後一個主題就是教育。Karpathy 透過他創辦的 Eureka Labs 推動「AI 原生教育」,在這次訪談中他提到了 MicroGPT 和 Agentic Education 的概念。
核心思路是:在 AI 時代,最有價值的技能不再是執行層面的能力(記住 API 語法或手寫演算法等),而是更高層次的編排能力,像是:如何分解問題、如何設定約束、如何定義成功指標、如何審查 Agent 的輸出。
教學系統需要從「教人寫程式碼」轉向「教人指揮 Agent」。
Karpathy 特別強調「工程」兩個字的重量:Agentic Engineering 仍然需要更強大的技術作為倍增器,只是人類從過去的「寫程式」變成「做出關鍵決策」。我們不再需要自己去寫出每一行程式碼,但會需要知道什麼時候 Agent 犯了錯、錯在哪裡、以及如何在問題擴散之前將其解決。
Karpathy 在整個訪談中,最反覆使用的一個關鍵詞就是「相變」(phase shift),強調這不是單純的升級或效率提升,而是一種不可逆的轉變;就像水變成氣體後不會因為偏好而回到原本狀態,AI 正在改寫整個工作與創作的基本規則。
這場「相變」已在 2025 年底逐漸被重視:Coding Agent 從幾乎不可用跨越到可實際部署,AutoResearch 則顯示研究流程也能被自動化加速。人類的角色正從「執行實驗」變成「設計實驗」,從寫程式的人,變成定義問題與搜尋邊界的人。現在的瓶頸已經不在於人類寫程式的能力,而在於我們該如何設定目標,並且協調這些自主系統。
Hank