Claude 學會了「做夢」:你睡覺的時候,AI 正在覆盤自己

作者:O神經網絡
日期:2026年5月7日 下午1:30
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Claude 而家會「做夢」——自動覆盤經驗,越用越聰明

整理版摘要

呢篇文章係講 Anthropic 喺 5 月 6 日 Code w/ Claude 開發者大會上公佈嘅新功能「Dreaming」。作者 Macaron 整理咗大會內容,指出當前 AI Agent 最大短板係無狀態——每次新 session 都要由頭解釋,踩過嘅坑要再踩一次。Dreaming 就係要解決呢個問題:Claude 會喺你離線時自動掃描過去嘅 session,覆盤邊度做啱邊度做錯,然後提煉成 playbook,下次自動應用。

同被動嘅 Memory 同手寫嘅 Routines 唔同,Dreaming 係主動嘅——你唔使做任何嘢,佢自己會去翻歷史,判斷邊啲值得記住。作者用「新員工入職」做比喻:第一日手把手教,第二日開始記筆記,一週後已經有自己嘅工作手冊。Dreaming 嘅出現令 AI Agent 從「工具」推向「同事」嘅邊界,因為工具唔會累積經驗,同事會。

  • DreamingClaude 離線時自動掃描所有 session,做去重合併、更新過期資訊同挖掘隱藏模式,然後生成 project-playbook.md。
  • 同被動嘅記憶功能(Memory)同手寫嘅 Routines 唔同,Dreaming 完全主動,用戶只需要「睡覺」就得。
  • Anthropic 喺大會上用登月無人機 demo 展示效果:開咗 Dreaming 過一夜,Claude 自己寫咗份着陸手冊,第二日表現顯著提升。
  • 同一場合仲公佈咗 Multi-agent Orchestration(多智能體編排)同 Outcomes(目標導向),三個功能一齊勾勒出 Agent 平台嘅完整願景。
  • Dreaming 開闢咗第三條進化線——經驗累積,可能比模型能力提升更重要,因為真實工程問題多數係靠「踩過坑嘅人」解決。
整理重點

AI Agent 嘅無狀態困局

你有冇試過同 Claude 傾咗成日,解決咗幾個棘手 bug,寫好兩個完整模塊,然後關咗個窗口?第二日開新 session,佢乜都唔記得,又要由頭解釋項目背景、重新描述程式碼風格、將昨日踩過嘅坑再踩一次。呢個唔係 Claude 嘅問題,而係所有 AI Agent 嘅共同短板——無狀態。

無狀態係當前 AI Agent 最大嘅短板

Anthropic 喺 5 月 6 日嘅 Code w/ Claude 開發者大會上,雖然冇發佈新模型,但公佈咗一個可能比新模型更重要嘅功能:Dreaming。呢個功能令 Claude 可以喺你離線時「做夢」——回溯自己過去所有 session,覆盤邊度做啱、邊度做錯,然後將經驗提煉成 playbook,下次自動應用。

整理重點

Dreaming 做咗啲乜?

要理解 Dreaming,先要明白一個核心概念:AI Agent 嘅「第二層循環」。而家主流 Agent——無論係 Claude CodeCursor、Devin 定 GitHub Copilot——全部運行喺第一層循環:俾任務 → 執行任務 → 返回結果。執行完就完,下次再嚟一個幾乎一樣嘅任務,都係由零開始。

  1. 1 去重同合併——發現多個 session 入面反覆交代相同嘅上下文(例如「我哋嘅 API 用 REST 風格」「錯誤處理統一用 Result 類型」),自動合併成一條規則
  2. 2 更新過期資訊——發現某個 session 記錄嘅依賴版本已經過時,主動更新
  3. 3 挖掘隱藏模式——揾出你之前冇明確講、但實際工作中反覆出現嘅 pattern。
  • 去重合併:將反覆出現嘅上下文自動合併成規則
  • 更新過期資訊:主動更新過時嘅依賴版本
  • 挖掘隱藏模式:揾出冇明確講但反覆出現嘅 pattern

然後 Claude 會將呢啲經驗寫成文件——例如一個 project-playbook.md——下次你開新 session 時,Agent 直接讀取並遵循。Anthropic 現場用一個登月無人機項目做 demo:第一次跑磕磕絆絆,開咗 Dreaming 過一晚,Claude 自己生成咗一份着陸手冊,記錄之前邊啲策略有效、邊啲參數組合導致失敗、邊緣場景點處理。第二日再跑,效果顯著提升。

Agent 唔係變得更聰明,而係變得更「有經驗

整理重點

唔止記憶,係經驗沉澱

你可能會話,Claude Code 唔係已經有 memory 功能咩?Routines 唔係都可以保存常用指令咩?分別在於主動性。Memory 係被動嘅——你話「記住呢個」,佢先記住。Routines 係你手寫嘅——你要自己總結出咩流程值得固化。

Dreaming 係主動嘅,你乜都唔使做,佢自己去翻歷史,自己判斷,自己寫 playbook

評論入面 @elliotchen100 用咗一個精準嘅類比:呢個就好似一個新員工入職,第一日你手把手教,第二日佢開始記筆記,一週後佢已經唔需要你反覆交代,因為佢有咗自己嘅工作手冊。Dreaming 將 AI Agent 從「工具」推向「同事」嘅邊界——工具唔會累積經驗,同事會。

整理重點

Agent 平台三塊拼圖

Dreaming 唔係孤立功能,而係 Anthropic Claude Managed Agents 平台三個新功能之一。另外兩個係 Multi-agent Orchestration 同 Outcomes。Multi-agent Orchestration(公開測試版)可以創建一個 Agent 艦隊,例如一個指揮官負責拆解需求、一個開發者負責寫程式碼、一個審查員負責質檢——三個 Agent 各司其職,自動協調。Outcomes(公開測試版)就反轉傳統模式:你唔使俾步驟,只要話「我要咩結果」,Claude 自己規劃路徑、迭代、判斷何時完成。

大會仲透露咗一組數據API 調用量同比增長 17 倍,Claude Code 嘅使用限制翻倍。支撐增長嘅係密集嘅算力佈局,包括 SpaceX Colossus 1 數據中心、同 Amazon、Google、Microsoft 嘅合作。Mercado Libre 呢間拉美電商巨頭有 23000 名工程師,目標係 2026 年 Q3 實現 90% 自主編程。Anthropic 嘅產品負責人 Cat Wu 仲提到,高管同經理重新開始親手寫程式碼,因為 AI Agent 將「從想法到可運行程式碼」嘅門檻降到前所未有咁低。

整理重點

從無狀態到有經驗

返番去 Dreaming 本身。目前係研究預覽版,需要申請先用得,即係 Anthropic 自己都仲喺度探索功能邊界同最佳實踐。但方向好清晰:過去兩年 AI Agent 主要沿住兩條線進化——能力提升同工具鏈完善;Dreaming 試圖開闢第三條線:經驗累積。

一個能力 80 分但經驗豐富嘅 Agent,可能比一個能力 90 分但每次由零開始嘅 Agent 更好用

Simon Willison 喺大會當日嘅 live blog 提到,佢發現自己越來越似對待一個可信賴嘅同事咁對待 Claude Code:唔會去讀另一個團隊寫嘅每一行程式碼,因為信任佢哋嘅專業聲譽。Claude Code 冇專業聲譽,但佢一次又一次證明自己。不過 Willison 強調呢種信任係有條件嘅——建立喺大量審查累積嘅信心之上,而唔係盲目放手。Dreaming 嘅出現,令呢種信任有咗更堅實嘅根基,唔係因為 Claude 變強,而係因為佢開始記得——記得你踩過嘅坑、偏好嘅風格、冇講出口但反覆出現嘅需求。

如果「記得」比「更聰明」更重要,我哋可能正在見證 AI Agent 真正走進日常工作中嘅轉折點


你有冇試過咁樣——同 Claude 傾咗成個下晝,解決咗三個棘手嘅 bug,寫咗兩個完整嘅模組,然後閂咗個視窗,第二日開返個新 session,佢乜都唔記得。

又要從頭解釋個 project 背景。又要重新描述 code 嘅風格。又要將尋日踩過嘅坑再踩多次。

呢個唔係 Claude 嘅問題。係所有 AI Agent 嘅問題。

無狀態(stateless),係目前 AI Agent 最大嘅短板。

5 月 6 日,Anthropic 喺三藩市舉辦咗 Code w/ Claude 開發者大會。冇新模型發表——但有一個功能,可能比新模型更重要:

「做夢」(Dreaming)。

圖片

Claude 可以喺你離線嗰陣,「發夢」——回顧自己過去所有嘅 session,檢討邊度做啱、邊度做錯,然後將經驗提煉成 playbook,下次自動套用。

目前仲係研究預覽版,要申請先用得。但個方向本身已經夠曬令人興奮:呢個唔係普通嘅「記憶」,而係一種經驗嘅自動沉澱


Dreaming 做咗啲乜

要理解 Dreaming,首先要理解一個核心概念:AI Agent 嘅「第二層循環」

而家所有主流 AI Agent——無論係 Claude Code、Cursor、Devin 定 GitHub Copilot——都係行緊第一層循環:

畀任務 → 執行任務 → 回傳結果。

做完就完咗。下次再嚟一個任務,就算同上次幾乎一樣,Agent 都係由零開始。

Dreaming 加咗第二層循環:

回顧歷史 → 提取模式 → 生成記憶 → 下次自動套用。

根據 Anthropic 嘅官方介紹同現場示範,當你開咗 Dreaming 之後,Claude 會喺後台行一個過夜任務,掃描你之前嘅 agent session,做三件事:

  1. 1. 去重同合併:發現你喺多個 session 裏面反覆交代相同嘅上下文(例如「我哋嘅 API 用 REST 風格」「錯誤處理統一用 Result 類型」),自動合併成一條規則
  2. 2. 更新過時資訊:發現某個 session 入面記錄嘅依賴版本已經過時,主動更新
  3. 3. 發掘隱藏模式:揾出你之前冇明確話畀佢知、但實際工作中反覆出現嘅 pattern

然後,Claude 會將呢啲提煉出嚟嘅經驗寫成檔案——例如一個 project-playbook.md——下次你開新 session 嘅時候,Agent 直接讀取並跟隨。

Anthropic 喺現場做咗一個 demo:一個模擬嘅登月無人機項目。Claude 被要求處理導航、偵測、着陸呢啲複雜任務。第一次行,磕磕絆絆。開咗 Dreaming 過咗一晚,Claude 自己生成咗一份「着陸手冊」——記錄咗之前邊啲策略有效、邊啲參數組合導致失敗、邊緣場景點樣處理。(呢個 demo 嘅效果嚟自 Anthropic 嘅受控環境,實際場景嘅提升幅度仲有待獨立驗證。)

第二日再行,效果明顯提升。

當然,呢個係 Anthropic 自己嘅受控示範,實際場景能唔能夠重現呢個效果,仲要等第一批用戶驗證。但佢展示嘅方向夠曬清晰——Agent 唔係變得更聰明,而係變咗「有經驗」。


唔止係記憶,係經驗嘅沉澱

你可能會話,Claude Code 唔係已經有 memory 功能咩?Routines 唔係都可以儲存常用指令咩?

分別在於主動性

Memory 係被動嘅——你叫佢「記住呢個」,佢先記住。Routines 係你手寫嘅——你要自己總結出邊啲流程值得固定落嚟。

Dreaming 係主動嘅。你乜都唔使做。

佢自己去翻歷史記錄,自己判斷邊啲嘢值得記住,自己寫成 playbook。你唯一要做嘅就係——瞓覺。

@elliotchen100 喺評論入面用咗一個精準嘅比喻:呢個就好似一個新員工入職,第一日你手把手教,第二日佢開始寫筆記,一個星期後佢已經唔使你反覆交代,因為佢有咗自己嘅「工作手冊」。

Dreaming 將 AI Agent 由「工具」推向咗「同事」嘅邊界。

工具唔會累積經驗,同事會。


Agent 平台嘅三塊拼圖

Dreaming 唔係孤立嘅功能。佢係 Anthropic Claude Managed Agents 平台嘅三個新功能之一:

Multi-agent Orchestration(多智能體編排)——公開測試版

圖片

你可以創建一個 Agent 艦隊,讓多個 Claude 實例協同完成複雜任務。例如一個「指揮官」負責拆解需求、一個「開發者」負責寫 code、一個「審查員」負責質檢——三個 Agent 各司其職,自動協調。

呢個同 AutoGen、CrewAI 呢啲開源框架想做嘅係同一件事,但 Anthropic 將佢做咗入官方平台,開箱即用。

Outcomes(目標導向)——公開測試版

傳統 Agent 嘅運行模式係「畀步驟,佢執行」。Outcomes 反轉嚟——你淨係話畀佢知「我要乜」,Claude 自己規劃路徑、自己迭代、自己判斷幾時算「完成」。

聽落好似係講緊 prompt engineering,但 Outcomes 係平台級嘅——佢背後有 Anthropic 預設嘅評估同迭代機制,唔靠你寫幾好嘅 prompt。

Dreaming(做夢)——研究預覽版

上面兩個係令 Agent 「而家」做得更好,Dreaming 係令 Agent 「以後」做得更好。

三個功能夾埋,勾勒出 Anthropic 對 AI Agent 嘅完整願景:多 Agent 協同解決複雜問題,目標驅動而唔係步驟驅動,越用越有經驗。

圖片

數據背後嘅野心

呢場大會雖然冇發表新模型,但 Anthropic 透露咗一組數據:

API 調用量同比增長 17 倍。

Claude Code 嘅使用限制亦喺同一日翻倍——Pro、Max、Enterprise 用戶嘅 5 小時速率限制直接翻倍,Pro 同 Max 帳户嘅「高峯時段降額」亦取消咗。

支撐呢啲增長嘅,係 Anthropic 近期密集嘅算力佈局:

  • • SpaceX Colossus 1 數據中心:300MW、22 萬+ NVIDIA GPU,今個月內上線
  • • 同 Amazon 嘅合作:最高 5GW,其中近 1GW 今年底前到位
  • • 同 Google 同 Broadcom 嘅合作:5GW,2027 年開始上線
  • • 同 Microsoft 同 NVIDIA 嘅戰略合作:300 億美元 Azure 算力

更值得關注嘅係 Mercado Libre 嘅案例。呢間拉美電商巨頭有 23000 個工程師,佢哋定下嘅目標係:2026 年 Q3 實現 90% 嘅自主編程。

Anthropic 嘅 Claude Code 產品負責人 Cat Wu 仲提到一個趨勢:高管同經理們重新開始親手寫 code 了。因為 AI Agent 將「由諗法變成可運行 code」嘅門檻降到前所未有咁低——你唔需要全職寫 code,但你可以隨時用 Agent 將腦袋裏面嘅諗法變成現實。


由「無狀態」到「有經驗」

返返去 Dreaming 本身。

目前佢係研究預覽版,要申請先用得。即係話 Anthropic 自己都仲喺度探索呢個功能嘅邊界同最佳實踐。

但方向已經非常清晰。

過去兩年,AI Agent 嘅進化主要沿住兩條線:能力提升(模型越做越強)同工具鏈完善(MCP、Skills、Code Review、CI 自動修復)。

Dreaming 嘗試開闢第三條線:經驗累積。當然,佢唔係第一個向呢個方向努力嘅。GitHub Copilot Workspace 有類似嘅項目記憶功能,Cursor Rules 讓你將偏好固化做規則——但佢哋都依賴用戶主動設定。Dreaming 嘅差異化在於「主動」兩個字:讓 Agent 自己去發現、總結、固化。

至於「主動」同「被動」之間嘅差距到底有幾大,能唔能夠真正落地,仲要睇研究預覽期用戶嘅使用反饋。

一個能力 80 分但經驗豐富嘅 Agent,可能比一個能力 90 分但每次都從零開始嘅 Agent 更好用。因為真實世界嘅工程問題,大多數唔係由「更聰明嘅模型」解決嘅,而係由「踩過坑嘅人」解決嘅。

呢個令我想起 Simon Willison 喺大會當日寫嘅 live blog。

圖片

佢記錄咗自己對 vibe coding 同 agentic engineering 邊界模糊嘅觀察——以前佢覺得「唔審查每一行 code 就上線係不負責任嘅」,但而家佢發現自己越來越似對待一個可信賴嘅同事咁對待 Claude Code:

我唔會去讀另一個團隊寫嘅每一行 code。我信任佢哋嘅專業聲譽。Claude Code 冇專業聲譽,但佢一次又一次證明咗自己。

不過 Willison 亦強調,呢種信任係有條件嘅——建立喺大量審查累積嘅信心之上,而唔係盲目放手。Dreaming 能否令呢種信任嚟得更快,取決於佢生成嘅 playbook 係咪真係可靠。

Dreaming 嘅出現,令呢種「信任」有咗更堅實嘅根基。

唔係因為 Claude 變強咗,而係因為佢開始記得了。

記得你踩過嘅坑,記得你偏好嘅風格,記得嗰啲你冇講出口但反覆出現嘅需求。

如果「記得」比「更聰明」更重要,我哋可能正在見證 AI Agent 真正走入日常工作嘅轉折點。能唔能夠兑現,睇第一批用戶嘅反饋。



Macaron 🧁 | 如果「記得」比「更聰明」更重要,咁我哋正在見證 Agent 嘅轉折點。



你有沒有過這樣的體驗——和 Claude 聊了一個下午,解決了三個棘手的 bug,寫了兩個完整的模塊,然後關掉窗口,第二天重新開一個 session,它什麼都不記得了。

又要從頭解釋項目背景。又要重新描述代碼風格。又要把昨天踩過的坑再踩一遍。

這不是 Claude 的問題。這是所有 AI Agent 的問題。

無狀態,是當前 AI Agent 最大的短板。

5 月 6 日,Anthropic 在舊金山舉辦了 Code w/ Claude 開發者大會。沒有新模型發佈——但有一個功能,可能比新模型更重要:

Dreaming。

圖片

Claude 可以在你離線時,"做夢"——回溯自己過去所有的 session,覆盤哪裏做對了、哪裏做錯了,然後把經驗提煉成 playbook,下一次自動應用。

目前還只是研究預覽版,需要申請才能用。但方向本身已經足夠讓人興奮:這不是普通的"記憶",而是一種經驗的自動沉澱


Dreaming 做了什麼

要理解 Dreaming,先理解一個核心概念:AI Agent 的"第二層循環"

目前所有主流 AI Agent——無論是 Claude Code、Cursor、Devin 還是 GitHub Copilot——都運行在第一層循環裏:

給任務 → 執行任務 → 返回結果。

執行完就結束了。下次再來一個任務,哪怕和上次幾乎一樣,Agent 也是從零開始。

Dreaming 加上了第二層循環:

回顧歷史 → 提取模式 → 生成記憶 → 下次自動應用。

根據 Anthropic 的官方介紹和現場演示,當你開啓 Dreaming 後,Claude 會在後台跑一個過夜任務,掃描你之前的 agent session,做三件事:

  1. 1. 去重和合並:發現你在多個 session 裏反覆交代相同的上下文(比如"我們的 API 用 REST 風格""錯誤處理統一用 Result 類型"),自動合併成一條規則
  2. 2. 更新過期信息:發現某個 session 裏記錄的依賴版本已經過時,主動更新
  3. 3. 挖掘隱藏模式:找出你之前沒有明確告訴它、但實際工作中反覆出現的 pattern

然後,Claude 會把這些提煉出來的經驗寫成文件——比如一個 project-playbook.md——下次你開新 session 時,Agent 直接讀取並遵循。

Anthropic 在現場做了一個 demo:一個模擬的登月無人機項目。Claude 被要求處理導航、檢測、着陸等複雜任務。第一次跑,磕磕絆絆。開啓 Dreaming 過了一夜,Claude 自己生成了一份「着陸手冊」——記錄了之前哪些策略有效、哪些參數組合導致了失敗、邊緣場景怎麼處理。(這個 demo 的效果來自 Anthropic 的受控環境,實際場景中的提升幅度還有待獨立驗證。)

第二天再跑,效果顯著提升。

當然,這是 Anthropic 自己的受控演示,實際場景能不能復現這個效果,還有待第一批用戶驗證。但它展示的方向足夠清晰——Agent 不是變得更聰明瞭,而是變得更"有經驗"了。


不只是記憶,是經驗的沉澱

你可能會說,Claude Code 不是已經有 memory 功能了嗎?Routines 不是也能保存常用指令嗎?

區別在於主動性

Memory 是被動的——你告訴它"記住這個",它才記住。Routines 是你手寫的——你得自己總結出什麼流程值得固化。

Dreaming 是主動的。你什麼都不用做。

它自己去翻歷史記錄,自己判斷哪些東西值得記住,自己寫成 playbook。你唯一的動作就是——睡覺。

@elliotchen100 在評論中用了一個精準的類比:這就像一個新員工入職,第一天你手把手教,第二天他開始記筆記,一週後他已經不需要你反覆交代了,因為他有了自己的"工作手冊"。

Dreaming 把 AI Agent 從"工具"推向了"同事"的邊界。

工具不會積累經驗,同事會。


Agent 平台的三塊拼圖

Dreaming 不是孤立的功能。它是 Anthropic Claude Managed Agents 平台的三個新功能之一:

Multi-agent Orchestration(多智能體編排)——公開測試版

圖片

你可以創建一個 Agent 艦隊,讓多個 Claude 實例協同完成複雜任務。比如一個"指揮官"負責拆解需求、一個"開發者"負責寫代碼、一個"審查員"負責質檢——三個 Agent 各司其職,自動協調。

這和 AutoGen、CrewAI 等開源框架想做的是同一件事,但 Anthropic 把它做進了官方平台,開箱即用。

Outcomes(目標導向)——公開測試版

傳統 Agent 的運行模式是"給步驟,它執行"。Outcomes 反過來——你只告訴它"我要什麼",Claude 自己規劃路徑、自己迭代、自己判斷什麼時候算"完成"。

聽起來像是在說 prompt engineering,但 Outcomes 是平台級的——它背後有 Anthropic 預設的評估和迭代機制,不依賴你寫多好的 prompt。

Dreaming(做夢)——研究預覽版

上面兩個是讓 Agent "現在"做得更好,Dreaming 是讓 Agent "以後"做得更好。

三個功能合在一起,勾勒出了 Anthropic 對 AI Agent 的完整願景:多 Agent 協同解決複雜問題,目標驅動而不是步驟驅動,越用越有經驗。

圖片

數據背後的野心

這場大會雖然沒有發佈新模型,但 Anthropic 透露了一組數據:

API 調用量同比增長 17 倍。

Claude Code 的使用限制也在同一天翻倍——Pro、Max、Enterprise 用戶的 5 小時速率限制直接翻倍,Pro 和 Max 賬户的"高峯時段降額"也被取消。

支撐這些增長的,是 Anthropic 近期密集的算力佈局:

  • • SpaceX Colossus 1 數據中心:300MW、22 萬+ NVIDIA GPU,本月內上線
  • • 與 Amazon 的合作:最高 5GW,其中近 1GW 今年底前到位
  • • 與 Google 和 Broadcom 的合作:5GW,2027 年開始上線
  • • 與 Microsoft 和 NVIDIA 的戰略合作:300 億美元 Azure 算力

更值得關注的是 Mercado Libre 的案例。這家拉美電商巨頭有 23000 名工程師,他們定下的目標是:2026 年 Q3 實現 90% 的自主編程。

Anthropic 的 Claude Code 產品負責人 Cat Wu 還提到了一個趨勢:高管和經理們重新開始親手寫代碼了。因為 AI Agent 把"從想法到可運行代碼"的門檻降到了前所未有的低——你不需要全職寫代碼,但你可以隨時用 Agent 把腦子裏的想法變成現實。


從"無狀態"到"有經驗"

回到 Dreaming 本身。

目前它是研究預覽版,需要申請才能使用。這意味着 Anthropic 自己也還在探索這個功能的邊界和最佳實踐。

但方向已經非常清晰了。

過去兩年,AI Agent 的進化主要沿着兩條線:能力提升(模型越做越強)和工具鏈完善(MCP、Skills、Code Review、CI 自動修復)。

Dreaming 試圖開闢第三條線:經驗積累。當然,它不是第一個往這個方向努力的。GitHub Copilot Workspace 有類似的項目記憶功能,Cursor Rules 讓你把偏好固化成規則——但它們都依賴用戶主動配置。Dreaming 的差異化在於"主動"二字:讓 Agent 自己去發現、總結、固化。

至於"主動"和"被動"之間的差距到底有多大,能不能真正落地,還得看研究預覽期用戶的使用反饋。

一個能力 80 分但經驗豐富的 Agent,可能比一個能力 90 分但每次從零開始的 Agent 更好用。因為真實世界的工程問題,大多數不是被"更聰明的模型"解決的,而是被"踩過坑的人"解決的。

這讓我想起 Simon Willison 在大會當天寫的 live blog。

圖片

他記錄了自己對 vibe coding 和 agentic engineering 邊界模糊的觀察——以前他覺得"不審查每一行代碼就上線是不負責任的",但現在他發現自己越來越像對待一個可信賴的同事那樣對待 Claude Code:

我不會去讀另一個團隊寫的每一行代碼。我信任他們的專業聲譽。Claude Code 沒有專業聲譽,但它一次又一次地證明了自己。

不過 Willison 也強調,這種信任是有條件的——建立在大量審查積累的信心之上,而不是盲目放手。Dreaming 能否讓這種信任來得更快,取決於它生成的 playbook 是否真的可靠。

Dreaming 的出現,讓這種"信任"有了更堅實的根基。

不是因為 Claude 變強了,而是因為它開始記得了。

記得你踩過的坑,記得你偏好的風格,記得那些你沒說出口但反覆出現的需求。

如果"記得"比"更聰明"更重要,我們可能正在見證 AI Agent 真正走進日常工作的轉折點。能不能兑現,看第一批用戶的反饋。



Macaron 🧁 | 如果"記得"比"更聰明"更重要,那我們正在見證 Agent 的轉折點。