Claude Fable 5最強深度實測!5個小時,我把想了很久的Mac App做出來了!

作者:花叔
日期:2026年6月10日 下午4:07
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Claude Fable 5實測:5小時內用佢做出一個Mac App,穩定到唔使返工

整理版摘要

呢篇文章嘅作者係一個唔識寫code嘅人,佢所有產品都係靠AI整出嚟。佢一直以嚟有個困擾:AI agent起咗好多項目,但文件散落喺Finder同終端之間,好難聯動。佢想整一個「駕駛艙」,左邊睇文件右邊跑agent,agent改咗文件即時睇到。呢個App就叫「翻箱」(FanBox),一個專為vibe coding而設嘅桌面工具。

Anthropic最近發布咗Claude Fable 5,其實係Mythos 5嘅安全版,同一個底層模型但加咗安全過濾,公開賣。而且由而家到6月22日,Pro同Max用戶可以免費用到。作者決定攞呢個新模型去實現佢諗咗好耐嘅App。

結果係,佢用咗大約5個鐘,由Opus 4.8打底到Fable 5大改,成功打包出一個叫「翻箱」嘅Mac App。佢最深刻嘅體會係Fable 5唔係快咗,而係犯錯少咗——以前要來回改好多次嘅問題,而家一輪搞掂。例如圖片縮略圖卡頓,以前要改三四輪,而家一次定位兩個根因,一輪搞掂。佢仲舉咗終端中文亂碼嘅冷門問題,Fable 5直接指出要用unicode11 addon。作者認為呢個進步主要歸功於強制開啟嘅思考模式,令模型決定之前諗耐啲,減少估錯。佢認為Fable 5係「自Opus 4.5以來最大嘅一步」,建議訂閲用戶把握免費期。

  • Fable 5同Mythos 5同底層,分別只在安全護欄;Fable 5公開賣,免費到6月22日。
  • 作者用Fable 5開發咗翻箱(FanBox),一個本地文件管理+終端+AI agent聯動嘅桌面App,5個鐘由構思到打包。
  • 對比Opus 4.8,Fable 5最大改進係判斷力同debug能力:以前要五輪拉鋸嘅問題,而家一輪搞掂。
  • 強制開啟嘅思考模式令回覆慢咗但準咗,省掉嘅係返工時間。
  • 作者建議訂閲用戶喺6月23日前用Claude CodeFable 5,攞一個擱置嘅項目試下。
值得記低
連結 github.com

翻箱 FanBox GitHub 倉庫

開源嘅 agent box 桌面應用,用 Electron 構建,支援文件預覽、終端聯動、Code agent 指揮。

筆記

Claude Code 從入門到精通

作者嘅橙皮書,喺微信讀書可以睇到,適合未用過 Claude Code 嘅讀者。

整理重點

Claude Fable 5 係咩嚟?

Anthropic喺6月9日發布咗Claude Fable 5,佢同Mythos 5係同一個底層模型,分別只在安全分類器——你可以理解成模型門口嘅安檢員。Mythos 5安檢鬆,只畀受邀機構;Fable 5安檢嚴,公開發售。

同一個底層模型,分別只在安全分類器

  1. 1 上下文窗口1M token,單次輸出最高128K。
  2. 2 思考模式強制開啓,關都關唔掉。
  3. 3 API價格係Opus 4.8嘅兩倍:$10/百萬輸入,$50/百萬輸出。
整理重點

一個唔識寫code嘅人嘅痛點

作者靠AI開發產品,但文件管理係大問題——Finder睇到文件但餵唔到AI,終端餵到AI但睇唔到文件。佢一直想有個工具將兩者聯動。

文件系統同agent之間嘅聯動

  1. 1 輕鬆點開agent起嘅項目,睇到文件內容。
  2. 2 寫作類項目需要順手編輯器,方便反覆改稿。
  3. 3 繪圖設計類任務,要一格格睇agent嘅生成結果。
  4. 4 agent出問題時,容易截圖同拖參考文件去餵畀佢。
整理重點

從Opus到Fable:5個鐘嘅開發實錄

作者先用Opus 4.8打底,但核心體驗一直跑唔通。第二日轉用Fable 5大改,同一個項目前後對比好明顯——Fable 5唔係快咗,而係犯錯少咗。

一次改完,無返工

舉例:圖片縮略圖卡頓問題,作者只係講咗一句「圖多嘅目錄點擊好卡」,Fable 5就定位出兩個疊加根因——縮略圖加載原圖整個文件、每次點擊都重建檔案網格——然後一次改完,點擊響應降到0.1秒內。

一輪,沒有返工

另一個例子:終端中文目錄名亂碼,涉及xterm.js嘅寬字符處理,Fable 5直接指出要用unicode11 addon,仲提醒係實驗性API要顯式開啓。

偏門問題準確命中

整理重點

翻箱(FanBox)係點樣嘅?

翻箱英文叫FanBox,你可以當佢係一個agent box,將「揾文件 → 跑agent → 睇佢改咗咩」收埋一個窗口。設計目標係每種文件「長得像自己」,唔點開就知係咩。

每種文件長得像自己,唔點開就知係咩

  • 活的儀表盤:agent每寫一個文件,文件卡片會盪開漣漪、按改動頻率發光。
  • 會話回放:變更面板有播放鍵,拖時間軸重現agent改文件嘅步驟。
  • 拖文件喂agent:從文件列表拖入終端,路徑自動插入;喺預覽中選中文字,一鍵發送畀agent。
  • ⌘K找回:記得片段就能搜到文件,文件夾右上角自動標註項目類型。
  • 原地輕改:代碼用MonacoMarkdown所見即所得、圖片可直接標註畫箭頭。
整理重點

總結:你個擱置嘅項目可能就差一個週末

翻箱已經開源,安裝包打咗出嚟,作者話佢係個解決自己問題嘅初級版本,預計好長一段時間都係個人項目。佢鼓勵讀者:如果你係ProMax用戶,6月23日之前喺Claude Code將模型切到Fable 5,攞一個一直想做但覺得麻煩嘅項目試下。

5個鐘,由想法到安裝包

仲未用過Claude Code嘅,可以從作者嘅橙皮書《Claude Code: 從入門到精通》開始,微信讀書就揾到。

朝早一醒,Anthropic又又又出新模型:Claude Fable 5。

Claude 5出咗係幾好,但點解又要整多個Fable出嚟...Opus、Sonnet、Haiku呢套名仲唔夠煩咩。

同埋,點解唔叫Mythos??Anthropic喺呢個細節上真係好有矽谷大公司亂咁改名嘅作風。

不過,鬧還鬧,呢個模型真係幾勁。一句講曬佢係咩:Fable 5,就係加咗安全護欄嘅Mythos。Mythos係Anthropic之前只開放俾政府同受邀機構、外界只聽過個名嘅模型,今次加咗護欄,公開發售。

同埋你最需要知道嘅係:由而家到6月22號,Fable 5直接包喺Claude訂閲入面,Pro同Max用戶免費任用。6月23號開始佢會從訂閲額度度移除,想繼續用就要另外增值、按量計費。想白嫖嘅話,得呢兩個禮拜嘅窗口。

能力方面睇一張圖就夠:

圖片

SWE-Bench Pro呢個測試,係將真實開源項目嘅bug掟俾模型自己改。80.3%意思係十個真實bug佢可以獨立改好八個,第二名俾佢拋離11個百分點。官方公告仲不斷強調一句:任務越長、越複雜,佢嘅領先越大。最有畫面嘅官方案例係Stripe:5000萬行Ruby碼庫搬遷,團隊本來預計要兩個月,Fable 5一日搞掂。

圖片

呢篇文章前半將呢個模型講清楚,後半俾你睇一個其他地方睇唔到嘅實測:我用佢將一個諗咗好耐嘅App真係整咗出嚟,由開工到打包好安裝包,一日。

我用咗大約5個鐘之後嘅感覺係:Fable 5寫碼嘅穩定性比以前強咗好多,只要你將需求或者你想解決嘅問題講清楚,基本上佢就可以一次過幫你搞掂。

Fable係咩來頭

今年4月,Anthropic啟動咗一個叫Project Glasswing嘅項目,將Mythos開放俾政府網絡防禦部門同關鍵基建供應商。只有受邀機構先用得,外界只聽過個名。

6月9號今次發布,其實係同時出咗兩個模型:Claude Mythos 5同Claude Fable 5。兩者係同一個底層模型,分別只係安全分類器。呢樣嘢你可以理解成企喺模型門口嘅安檢員,檢查出入嘅問題同回答,遇到生化武器、網絡攻擊呢類危險話題直接攔住。Mythos 5安檢鬆,繼續只俾受邀合作方;Fable 5安檢嚴,公開發售。官方嘅定義好直接:a Mythos-class model made safe for general use。

個名亦都係配套嘅:Mythos係希臘文嘅「神話」,Fable係拉丁文嘅「寓言」,一個希臘文一個拉丁文,都係講故仔。同一個故事,兩種講法,護欄嘅鬆緊直接寫咗落產品名度。

設計邏輯我明嘅,但都想鬧一句:Haiku、Sonnet、Opus呢套大中小,用戶好艱難先記得邊個打邊個,而家又走出嚟Fable同Mythos兩個新名,模型選擇器越來越似文學選修課。有情懷,但真係冇必要。乖乖哋叫Claude 5,天都唔會塌。

幾個指標順便講下:上下文窗口1M token,單次輸出最高128K,思考模式強制開咗、關都關唔到。呢個「關唔到」後面會再提,佢同我嘅使用體感直接有關。

貴唔貴?講下我今日嘅真實用量

API價格係討論得最多嘅地方:10/百萬輸入,10/百萬輸入,10/百萬輸入,50/百萬輸出,剛好係Opus 4.8嘅兩倍。目前喺Claude Code入面嘅消耗速度亦都會係Opus模型嘅2倍。

講下我自己嘅情況:我今日9點起身之後,一路同步做緊2-3個項目,全程Fable 5,200美元嘅Max版本到而家都未遇到限制。

不過有個前提,Anthropic喺發布模型嘅時候將用量reset咗一輪,等於俾咗所有人一張新卡。希望OpenAI快啲參與競爭,令呢種reset嚟得更勁。

至於6月23號之後,如果真係按API價格收費,咁真係會有點太貴。所以我的態度係:呢兩個禮拜死咁用,23號之後嘅事到時再算。

我手頭啱好有一個諗咗好耐嘅項目

模型講完。對我嚟講,判斷一個模型好唔好,標準得一個:可唔可以將我想做嘅嘢真係整出嚟

事情係咁嘅:我從來唔識寫碼,所有產品都係AI寫嘅。呢種工作方式有個好具體嘅副作用:AI幫你一個下午起十個項目,但佢哋散落喺唔同文件夾入面,個名認唔出,agent改咗咩嘢都睇唔到。

具體到每日嘅場景,我嘅需求其實好簡單:agent起好嘅項目,我想輕鬆㩒開睇;寫作類嘅項目好多,稿要反覆改,我需要一個順手嘅編輯器;繪圖同設計類嘅任務,我得一張張睇agent嘅生成結果;agent整出嚟嘅嘢出問題、唔符合我預期嘅時候,我希望更容易咁截圖、將參考文件拖入去餵俾佢。

呢啲事冇一件係寫碼,但每一件都卡喺文件系統同agent之間:Finder睇到文件、唔易喂agent,終端喂到agent、睇唔到文件。所以我每日就係喺Finder、Cursor、瀏覽器三個視窗之間來回切,揾一個昨日生成嘅文件要揾半日。

我一直想要嘅,係文件系統同agent之間有真正嘅聯動左邊瀏覽同預覽本機文件,右邊一個真終端跑coding agent,agent每改一個文件,左邊即刻著燈。一個vibe coding嘅駕駛艙。

之前整過一個網頁版嘅雛形,一個本地文件瀏覽頁,可以搜可以預覽,僅此而已。真正想要嘅部分全部卡喺後面:內嵌真終端、文件監聽、編輯器、打包簽名,呢個係一個完整桌面App嘅工程量。以前唔係做唔到,主要係改起嚟太折磨,我提一個需求要來回拉扯好多輪,諗諗嚇就放低咗。

Fable 5發布嗰日,我決定攞佢試嚇。

一日,由諗法到安裝包

時間線係咁嘅:

6月9號下晝我先用Opus 4.8做咗個基礎版本。Electron桌面殼、內嵌終端、文件×終端×預覽三方聯動。但有啲核心體驗一路未run順。

6月10號朝早,攞到Fable之後開始大改:代碼編輯器、Markdown所見即所得、圖片標註編輯、整個佈局重構。然後打包、簽名,生成dmg安裝包。

中間冇skip過驗收。我俾呢個項目定嘅交付標準係:5個獨立嘅AI subagent分別扮演重度vibe coder、原生審美設計師、零文檔新用戶、終端十年老兵、破壞性質量官,對住成品、真機截圖同代碼打分,全部≥90分而且冇紅線先算達標。第一輪已經俾人打回頭:審美踩紅線、終端健壯性唔夠、數據安全有漏洞。改完再審,總共搞咗四輪,先算過關。

佢唔係demo,亦唔係原型。佢裝咗喺我嘅Applications文件夾入面,我寫呢篇文章呢一刻,佢就開住。

圖片

右下角終端入面掛住嘅,正係Fable 5嘅上線通知。

翻箱FanBox:佢咩樣

App叫翻箱,英文名FanBox。你可以將佢讀成一個agent box:一個更好咁管理agent同文件系統嘅工具,將「揾文件 → 跑agent → 睇佢改咗咩」收埋入一個視窗。

設計目標係每種文件「似返佢自己」,唔㩒開就知係咩。

幾個我自己最常用嘅功能:

活嘅儀錶板。agent每寫一個文件,張文件卡片即刻盪開漣漪、按改動頻率發光。多個項目並行跑agent嘅時候,agent寫到邊,光就行到邊,「睇AI做嘢」第一次有現場感。

會話重播。變更面板入面有個播放掣,好似碌片咁拉時間軸,重現呢段時間agent一步步改咗邊啲文件。agent跑咗半小時長任務,返嚟拉一次就知佢做咗咩。

拖文件餵agent。從文件列表將文件或文件夾拖入終端,路徑自動插入輸入行;喺預覽入面揀中一段文字,㩒一下就發到終端俾agent做上下文。反過來,終端入面出現嘅文件路徑可以直接㩒,喺翻箱入面打開。

⌘K找回。記得個名片段就可以搜到文件同文件夾,文件夾卡片右上角自動標上node/web/py呢啲項目類型徽章,一個下晝起嘅十個項目一眼認出。

原地輕改。代碼同JSON用Monaco(VS Code同款內核),Markdown係Notion式所見即所得,圖片可以直接標註、畫箭頭、打碼。睇到邊改到邊,唔使再開一個編輯器。

呢篇文章就係喺翻箱入面寫嘅,左邊預覽草稿,右邊終端掛住Claude Code:

圖片

下面呢張係我自己堆滿截圖同錄屏嘅桌面,唔開終端agent視窗嘅情況下同finder冇太大分別:

圖片

agent啱啱喺一個文件夾入面改咗兩處,張卡片就咁樣著燈:

圖片

順帶一提,佢有三套皮膚,配色、字體、圖標、代碼高亮整體切換:熒光綠炭黑嘅終端風、奶油紙赤陶橙嘅檔案風、黑白紅嘅索引風。

圖片

我自己對呢個產品定義嘅邊界係:翻箱唔同Finder鬥文件管理,唔做插件唔做調試,重嘢繼續拋俾IDE。佢只係將「揾返 + 預覽 + 輕改 + 指揮agent」呢條鏈路做到順手。全部本地運行,零外網請求,數據唔出本機。

不過呢,佢而家仲係個好初步嘅版本,主要解決我自己嘅問題,審美同功能都按我自己嘅需要嚟,冇打算討好任何人。我估計好長一段時間,佢都會係我一個簡單嘅個人項目。

開發過程入面,Fable 5俾我嘅真實體感

返返去模型本身。今次開發前一日用Opus 4.8打底,後一日用Fable 5大改,同一個項目前後腳換咗兩代模型,分別好具體:唔係更快,係犯錯更少,一次過解決問題

舉個最典型嘅例子。翻箱嘅圖片縮略圖功能,初版喺圖多嘅文件夾入面㩒會lag幾秒。呢種性能問題以前係最折磨人嘅:模型估一個原因,改一版,好少少但冇解決,再估再改,三四輪落嚟代碼越來越亂。

今次我就描述咗一句「圖多嘅目錄㩒落好lag」。佢定位出兩個疊加嘅根因:縮略圖喺加載原圖整個文件,同埋每次㩒都喺重建整個文件網格。然後一次改曬:加咗一個帶緩存嘅縮略圖接口,㩒改做只切換選中樣式唔重建。㩒嘅反應降到0.1秒內,肉眼無感。一輪,冇返工。

類似嘅仲有終端入面中文目錄名亂碼嘅問題。呢個涉及xterm.js嘅寬字符處理,幾冷門㗎。佢直接指出要用unicode11呢個addon,仲提醒呢個係實驗性API需要顯式開啓。呢種準確命中偏門問題嘅瞬間,一日入面出現咗好多次。

打包階段更明顯。Electron打包喺國內網絡環境下係個連環坑:二進制下載被block、原生模塊編譯失敗、新版node令構建工具直接死。以前呢種環境問題可以搞足一晚,今次佢一路換鏡像、換編譯方案、調整打包配置,將一串坑都繞過曬,我全程只係負責睇住。

點解會咁?我估答案就藏喺前面嗰個「關唔到」度。Fable 5嘅思考模式係強制開咗,單個回覆明顯比Opus要等得耐。慢同準好可能係同一面銀嘅兩面:鬱手之前諗得耐,估錯率就低,估錯率低,就唔使返工。佢省嘅唔係打字時間,係返工。

講句老實話:我冇拎同一個問題去餵舊模型做對照實驗,上面呢啲係體感對比,唔係同題實測。但「以前五輪拉鋸、而家一輪解決」呢種分別,大到唔需要儀器都感覺到。

後來我見到Claude Code嘅作者Boris Cherny對Fable 5嘅評價:「自Opus 4.5以來最大嘅一步」,佢強調嘅都係判斷力同debug能力。同我嘅體感,完全對得埋。

最後

翻箱嘅安裝包已經打好咗,而且,已開源發布,你都可以拎我嘅開源碼去改出一個更適合你自己嘅agent box嚟👇

https://github.com/alchaincyf/fanbox

圖片

至於Fable 5,我嘅建議好簡單:如果你係Pro或Max訂閲用戶,6月23號之前,喺Claude Code入面將模型轉到Fable 5,拎一個你一直想做但覺得「太麻煩」嘅項目餵俾佢。免費額度你都有,我做翻箱就係用佢。

仲未上手過Claude Code嘅,可以從我嘅橙皮書《Claude Code: 從入門到精通》開始,微信讀書就睇到。

我想咗好耐嘅駕駛艙,由拎到Fable 5到完成MacOS應用打包,5個鐘。

你嗰個放低好耐嘅項目,話唔定就差一個咁樣嘅週末。


早上一覺醒來,Anthropic又又又發新模型了:Claude Fable 5。

Claude 5來了是挺好的,但是為什麼特麼又整出個Fable出來...Opus、Sonnet、Haiku這套名字還不夠煩人麼。

以及,為啥也不叫Mythos??A社在這個細節上還真是挺有硅谷大公司瞎特麼起名的風範的。

不過,吐槽歸吐槽,這個模型確實夠強的。一句話說清它是什麼:Fable 5,就是加了安全護欄的Mythos。Mythos是Anthropic那個之前只開放給政府和受邀機構、外界只聞其名的模型,這次加上護欄,公開發售了。

以及你最該知道的是:從現在到6月22日,Fable 5直接包含在Claude訂閲裏,Pro和Max用戶免費用。6月23日起它會從訂閲額度裏移除,想繼續用得另外充值、按量計費。想白嫖的話,只有這兩週窗口。

能力上看一張圖就夠了:

圖片

SWE-Bench Pro這個測試,是把真實開源項目裏的bug丟給模型自己修。80.3%意思是十個真實bug它能獨立修好八個,第二名被甩開11個百分點。官方公告還反覆強調一句:任務越長、越複雜,它的領先越大。最有畫面感的官方案例是Stripe:5000萬行Ruby代碼庫遷移,團隊原本評估要兩個月,Fable 5一天跑完。

圖片

這篇文章前一半把這個模型講清楚,後一半給你看一個別處看不到的實測:我用它把一個想了很久的App真的做了出來,從動手到打包好安裝包,一天。

我大概用了5個小時後的感受是:Fable 5寫代碼的穩定性比之前強了不少,只要你能把需求或者說你要解決的問題說清楚,基本上它就能給你一次性搞定。

Fable是什麼來歷

今年4月,Anthropic啓動了一個叫Project Glasswing的項目,把Mythos開放給政府網絡防禦部門和關鍵基礎設施提供方。只有受邀機構能用,外界只聞其名。

6月9日這次發佈,其實是同時發了兩個模型:Claude Mythos 5和Claude Fable 5。兩者是同一個底層模型,區別只在安全分類器。這東西你可以理解成站在模型門口的安檢員,檢查進出的問題和回答,碰到生化武器、網絡攻擊這類危險話題直接攔下。Mythos 5安檢松,繼續只給受邀合作方;Fable 5安檢嚴,公開發售。官方的定義很直接:a Mythos-class model made safe for general use。

名字也是配套的:Mythos是希臘語的「神話」,Fable是拉丁語裏的「寓言」,一個希臘語一個拉丁語,都是講故事。同一個故事,兩種講法,護欄的鬆緊直接寫進了產品名裏。

設計邏輯我看懂了,但還是想吐槽一句:Haiku、Sonnet、Opus這套大中小,用戶好不容易才記住誰是誰,現在又冒出來Fable和Mythos兩個新名字,模型選擇器越來越像文學選修課。有情懷,但真沒必要。老老實實叫Claude 5,天塌不下來。

幾個指標順手列一下:上下文窗口1M token,單次輸出最高128K,思考模式強制開啓、關都關不掉。這個「關不掉」後面還會提到,它和我的使用體感直接相關。

貴不貴?說說我今天的真實用量

API價格是討論最多的地方:10/百萬輸入,10/百萬輸入,10/百萬輸入,50/百萬輸出,正好是Opus 4.8的兩倍。目前在Claude Code中的消耗速度也會是Opus模型的2倍。

說說我自己的情況:我今天9點起牀之後,一直同步在做2-3個項目,全程Fable 5,200美元的Max版本到現在沒遇到限制。

不過有個前提,Anthropic在發佈模型的時候把用量reset了一波,相當於給所有人發了張新卡。希望OpenAI趕緊特麼參與競爭,讓這種reset來得更猛一些。

至於6月23號之後,如果真按API價格收費的話,那確實會有點太貴了。所以我的態度是:這兩週先往死裏用,23號之後的事23號再說。

我手上正好壓着一個想了很久的項目

模型講完了。對我來說,判斷一個模型好不好,標準只有一個:能不能把我想做的東西真的做出來

事情是這樣的:我從來不會寫代碼,所有產品都是AI寫的。這種工作方式有個很具體的副作用:AI幫你一個下午起十個項目,但它們散落在各個文件夾裏,名字認不出,agent改了什麼也看不見。

具體到每天的場景,我的需求其實很樸素:agent起好的項目,我想輕鬆點開看;寫作類的項目很多,稿子要反覆改,我需要一個順手的編輯器;繪圖和設計類的任務,我得一張張查看agent的生成結果;agent做出來的東西出問題、不符合我預期的時候,我希望能更容易地截圖、把參考文件拖進去投餵給它。

這些事沒有一件是寫代碼,但每一件都卡在文件系統和agent中間:Finder看得見文件、不好喂agent,終端喂得了agent、看不見文件。所以我的日常就是在Finder、Cursor、瀏覽器三個窗口之間來回切,找一個昨天生成的文件要翻半天。

我一直想要的,是文件系統和agent之間有真正的聯動:左邊瀏覽和預覽本機文件,右邊一個真的終端跑coding agent,agent每改一個文件,左邊當場亮起來。一個vibe coding的駕駛艙。

之前搭過一個網頁版的雛形,一個本地文件瀏覽頁,能搜能預覽,僅此而已。真正想要的部分全卡在後面:內嵌真終端、文件監聽、編輯器、打包簽名,這是一個完整桌面App的工程量。以前不是做不了,主要是改起來太磨人,我提一個需求要來回拉扯很多輪,想想就先放下了。

Fable 5發佈當天,我決定拿它試試。

一天,從想法到安裝包

時間線是這樣的:

6月9日下午我先拿Opus 4.8做了個基礎的版本。Electron桌面殼、內嵌終端、文件×終端×預覽三方聯動。但是有些核心的體驗一直沒跑通。

6月10日早上,拿到Fable後開啓大改:代碼編輯器、Markdown所見即所得、圖片標註編輯、整個佈局重構。然後打包、簽名,生成dmg安裝包。

中間沒有跳過驗收。我給這個項目定的交付標準是:5個獨立的AI subagent分別扮演重度vibe coder、原生審美設計師、零文檔新用戶、終端十年老兵、破壞性質量官,對着成品、真機截圖和代碼打分,全部≥90分且無紅線才算達標。第一輪就被打回來了:審美踩紅線、終端健壯性不夠、數據安全有口子。修完再審,總共折騰了四輪,才算過關。

它不是demo,也不是原型。它裝在我的Applications文件夾裏,我寫這篇文章的此刻,它就開着。

圖片

右下角終端裏掛着的,正好是Fable 5的上線通知。

翻箱FanBox:它長什麼樣

App叫翻箱,英文名FanBox。你也可以把它讀成一個agent box:一個更好地管理agent和文件系統的工具,把「找文件 → 跑agent → 看它改了什麼」收進一個窗口。

設計目標是每種文件「長得像它自己」,不點開就知道是什麼。

幾個我自己最常用的能力:

活的儀表盤。agent每寫一個文件,那張文件卡片當場盪開漣漪、按改動頻率發光。多個項目並行跑agent的時候,agent寫到哪,光就走到哪,「看AI幹活」第一次有了現場感。

會話回放。變更面板裏有個播放鍵,像刷視頻一樣拖時間軸,重現這段時間agent一步步改了哪些文件。agent跑了半小時長任務,回來拖一遍就知道它都幹了什麼。

拖文件喂agent。從文件列表把文件或文件夾拖進終端,路徑自動插進輸入行;在預覽裏選中一段文字,點一下就發到終端給agent當上下文。反過來,終端裏出現的文件路徑可以直接點擊,在翻箱裏打開。

⌘K找回。記得名字片段就能搜到文件和文件夾,文件夾卡片右上角自動標上node/web/py這些項目類型徽章,一下午起的十個項目一眼認出來。

原地輕改。代碼和JSON用Monaco(VS Code同款內核),Markdown是Notion式所見即所得,圖片可以直接標註、畫箭頭、打碼。看到哪改到哪,不用再開一個編輯器。

這篇文章就是在翻箱裏寫的,左邊預覽草稿,右邊終端掛着Claude Code:

圖片

下面這張是我自己堆滿截圖和錄屏的桌面,不開啓終端agent窗口的情況下和finder沒太大區別:

圖片

agent剛在一個文件夾裏改了兩處,那張卡片就這樣亮起來:

圖片

順便,它有三套皮膚,配色、字體、圖標、代碼高亮整體切換:熒光綠炭黑的終端風、奶油紙赤陶橙的檔案風、黑白紅的索引風。

圖片

我自己對這個產品定義的邊界是:翻箱不跟Finder拼文件管理,不做插件不做調試,重活繼續甩給IDE。它只把「找回 + 預覽 + 輕改 + 指揮agent」這一條鏈路做到順手。全部本地運行,零外網請求,數據不出本機。

不過呢,它現在還是個挺初級的版本,主要解決我自己的問題,審美和功能都按我自己的需要來,沒打算討好誰。我估計很長一段時間,它都會是我的一個簡單的個人項目。

開發過程裏,Fable 5給我的真實體感

回到模型本身。這次開發前一天用Opus 4.8打底,後一天用Fable 5大改,同一個項目前後腳換了兩代模型,差別很具體:不是更快,是犯錯更少,一次就把問題解決

舉個最典型的例子。翻箱的圖片縮略圖功能,初版在圖多的文件夾裏點擊會卡好幾秒。這種性能問題以前是最磨人的:模型猜一個原因,改一版,好一點但沒解決,再猜再改,三四輪下來代碼越來越亂。

這次我就描述了一句「圖多的目錄點擊很卡」。它定位出來兩個疊加的根因:縮略圖在加載原圖整個文件,以及每次點擊都在重建整個文件網格。然後一次改完:加了一個帶緩存的縮略圖接口,點擊改成只切換選中樣式不重建。點擊響應降到0.1秒內,肉眼無感。一輪,沒有返工。

類似的還有終端裏中文目錄名亂碼的問題。這涉及xterm.js的寬字符處理,挺冷門的。它直接指出要用unicode11這個addon,還提醒這是個實驗性API需要顯式開啓。這種準確命中偏門問題的瞬間,一天裏出現了很多次。

打包階段更明顯。Electron打包在國內網絡環境下是個連環坑:二進制下載被擋、原生模塊編譯失敗、新版node讓構建工具直接掛掉。以前這種環境問題能耗掉一晚上,這次它一路換鏡像、換編譯方案、調整打包配置,把一串坑都繞過去了,我全程只負責看着。

為什麼會這樣?我猜答案就藏在前面那個「關不掉」裏。Fable 5的思考模式是強制開啓的,單個回覆明顯比Opus要等得久。慢和準很可能是同一枚硬幣的兩面:動手之前想得久,猜錯率就低,猜錯率低,就不用返工。它省掉的不是打字時間,是返工。

說句誠實的:我沒拿同一個問題去喂舊模型做對照實驗,上面這些是體感對比,不是同題實測。但「以前五輪拉鋸、現在一輪解決」這種差別,大到不需要儀器。

後來我看到Claude Code的作者Boris Cherny對Fable 5的評價:「自Opus 4.5以來最大的一步」,他強調的也是判斷力和debug能力。跟我的體感,完全對上了。

最後

翻箱的安裝包已經打好了,並且,已開源發佈,你也可以拿我的開源代碼去改出一個更適合你自己的agent box來👇

https://github.com/alchaincyf/fanbox

圖片

至於Fable 5,我的建議很簡單:如果你是Pro或Max訂閲用戶,6月23日之前,在Claude Code裏把模型切到Fable 5,拿一個你一直想做但覺得「太麻煩」的項目餵給它。免費額度你也有,我做翻箱用的就是它。

還沒上手過Claude Code的,可以從我的橙皮書《Claude Code: 從入門到精通》開始,微信讀書就能看。

我想了很久的駕駛艙,從拿到Fable 5到完成MacOS應用打包,5個小時。

你那個擱置很久的項目,說不定也就差一個這樣的週末。