Claude Fable 5最強深度實測！5個小時，我把想了很久的Mac App做出來了！

作者：花叔

日期：2026年6月10日下午4:07

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

Claude Fable 5實測：5小時內用佢做出一個Mac App，穩定到唔使返工

整理版摘要

呢篇文章嘅作者係一個唔識寫code嘅人，佢所有產品都係靠AI整出嚟。佢一直以嚟有個困擾：AI agent起咗好多項目，但文件散落喺Finder同終端之間，好難聯動。佢想整一個「駕駛艙」，左邊睇文件右邊跑agent，agent改咗文件即時睇到。呢個App就叫「翻箱」（FanBox），一個專為vibe coding而設嘅桌面工具。

Anthropic最近發布咗Claude Fable 5，其實係Mythos 5嘅安全版，同一個底層模型但加咗安全過濾，公開賣。而且由而家到6月22日，Pro同Max用戶可以免費用到。作者決定攞呢個新模型去實現佢諗咗好耐嘅App。

結果係，佢用咗大約5個鐘，由Opus 4.8打底到Fable 5大改，成功打包出一個叫「翻箱」嘅Mac App。佢最深刻嘅體會係Fable 5唔係快咗，而係犯錯少咗——以前要來回改好多次嘅問題，而家一輪搞掂。例如圖片縮略圖卡頓，以前要改三四輪，而家一次定位兩個根因，一輪搞掂。佢仲舉咗終端中文亂碼嘅冷門問題，Fable 5直接指出要用unicode11 addon。作者認為呢個進步主要歸功於強制開啟嘅思考模式，令模型決定之前諗耐啲，減少估錯。佢認為Fable 5係「自Opus 4.5以來最大嘅一步」，建議訂閲用戶把握免費期。

Fable 5同Mythos 5同底層，分別只在安全護欄；Fable 5公開賣，免費到6月22日。
作者用Fable 5開發咗翻箱（FanBox），一個本地文件管理+終端+AI agent聯動嘅桌面App，5個鐘由構思到打包。
對比Opus 4.8，Fable 5最大改進係判斷力同debug能力：以前要五輪拉鋸嘅問題，而家一輪搞掂。
強制開啟嘅思考模式令回覆慢咗但準咗，省掉嘅係返工時間。
作者建議訂閲用戶喺6月23日前用Claude Code加Fable 5，攞一個擱置嘅項目試下。

值得記低

連結 github.com

翻箱 FanBox GitHub 倉庫

開源嘅 agent box 桌面應用，用 Electron 構建，支援文件預覽、終端聯動、Code agent 指揮。

筆記

Claude Code 從入門到精通

作者嘅橙皮書，喺微信讀書可以睇到，適合未用過 Claude Code 嘅讀者。

整理重點

Claude Fable 5 係咩嚟？

Anthropic喺6月9日發布咗Claude Fable 5，佢同Mythos 5係同一個底層模型，分別只在安全分類器——你可以理解成模型門口嘅安檢員。Mythos 5安檢鬆，只畀受邀機構；Fable 5安檢嚴，公開發售。

同一個底層模型，分別只在安全分類器

1 上下文窗口1M token，單次輸出最高128K。
2 思考模式強制開啓，關都關唔掉。
3 API價格係Opus 4.8嘅兩倍：$10/百萬輸入，$50/百萬輸出。

整理重點

一個唔識寫code嘅人嘅痛點

作者靠AI開發產品，但文件管理係大問題——Finder睇到文件但餵唔到AI，終端餵到AI但睇唔到文件。佢一直想有個工具將兩者聯動。

文件系統同agent之間嘅聯動

1 輕鬆點開agent起嘅項目，睇到文件內容。
2 寫作類項目需要順手編輯器，方便反覆改稿。
3 繪圖設計類任務，要一格格睇agent嘅生成結果。
4 agent出問題時，容易截圖同拖參考文件去餵畀佢。

整理重點

從Opus到Fable：5個鐘嘅開發實錄

作者先用Opus 4.8打底，但核心體驗一直跑唔通。第二日轉用Fable 5大改，同一個項目前後對比好明顯——Fable 5唔係快咗，而係犯錯少咗。

一次改完，無返工

舉例：圖片縮略圖卡頓問題，作者只係講咗一句「圖多嘅目錄點擊好卡」，Fable 5就定位出兩個疊加根因——縮略圖加載原圖整個文件、每次點擊都重建檔案網格——然後一次改完，點擊響應降到0.1秒內。

一輪，沒有返工

另一個例子：終端中文目錄名亂碼，涉及xterm.js嘅寬字符處理，Fable 5直接指出要用unicode11 addon，仲提醒係實驗性API要顯式開啓。

偏門問題準確命中

整理重點

翻箱（FanBox）係點樣嘅？

翻箱英文叫FanBox，你可以當佢係一個agent box，將「揾文件 → 跑agent → 睇佢改咗咩」收埋一個窗口。設計目標係每種文件「長得像自己」，唔點開就知係咩。

每種文件長得像自己，唔點開就知係咩

活的儀表盤：agent每寫一個文件，文件卡片會盪開漣漪、按改動頻率發光。
會話回放：變更面板有播放鍵，拖時間軸重現agent改文件嘅步驟。
拖文件喂agent：從文件列表拖入終端，路徑自動插入；喺預覽中選中文字，一鍵發送畀agent。
⌘K找回：記得片段就能搜到文件，文件夾右上角自動標註項目類型。
原地輕改：代碼用Monaco、Markdown所見即所得、圖片可直接標註畫箭頭。

整理重點

總結：你個擱置嘅項目可能就差一個週末

翻箱已經開源，安裝包打咗出嚟，作者話佢係個解決自己問題嘅初級版本，預計好長一段時間都係個人項目。佢鼓勵讀者：如果你係Pro或Max用戶，6月23日之前喺Claude Code將模型切到Fable 5，攞一個一直想做但覺得麻煩嘅項目試下。

5個鐘，由想法到安裝包

仲未用過Claude Code嘅，可以從作者嘅橙皮書《Claude Code: 從入門到精通》開始，微信讀書就揾到。

朝早一醒，Anthropic又又又出新模型：Claude Fable 5。

Claude 5出咗係幾好，但點解又要整多個Fable出嚟...Opus、Sonnet、Haiku呢套名仲唔夠煩咩。

同埋，點解唔叫Mythos？？Anthropic喺呢個細節上真係好有矽谷大公司亂咁改名嘅作風。

不過，鬧還鬧，呢個模型真係幾勁。一句講曬佢係咩：Fable 5，就係加咗安全護欄嘅Mythos。Mythos係Anthropic之前只開放俾政府同受邀機構、外界只聽過個名嘅模型，今次加咗護欄，公開發售。

同埋你最需要知道嘅係：由而家到6月22號，Fable 5直接包喺Claude訂閲入面，Pro同Max用戶免費任用。6月23號開始佢會從訂閲額度度移除，想繼續用就要另外增值、按量計費。想白嫖嘅話，得呢兩個禮拜嘅窗口。

能力方面睇一張圖就夠：

SWE-Bench Pro呢個測試，係將真實開源項目嘅bug掟俾模型自己改。80.3%意思係十個真實bug佢可以獨立改好八個，第二名俾佢拋離11個百分點。官方公告仲不斷強調一句：任務越長、越複雜，佢嘅領先越大。最有畫面嘅官方案例係Stripe：5000萬行Ruby碼庫搬遷，團隊本來預計要兩個月，Fable 5一日搞掂。

呢篇文章前半將呢個模型講清楚，後半俾你睇一個其他地方睇唔到嘅實測：我用佢將一個諗咗好耐嘅App真係整咗出嚟，由開工到打包好安裝包，一日。

我用咗大約5個鐘之後嘅感覺係：Fable 5寫碼嘅穩定性比以前強咗好多，只要你將需求或者你想解決嘅問題講清楚，基本上佢就可以一次過幫你搞掂。

Fable係咩來頭

今年4月，Anthropic啟動咗一個叫Project Glasswing嘅項目，將Mythos開放俾政府網絡防禦部門同關鍵基建供應商。只有受邀機構先用得，外界只聽過個名。

6月9號今次發布，其實係同時出咗兩個模型：Claude Mythos 5同Claude Fable 5。兩者係同一個底層模型，分別只係安全分類器。呢樣嘢你可以理解成企喺模型門口嘅安檢員，檢查出入嘅問題同回答，遇到生化武器、網絡攻擊呢類危險話題直接攔住。Mythos 5安檢鬆，繼續只俾受邀合作方；Fable 5安檢嚴，公開發售。官方嘅定義好直接：a Mythos-class model made safe for general use。

個名亦都係配套嘅：Mythos係希臘文嘅「神話」，Fable係拉丁文嘅「寓言」，一個希臘文一個拉丁文，都係講故仔。同一個故事，兩種講法，護欄嘅鬆緊直接寫咗落產品名度。

設計邏輯我明嘅，但都想鬧一句：Haiku、Sonnet、Opus呢套大中小，用戶好艱難先記得邊個打邊個，而家又走出嚟Fable同Mythos兩個新名，模型選擇器越來越似文學選修課。有情懷，但真係冇必要。乖乖哋叫Claude 5，天都唔會塌。

幾個指標順便講下：上下文窗口1M token，單次輸出最高128K，思考模式強制開咗、關都關唔到。呢個「關唔到」後面會再提，佢同我嘅使用體感直接有關。

貴唔貴？講下我今日嘅真實用量

API價格係討論得最多嘅地方：10/百萬輸入，10/百萬輸入，10/百萬輸入，50/百萬輸出，剛好係Opus 4.8嘅兩倍。目前喺Claude Code入面嘅消耗速度亦都會係Opus模型嘅2倍。

講下我自己嘅情況：我今日9點起身之後，一路同步做緊2-3個項目，全程Fable 5，200美元嘅Max版本到而家都未遇到限制。

不過有個前提，Anthropic喺發布模型嘅時候將用量reset咗一輪，等於俾咗所有人一張新卡。希望OpenAI快啲參與競爭，令呢種reset嚟得更勁。

至於6月23號之後，如果真係按API價格收費，咁真係會有點太貴。所以我的態度係：呢兩個禮拜死咁用，23號之後嘅事到時再算。

我手頭啱好有一個諗咗好耐嘅項目

模型講完。對我嚟講，判斷一個模型好唔好，標準得一個：可唔可以將我想做嘅嘢真係整出嚟。

事情係咁嘅：我從來唔識寫碼，所有產品都係AI寫嘅。呢種工作方式有個好具體嘅副作用：AI幫你一個下午起十個項目，但佢哋散落喺唔同文件夾入面，個名認唔出，agent改咗咩嘢都睇唔到。

具體到每日嘅場景，我嘅需求其實好簡單：agent起好嘅項目，我想輕鬆㩒開睇；寫作類嘅項目好多，稿要反覆改，我需要一個順手嘅編輯器；繪圖同設計類嘅任務，我得一張張睇agent嘅生成結果；agent整出嚟嘅嘢出問題、唔符合我預期嘅時候，我希望更容易咁截圖、將參考文件拖入去餵俾佢。

呢啲事冇一件係寫碼，但每一件都卡喺文件系統同agent之間：Finder睇到文件、唔易喂agent，終端喂到agent、睇唔到文件。所以我每日就係喺Finder、Cursor、瀏覽器三個視窗之間來回切，揾一個昨日生成嘅文件要揾半日。

我一直想要嘅，係文件系統同agent之間有真正嘅聯動左邊瀏覽同預覽本機文件，右邊一個真終端跑coding agent，agent每改一個文件，左邊即刻著燈。一個vibe coding嘅駕駛艙。

之前整過一個網頁版嘅雛形，一個本地文件瀏覽頁，可以搜可以預覽，僅此而已。真正想要嘅部分全部卡喺後面：內嵌真終端、文件監聽、編輯器、打包簽名，呢個係一個完整桌面App嘅工程量。以前唔係做唔到，主要係改起嚟太折磨，我提一個需求要來回拉扯好多輪，諗諗嚇就放低咗。

Fable 5發布嗰日，我決定攞佢試嚇。

一日，由諗法到安裝包

時間線係咁嘅：

6月9號下晝我先用Opus 4.8做咗個基礎版本。Electron桌面殼、內嵌終端、文件×終端×預覽三方聯動。但有啲核心體驗一路未run順。

6月10號朝早，攞到Fable之後開始大改：代碼編輯器、Markdown所見即所得、圖片標註編輯、整個佈局重構。然後打包、簽名，生成dmg安裝包。

中間冇skip過驗收。我俾呢個項目定嘅交付標準係：5個獨立嘅AI subagent分別扮演重度vibe coder、原生審美設計師、零文檔新用戶、終端十年老兵、破壞性質量官，對住成品、真機截圖同代碼打分，全部≥90分而且冇紅線先算達標。第一輪已經俾人打回頭：審美踩紅線、終端健壯性唔夠、數據安全有漏洞。改完再審，總共搞咗四輪，先算過關。

佢唔係demo，亦唔係原型。佢裝咗喺我嘅Applications文件夾入面，我寫呢篇文章呢一刻，佢就開住。

右下角終端入面掛住嘅，正係Fable 5嘅上線通知。

翻箱FanBox：佢咩樣

App叫翻箱，英文名FanBox。你可以將佢讀成一個agent box：一個更好咁管理agent同文件系統嘅工具，將「揾文件 → 跑agent → 睇佢改咗咩」收埋入一個視窗。

設計目標係每種文件「似返佢自己」，唔㩒開就知係咩。

幾個我自己最常用嘅功能：

活嘅儀錶板。agent每寫一個文件，張文件卡片即刻盪開漣漪、按改動頻率發光。多個項目並行跑agent嘅時候，agent寫到邊，光就行到邊，「睇AI做嘢」第一次有現場感。

會話重播。變更面板入面有個播放掣，好似碌片咁拉時間軸，重現呢段時間agent一步步改咗邊啲文件。agent跑咗半小時長任務，返嚟拉一次就知佢做咗咩。

拖文件餵agent。從文件列表將文件或文件夾拖入終端，路徑自動插入輸入行；喺預覽入面揀中一段文字，㩒一下就發到終端俾agent做上下文。反過來，終端入面出現嘅文件路徑可以直接㩒，喺翻箱入面打開。

⌘K找回。記得個名片段就可以搜到文件同文件夾，文件夾卡片右上角自動標上node/web/py呢啲項目類型徽章，一個下晝起嘅十個項目一眼認出。

原地輕改。代碼同JSON用Monaco（VS Code同款內核），Markdown係Notion式所見即所得，圖片可以直接標註、畫箭頭、打碼。睇到邊改到邊，唔使再開一個編輯器。

呢篇文章就係喺翻箱入面寫嘅，左邊預覽草稿，右邊終端掛住Claude Code：

下面呢張係我自己堆滿截圖同錄屏嘅桌面，唔開終端agent視窗嘅情況下同finder冇太大分別：

agent啱啱喺一個文件夾入面改咗兩處，張卡片就咁樣著燈：

順帶一提，佢有三套皮膚，配色、字體、圖標、代碼高亮整體切換：熒光綠炭黑嘅終端風、奶油紙赤陶橙嘅檔案風、黑白紅嘅索引風。

我自己對呢個產品定義嘅邊界係：翻箱唔同Finder鬥文件管理，唔做插件唔做調試，重嘢繼續拋俾IDE。佢只係將「揾返 + 預覽 + 輕改 + 指揮agent」呢條鏈路做到順手。全部本地運行，零外網請求，數據唔出本機。

不過呢，佢而家仲係個好初步嘅版本，主要解決我自己嘅問題，審美同功能都按我自己嘅需要嚟，冇打算討好任何人。我估計好長一段時間，佢都會係我一個簡單嘅個人項目。

開發過程入面，Fable 5俾我嘅真實體感

返返去模型本身。今次開發前一日用Opus 4.8打底，後一日用Fable 5大改，同一個項目前後腳換咗兩代模型，分別好具體：唔係更快，係犯錯更少，一次過解決問題。

舉個最典型嘅例子。翻箱嘅圖片縮略圖功能，初版喺圖多嘅文件夾入面㩒會lag幾秒。呢種性能問題以前係最折磨人嘅：模型估一個原因，改一版，好少少但冇解決，再估再改，三四輪落嚟代碼越來越亂。

今次我就描述咗一句「圖多嘅目錄㩒落好lag」。佢定位出兩個疊加嘅根因：縮略圖喺加載原圖整個文件，同埋每次㩒都喺重建整個文件網格。然後一次改曬：加咗一個帶緩存嘅縮略圖接口，㩒改做只切換選中樣式唔重建。㩒嘅反應降到0.1秒內，肉眼無感。一輪，冇返工。

類似嘅仲有終端入面中文目錄名亂碼嘅問題。呢個涉及xterm.js嘅寬字符處理，幾冷門㗎。佢直接指出要用unicode11呢個addon，仲提醒呢個係實驗性API需要顯式開啓。呢種準確命中偏門問題嘅瞬間，一日入面出現咗好多次。

打包階段更明顯。Electron打包喺國內網絡環境下係個連環坑：二進制下載被block、原生模塊編譯失敗、新版node令構建工具直接死。以前呢種環境問題可以搞足一晚，今次佢一路換鏡像、換編譯方案、調整打包配置，將一串坑都繞過曬，我全程只係負責睇住。

點解會咁？我估答案就藏喺前面嗰個「關唔到」度。Fable 5嘅思考模式係強制開咗，單個回覆明顯比Opus要等得耐。慢同準好可能係同一面銀嘅兩面：鬱手之前諗得耐，估錯率就低，估錯率低，就唔使返工。佢省嘅唔係打字時間，係返工。

講句老實話：我冇拎同一個問題去餵舊模型做對照實驗，上面呢啲係體感對比，唔係同題實測。但「以前五輪拉鋸、而家一輪解決」呢種分別，大到唔需要儀器都感覺到。

後來我見到Claude Code嘅作者Boris Cherny對Fable 5嘅評價：「自Opus 4.5以來最大嘅一步」，佢強調嘅都係判斷力同debug能力。同我嘅體感，完全對得埋。

最後

翻箱嘅安裝包已經打好咗，而且，已開源發布，你都可以拎我嘅開源碼去改出一個更適合你自己嘅agent box嚟👇

https://github.com/alchaincyf/fanbox

至於Fable 5，我嘅建議好簡單：如果你係Pro或Max訂閲用戶，6月23號之前，喺Claude Code入面將模型轉到Fable 5，拎一個你一直想做但覺得「太麻煩」嘅項目餵俾佢。免費額度你都有，我做翻箱就係用佢。

仲未上手過Claude Code嘅，可以從我嘅橙皮書《Claude Code: 從入門到精通》開始，微信讀書就睇到。

我想咗好耐嘅駕駛艙，由拎到Fable 5到完成MacOS應用打包，5個鐘。

你嗰個放低好耐嘅項目，話唔定就差一個咁樣嘅週末。

早上一覺醒來，Anthropic又又又發新模型了：Claude Fable 5。

Claude 5來了是挺好的，但是為什麼特麼又整出個Fable出來...Opus、Sonnet、Haiku這套名字還不夠煩人麼。

以及，為啥也不叫Mythos？？A社在這個細節上還真是挺有硅谷大公司瞎特麼起名的風範的。

不過，吐槽歸吐槽，這個模型確實夠強的。一句話說清它是什麼：Fable 5，就是加了安全護欄的Mythos。Mythos是Anthropic那個之前只開放給政府和受邀機構、外界只聞其名的模型，這次加上護欄，公開發售了。

以及你最該知道的是：從現在到6月22日，Fable 5直接包含在Claude訂閲裏，Pro和Max用戶免費用。6月23日起它會從訂閲額度裏移除，想繼續用得另外充值、按量計費。想白嫖的話，只有這兩週窗口。

能力上看一張圖就夠了：

SWE-Bench Pro這個測試，是把真實開源項目裏的bug丟給模型自己修。80.3%意思是十個真實bug它能獨立修好八個，第二名被甩開11個百分點。官方公告還反覆強調一句：任務越長、越複雜，它的領先越大。最有畫面感的官方案例是Stripe：5000萬行Ruby代碼庫遷移，團隊原本評估要兩個月，Fable 5一天跑完。

這篇文章前一半把這個模型講清楚，後一半給你看一個別處看不到的實測：我用它把一個想了很久的App真的做了出來，從動手到打包好安裝包，一天。

我大概用了5個小時後的感受是：Fable 5寫代碼的穩定性比之前強了不少，只要你能把需求或者說你要解決的問題說清楚，基本上它就能給你一次性搞定。

Fable是什麼來歷

今年4月，Anthropic啓動了一個叫Project Glasswing的項目，把Mythos開放給政府網絡防禦部門和關鍵基礎設施提供方。只有受邀機構能用，外界只聞其名。

6月9日這次發佈，其實是同時發了兩個模型：Claude Mythos 5和Claude Fable 5。兩者是同一個底層模型，區別只在安全分類器。這東西你可以理解成站在模型門口的安檢員，檢查進出的問題和回答，碰到生化武器、網絡攻擊這類危險話題直接攔下。Mythos 5安檢松，繼續只給受邀合作方；Fable 5安檢嚴，公開發售。官方的定義很直接：a Mythos-class model made safe for general use。

名字也是配套的：Mythos是希臘語的「神話」，Fable是拉丁語裏的「寓言」，一個希臘語一個拉丁語，都是講故事。同一個故事，兩種講法，護欄的鬆緊直接寫進了產品名裏。

設計邏輯我看懂了，但還是想吐槽一句：Haiku、Sonnet、Opus這套大中小，用戶好不容易才記住誰是誰，現在又冒出來Fable和Mythos兩個新名字，模型選擇器越來越像文學選修課。有情懷，但真沒必要。老老實實叫Claude 5，天塌不下來。

幾個指標順手列一下：上下文窗口1M token，單次輸出最高128K，思考模式強制開啓、關都關不掉。這個「關不掉」後面還會提到，它和我的使用體感直接相關。

貴不貴？說說我今天的真實用量

API價格是討論最多的地方：10/百萬輸入，10/百萬輸入，10/百萬輸入，50/百萬輸出，正好是Opus 4.8的兩倍。目前在Claude Code中的消耗速度也會是Opus模型的2倍。

說說我自己的情況：我今天9點起牀之後，一直同步在做2-3個項目，全程Fable 5，200美元的Max版本到現在沒遇到限制。

不過有個前提，Anthropic在發佈模型的時候把用量reset了一波，相當於給所有人發了張新卡。希望OpenAI趕緊特麼參與競爭，讓這種reset來得更猛一些。

至於6月23號之後，如果真按API價格收費的話，那確實會有點太貴了。所以我的態度是：這兩週先往死裏用，23號之後的事23號再說。

我手上正好壓着一個想了很久的項目

模型講完了。對我來說，判斷一個模型好不好，標準只有一個：能不能把我想做的東西真的做出來。

事情是這樣的：我從來不會寫代碼，所有產品都是AI寫的。這種工作方式有個很具體的副作用：AI幫你一個下午起十個項目，但它們散落在各個文件夾裏，名字認不出，agent改了什麼也看不見。

具體到每天的場景，我的需求其實很樸素：agent起好的項目，我想輕鬆點開看；寫作類的項目很多，稿子要反覆改，我需要一個順手的編輯器；繪圖和設計類的任務，我得一張張查看agent的生成結果；agent做出來的東西出問題、不符合我預期的時候，我希望能更容易地截圖、把參考文件拖進去投餵給它。

這些事沒有一件是寫代碼，但每一件都卡在文件系統和agent中間：Finder看得見文件、不好喂agent，終端喂得了agent、看不見文件。所以我的日常就是在Finder、Cursor、瀏覽器三個窗口之間來回切，找一個昨天生成的文件要翻半天。

我一直想要的，是文件系統和agent之間有真正的聯動：左邊瀏覽和預覽本機文件，右邊一個真的終端跑coding agent，agent每改一個文件，左邊當場亮起來。一個vibe coding的駕駛艙。

之前搭過一個網頁版的雛形，一個本地文件瀏覽頁，能搜能預覽，僅此而已。真正想要的部分全卡在後面：內嵌真終端、文件監聽、編輯器、打包簽名，這是一個完整桌面App的工程量。以前不是做不了，主要是改起來太磨人，我提一個需求要來回拉扯很多輪，想想就先放下了。

Fable 5發佈當天，我決定拿它試試。

一天，從想法到安裝包

時間線是這樣的：

6月9日下午我先拿Opus 4.8做了個基礎的版本。Electron桌面殼、內嵌終端、文件×終端×預覽三方聯動。但是有些核心的體驗一直沒跑通。

6月10日早上，拿到Fable後開啓大改：代碼編輯器、Markdown所見即所得、圖片標註編輯、整個佈局重構。然後打包、簽名，生成dmg安裝包。

中間沒有跳過驗收。我給這個項目定的交付標準是：5個獨立的AI subagent分別扮演重度vibe coder、原生審美設計師、零文檔新用戶、終端十年老兵、破壞性質量官，對着成品、真機截圖和代碼打分，全部≥90分且無紅線才算達標。第一輪就被打回來了：審美踩紅線、終端健壯性不夠、數據安全有口子。修完再審，總共折騰了四輪，才算過關。

它不是demo，也不是原型。它裝在我的Applications文件夾裏，我寫這篇文章的此刻，它就開着。

右下角終端裏掛着的，正好是Fable 5的上線通知。

翻箱FanBox：它長什麼樣

App叫翻箱，英文名FanBox。你也可以把它讀成一個agent box：一個更好地管理agent和文件系統的工具，把「找文件 → 跑agent → 看它改了什麼」收進一個窗口。

設計目標是每種文件「長得像它自己」，不點開就知道是什麼。

幾個我自己最常用的能力：

活的儀表盤。agent每寫一個文件，那張文件卡片當場盪開漣漪、按改動頻率發光。多個項目並行跑agent的時候，agent寫到哪，光就走到哪，「看AI幹活」第一次有了現場感。

會話回放。變更面板裏有個播放鍵，像刷視頻一樣拖時間軸，重現這段時間agent一步步改了哪些文件。agent跑了半小時長任務，回來拖一遍就知道它都幹了什麼。

拖文件喂agent。從文件列表把文件或文件夾拖進終端，路徑自動插進輸入行；在預覽裏選中一段文字，點一下就發到終端給agent當上下文。反過來，終端裏出現的文件路徑可以直接點擊，在翻箱裏打開。

⌘K找回。記得名字片段就能搜到文件和文件夾，文件夾卡片右上角自動標上node/web/py這些項目類型徽章，一下午起的十個項目一眼認出來。

原地輕改。代碼和JSON用Monaco（VS Code同款內核），Markdown是Notion式所見即所得，圖片可以直接標註、畫箭頭、打碼。看到哪改到哪，不用再開一個編輯器。

這篇文章就是在翻箱裏寫的，左邊預覽草稿，右邊終端掛着Claude Code：

下面這張是我自己堆滿截圖和錄屏的桌面，不開啓終端agent窗口的情況下和finder沒太大區別：

agent剛在一個文件夾裏改了兩處，那張卡片就這樣亮起來：

順便，它有三套皮膚，配色、字體、圖標、代碼高亮整體切換：熒光綠炭黑的終端風、奶油紙赤陶橙的檔案風、黑白紅的索引風。

我自己對這個產品定義的邊界是：翻箱不跟Finder拼文件管理，不做插件不做調試，重活繼續甩給IDE。它只把「找回 + 預覽 + 輕改 + 指揮agent」這一條鏈路做到順手。全部本地運行，零外網請求，數據不出本機。

不過呢，它現在還是個挺初級的版本，主要解決我自己的問題，審美和功能都按我自己的需要來，沒打算討好誰。我估計很長一段時間，它都會是我的一個簡單的個人項目。

開發過程裏，Fable 5給我的真實體感

回到模型本身。這次開發前一天用Opus 4.8打底，後一天用Fable 5大改，同一個項目前後腳換了兩代模型，差別很具體：不是更快，是犯錯更少，一次就把問題解決。

舉個最典型的例子。翻箱的圖片縮略圖功能，初版在圖多的文件夾裏點擊會卡好幾秒。這種性能問題以前是最磨人的：模型猜一個原因，改一版，好一點但沒解決，再猜再改，三四輪下來代碼越來越亂。

這次我就描述了一句「圖多的目錄點擊很卡」。它定位出來兩個疊加的根因：縮略圖在加載原圖整個文件，以及每次點擊都在重建整個文件網格。然後一次改完：加了一個帶緩存的縮略圖接口，點擊改成只切換選中樣式不重建。點擊響應降到0.1秒內，肉眼無感。一輪，沒有返工。

類似的還有終端裏中文目錄名亂碼的問題。這涉及xterm.js的寬字符處理，挺冷門的。它直接指出要用unicode11這個addon，還提醒這是個實驗性API需要顯式開啓。這種準確命中偏門問題的瞬間，一天裏出現了很多次。

打包階段更明顯。Electron打包在國內網絡環境下是個連環坑：二進制下載被擋、原生模塊編譯失敗、新版node讓構建工具直接掛掉。以前這種環境問題能耗掉一晚上，這次它一路換鏡像、換編譯方案、調整打包配置，把一串坑都繞過去了，我全程只負責看着。

為什麼會這樣？我猜答案就藏在前面那個「關不掉」裏。Fable 5的思考模式是強制開啓的，單個回覆明顯比Opus要等得久。慢和準很可能是同一枚硬幣的兩面：動手之前想得久，猜錯率就低，猜錯率低，就不用返工。它省掉的不是打字時間，是返工。

說句誠實的：我沒拿同一個問題去喂舊模型做對照實驗，上面這些是體感對比，不是同題實測。但「以前五輪拉鋸、現在一輪解決」這種差別，大到不需要儀器。

後來我看到Claude Code的作者Boris Cherny對Fable 5的評價：「自Opus 4.5以來最大的一步」，他強調的也是判斷力和debug能力。跟我的體感，完全對上了。

最後

翻箱的安裝包已經打好了，並且，已開源發佈，你也可以拿我的開源代碼去改出一個更適合你自己的agent box來👇

https://github.com/alchaincyf/fanbox

至於Fable 5，我的建議很簡單：如果你是Pro或Max訂閲用戶，6月23日之前，在Claude Code裏把模型切到Fable 5，拿一個你一直想做但覺得「太麻煩」的項目餵給它。免費額度你也有，我做翻箱用的就是它。

還沒上手過Claude Code的，可以從我的橙皮書《Claude Code: 從入門到精通》開始，微信讀書就能看。

我想了很久的駕駛艙，從拿到Fable 5到完成MacOS應用打包，5個小時。

你那個擱置很久的項目，說不定也就差一個這樣的週末。