最新最全的 coding agent 指南，從入門到進階

作者：空格的鍵盤

日期：2026年5月11日上午9:03

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

本文提供 coding agent 從入門到進階的完整指南，涵蓋工具選擇、配置、Skill 管理與自動化實戰，幫助讀者建立個人 AI 工作流。

整理版摘要

呢篇文章係由 Zephyr Wang 寫嘅，佢成日幫人做 Agent 定製諮詢，發現好多人將 chatbot 同 Agent 撈亂曬。Agent 唔同 chatbot，佢可以讀電腦文件、調用工具、用 Skill 封裝工作流，真正幫你自動化做嘢。

作者自己用緊 Codex 做產品、Claude Code 寫內容，另外用 CC Switch 接國產模型 API 平替，一個月成本大概 300-500 蚊。佢認為 Agent 嘅核心係模型、Harness、Skill 加上自己嘅上下文，而唔係某一個工具。

文章提供一條清晰嘅實踐路線，由桌面端入門，到裝 Skill、進階 CLI、模型路由，最後用 OpenClaw 做自動化。只要跟住做，就可以逐步建立一個屬於自己嘅 Agent 生態。

Coding Agent 的核心係「模型 + Harness 框架」，模型決定聰明度，Harness 決定執行力。
桌面端（Codex / Claude Code）最適合入門，CLI 適合進階，可以接國產模型 API 降低成本。
Skill 係寫俾 AI 嘅 SOP，可以將重複工作流封裝成一句話觸發，大幅提升效率。
透過 CC Switch 可以一鍵切換模型供應商，主力套餐留俾複雜任務，日常用平價國產模型。
實戰路線：先建立感覺 → 裝 Skill → 進階 CLI → 模型路由 → 自動化，逐步建立個人 Agent 生態。

值得記低

Skill github.com

Zephyr Wang 的開源 Skill 庫

包含 100 多個 Skill，覆蓋內容創作、產品經理、數據分析等場景，可直接下載使用。

整理重點

咩係 coding Agent？

呢篇文章係由 Zephyr Wang 寫嘅，佢成日幫人做 Agent 定製諮詢，發現好多人將 chatbot 同 Agent 撈亂曬。

Agent 唔同 chatbot，佢可以讀電腦文件、調用工具、用 Skill 封裝工作流，真正幫你自動化做嘢。

作者引用一個清晰定義：模型（LLM）+ Harness 框架 = Agent。模型決定聰明度，Harness 決定執行力。

CLI 類（Claude Code、Codex CLI、Gemini CLI 等）—門檻高但天花板最高，可以接任意模型 API
桌面客戶端類（Claude Cowork、Codex App、Minimax Agent 等）—開箱即用，深度定製弱啲
IDE 類（Cursor、Trae、Antigravity 等）—邊睇代碼邊改
Agent 系統類（OpenClaw、Hermes 等）—常駐後台，對接即時通訊工具
網頁端類（Lovable、Figma Make 等）—適合標準化交付，但深度上下文有限

整理重點

入門推薦：Codex 同 Claude Code 桌面端

第一次接觸 coding Agent，建議唔好直接上 CLI，先用桌面端建立感覺。作者主力推薦兩個：Codex 桌面端同 Claude Code 桌面端。

1 下載 Codex 或 Claude Code，註冊 Pro 會員（$20/月）
2 設定項目文件夾，確保 Agent 知道可以操作邊啲檔案
3 用默認模型開始對話，丟文件畀佢處理，感受同豆包嘅分別
4 嘗試裝一個 Skill，例如 PPT Skill，將重複工作流封裝

整理重點

進階：CLI、CC Switch 同國產模型平替

桌面用熟之後，可以上 CLI。Claude Code CLI 或 Codex CLI 可以跑真實終端環境，執行任意 bash 命令、Git 操作、Docker 容器。

CLI 最大好處係可以接國產模型 API，大幅降低 token 成本。

CC Switch 係一個圖形化 API 管理工具，可以一鍵切換 Claude Code、Codex CLI 等 Agent 嘅模型來源。

註冊國產模型（智譜、Minimax、DeepSeek 等）拎 API Key
喺 CC Switch 加入供應商，填 Base URL、API Key、Model
保存啟用，重新開 Agent 就可以用平價國產模型
作者自己用智譜 GLM 4.7 同 Minimax，月費 300-500 蚊

國產模型 API 能兼容 Anthropic 或 OpenAI 標準，所以可以就咁接入 Claude Code 等工具。

整理重點

Skill 管理同 OpenClaw 自動化

Skill 係 coding Agent 嘅殺手鐧，等於寫畀 AI 嘅 SOP。作者自己整咗 100 幾個 Skill，覆蓋內容創作、產品經理、數據分析等。

OpenClaw 係一個常駐後台嘅 Agent 框架，可以接飛書、Telegram 等 IM，畀你離唔開電腦都用到 Agent。作者用 Minimax 模型，負責每日採集、定時歸檔等任務。

1 安裝 OpenClaw：將官方倉庫 README 連結丟畀 Claude Code，等佢邊讀邊裝
2 配置模型 API：用 CC Switch 或直接讓 Agent 幫你讀文檔配
3 設定 IM 機器人（如飛書），發條消息就觸發任務
4 適合已熟練 Claude Code + Skill、有大量重複自動化需求嘅進階用戶

整理重點

實戰路線總結

跟住呢條路，你可以逐步建立個人 Agent 生態，讓 AI 喺你休息嘅時候繼續幫你打工。記住，coding Agent 嘅核心係模型、Harness、Skill 加自己嘅上下文，而唔係任何單一工具。

呢篇文章只係工具使用入門，下一步可以深入 Agent 做知識管理、Vibe Coding 等方向。

前言

最近做咗唔少個人 Agent 定製諮詢，嚟諮詢嘅有產品、營運、營銷、自由職業嘅。

對於 AI 工具嘅使用同理解各有唔同，唯一嘅共同點係都用過豆包。

傾到 Agent 嘅時候，好多人就各有各嘅理解。

chatbot、LLM、Agent、skill、Prompt，呢啲概念交錯埋一齊。

令到有些人誤以為 chatbot 為代表嘅產品係 Agent、LLM 係 Agent。

但呢啲 AI 對話產品唔似 Agent 咁可以操作你嘅電腦、文件、skill...

用豆包，每次都係想叫佢做啲嘢，就要手動傳文件畀佢，要將背景由頭交代一次。佢冇記憶，冇 Skill，亦冇辦法主動操作電腦、瀏覽器、本地嘅任何工具。

Agent 就唔同。

佢可以直接讀電腦上嘅文件，調用工具，用 Skill 將一套工作流封裝成一個動作交付出嚟。

舉個最簡單嘅例子。想做一份 PPT，基於本地寫過嘅內容。常規流程係咁：

選擇內容
確定風格
輸出成品

熟練之後，可以將呢套流程做成一個 PPT 製作 Skill。

下次只要發一段內容，調用 Skill，PPT 就出嚟喇。

再進一步，仲可以叫佢定時執行。每日朝早 8 點，主動掃描電腦上當日新增嘅筆記，掃描訂閲嘅 RSS 源，自動生成當日嘅內容卡片、PPT 或者其他任何形式。

你瞓覺嘅時候佢仲幫你做緊嘢，呢個先係 Agent。

文章指引

如果仲未用過 coding Agent，或者已經用緊但想更進一步，睇完呢篇你應該可以搞清楚下面呢啲事：

咩係 coding Agent，市面上嘅產品有邊啲
點樣下載、註冊、訂閲最主流嘅 Agent 客戶端
點樣由桌面端進階到 CLI
點樣喺 Claude Code 度接國產模型 API 做平替
OpenClaw 點樣配，點樣將 Agent 接到飛書度跑自動化
Skill 點樣做到全局統一管理，多端複用

先講我目前嘅用法，建立個畫面：

1 我嘅主力係 codex 同 claude code。

Codex 用嚟做產品，寫代碼、做原型、跑工程；Claude Code 用嚟寫內容，公眾號、專欄、商單。

2 國產模型平替。

主力套餐都有 token 限制，跑大咗會被限制。我喺 Claude Code 度接咗智譜 GLM 同 Minimax 嘅 API，基礎嘅任務全部行國產，平，夠用。

3 OpenClaw 接 Minimax 嘅 API。跑一啲定時同自動化任務，自動化採集同投遞。

呢套組合一個月成本大概 300-500 蚊。

有咗上面呢個介紹，如果你想全面咁瞭解同使用 Agent，下面正式開始。

01 咩係 coding Agent

我見過比較清晰嘅一個定義：

模型（LLM）+ Harness 框架 = Agent

模型係大腦，Harness 係記憶同手腳。模型決定佢有幾聰明，Harness 決定點樣做事情。

按呢個定義，市面上嘅 coding Agent 大概可以分成幾類：

1）CLI 類（終端命令行）

特點係門檻高，要識用終端。但天花板都最高，可以接任意模型 API、裝 Skill、操作成個文件系統。

Claude Code：Anthropic 出品，寫作、長文分析、代碼輸出嘅天花板
Codex CLI：OpenAI 出品，工程能力強，做產品首選
Gemini CLI：Google 出品，多模態強，配合海量上下文
Kimi CLI / 千問 CLI：國內廠商跟進版本

2）桌面客戶端類

開箱即用，下載、登錄、訂閲會員就可以跑。比 CLI 友好好多，深度定製能力弱啲。

Claude Cowork（Claude Desktop）：Anthropic 官方桌面端
Codex App：OpenAI 嘅桌面端
Minimax Agent、Skywork Desktop：國產桌面端

3）IDE / 代碼編輯器類

編輯器加 AI 嘅結合，適合一邊瀏覽代碼、文件，一邊叫 AI 改。

Cursor：基於 VS Code 改嘅 AI IDE，寫代碼神器
Trae：字節出品，國產 Cursor 平替
Antigravity：Google 出品，可以白嫖一年 Gemini 額度
Codebuddy：騰訊出品

4）Agent 系統類

好似一個一直生猛嘅 Claude Code，唔需要打開終端，可以對接即時通訊工具，例如飛書、釘釘，發條訊息佢就去做嘢。限制在於你睇唔到佢做緊咩，同埋成日會抽風，換咗模型效果就變咗。

OpenClaw（小龍蝦）：開源 Agent 框架，可以接飛書、Telegram、Signal 等 IM
Hermes、Opencode：其他開源 Harness 框架

5）網頁端

適合交付物標準化嘅任務，生成網站、PPT、報告呢啲。但深度上下文唔得，訂閲費一般都好貴。

Lovable、Figma Make、Notion AI、Manus：瀏覽器入面直接用嘅 Agent

02 最推薦嘅入門客戶端：Codex + Claude Code 桌面端

第一次接觸 coding Agent，建議唔好直接上 CLI。先用桌面端，建立嚇感覺。

我而家主要推薦兩個：

Codex 桌面端：從chatgpt.com/codex下載，需要 ChatGPT Plus（$20/月）或 Pro（$200/月）
Claude Code 桌面端：從claude.ai下載，需要 Claude Pro（$20/月）或 Max 套餐

可以先用免費額度跑幾日試嚇感覺，再決定使唔使訂閲。

註冊同訂閲呢步，國內會卡一嚇，訂閲支付、虛擬手機號、節點之類嘅。

搞唔掂就去鹹魚搞掂，唔好喺呢步就消耗曬熱情。

1）Codex 桌面端點樣用

下載完打開，界面好乾淨，重點留意幾樣嘢：

1 項目文件夾

最關鍵嘅設置。要令 Codex 知道佢可以操作邊個文件夾。

我一般會指定一個項目目錄，例如某個 obsidian 倉庫，Codex 之後所有嘅讀寫都會喺呢度發生。

2 模型選擇

Codex 內部可以切模型，GPT-5.2、GPT-5.3 Codex、GPT-5.4 都得。

日常用預設就得，複雜任務就切 Codex 專用模型。

3 安全策略

我自己嘅策略：日常項目設成自動執行所有命令，敏感項目（例如有線上憑證嘅）保持每次確認。

4 對話流、瀏覽器預覽、終端

Codex 桌面端嘅強項係有內置瀏覽器同終端。

寫完代碼可以直接打開瀏覽器預覽效果，跑命令都唔使切窗口，所有動作喺一個界面入面完成。

5 Skill 同插件

Codex 都支援 Skill（原生叫 Custom Instructions / Tools），可以裝第三方插件，亦可以自己寫。

可以下載我開源嘅 skill：github.com/zephyrwang6/myskill

插件可以將 codex 同第三方平台連接，例如 github、figma、gmail 嘅插件，會叫你登錄你嘅賬號，之後 codex 就可以攞到你賬號下嘅數據，推薦你可以安裝呢幾個插件。

6 自動化

可以叫佢每日某個時間自動跑一段流程。例如每日朝早自動掃描 GitHub 上嘅 issue，生成 daily summary。

2）實操：用 Codex 裝一個 PPT Skill

嚟個最具體嘅練手場景。

打開 Codex，同佢講：

幫我整一個 HTML-PPT 嘅 Skill。流程係：1 我發一段文字內容；2 佢問我要咩風格（極簡 / 商務 / 活潑）；3 佢用 pptx 庫生成 .pptx 文件保存到桌面。

Codex 會：

1 創建一個 Skill 文件夾，例如~/.codex/skills/ppt-maker/

2 寫一個 SKILL.md，定義觸發詞同執行流程

3 裝好需要嘅依賴（python-pptx）

4 跑一次測試，確認用得

下次發「幫我將下面呢段內容做成商務風 PPT」，Codex 自動調用呢個 Skill，幾十秒後桌面就多咗一個 .pptx 文件。

3）Claude Code 桌面端

邏輯同 Codex 幾乎一樣，分別在於：

模型用嘅係 Claude（Opus / Sonnet）
寫作、長文分析、複雜指令理解上比 Codex 強一檔

兩邊各訂一個會員，加埋 $40/月

如果只能揀一個，睇主要場景：

主要做產品 / 寫代碼 → Codex
主要寫內容 / 做知識管理 → Claude Code

03 進階：CLI 版本 Agent 下載同安裝

桌面端用熟咗之後，會感覺到佢嘅天花板。

佢冇辦法跑後台任務，冇辦法同 bash 工作流深度結合，冇辦法接任意模型 API。

呢個時候就應該上 CLI 喇。呢度我只推薦 claude code CLI，亦可以搭配國產模型 API。

mac 上打開 terminal，window 打開 powershell

喺命令行輸入下面，CLI 版本嘅下載都好簡單，一行命令：

# Claude Code CLI
npm install -g @anthropic-ai/claude-code

裝完之後喺終端cd到項目目錄，打claude或codex，回車，就入對話界面喇。

CLI 嘅體驗同桌面端最大嘅分別：佢係跑喺真實嘅終端環境入面。

佢可以直接讀、可以直接執行任意 Bash、shell 命令、Git 操作、Docker 容器，可以接入本地嘅任何腳本、工具、CLI。

可以學一啲常用嘅快捷操作，例如 shift+TAB 切換模型，/ 調用命令。

對一個 AI 嚟講，用得終端約等於可以操作成部電腦。

04 必備工具：CC switch

CLI 用熟之後，下一個問題就嚟喇。

claude、oepnai 買嘅套餐 token 唔夠用點算？

呢個時候需要嘅係國產模型 API 做平替。

而家智譜、minimax、DeepSeek 最新旗艦模型做得都幾好，代碼場景完全可以用佢哋，價錢仲平好多。

但手動切模型好麻煩。

今日想用 Claude Sonnet，聽日想切 GLM 4.7，後日又想切返去。

CC Switch 可以做到一鍵切換。

下載地址：

一個圖形化嘅 API 管理工具，專門管理 Claude Code、Codex CLI 等 Agent 嘅模型來源。喺入面可以：

註冊多個模型供應商（Anthropic 官方、智譜、Minimax、Kimi、各種中轉站）
一鍵切換當前 Agent 使用嘅 API
管理 API Key、統計用量
順便管理本地嘅 Skill 庫

操作流程超簡單：

1 喺主界面，揀 Agent 廠商，例如 Claude Code

2 揀模型 API 廠商，例如智譜

3 輸入 API Key

4 保存，按啓用

5 重新打開 Claude Code，已經係用緊 GLM 喇

切換一次大概 10 秒。

05 模型 API 係咩

插入一段基礎知識，因為好多人對 API 呢個概念係模糊嘅。

模型 API，就係訪問大模型嘅地址同鎖匙。

每次同 Agent 發訊息嘅時候，背後發生嘅事大概係咁：

我 → Agent 客戶端 → 模型 API 接口 → 大模型服務器 → 返回結果 → 顯示出來

中間嗰個模型 API 接口，由三個核心參數定義：

1 API 地址（URL / Base URL）。訪問到大模型嘅路徑，例如https://api.DeepSeek.com

2 API Key。身份憑證，證明有權限用，證明費用從呢個賬户扣

3 模型名稱（Model）。用呢間廠商嘅邊個具體模型，例如claude-opus-4-7或glm-4.6

呢三個係必填項。仲有啲可選參數：流式輸出、思考深度（thinking）、温度（temperature）、最大輸出長度等等，平時唔使點鬱。

06 實操：喺 Claude Code 度配置國產模型 API

嚟個手把手嘅例子。以智譜 GLM 4.7 為例，亦係我自己主力嘅國產模型之一。

第一步：註冊攞 Key

去 open.bigmodel.cn 用國內手機號註冊，控制枱入面創建一個 API Key，複製保存。

智譜有個套餐叫 Coding 計劃，最低檔 49 元/月（國內各家價錢都差唔多），額度對個人用戶嚟講基本用唔曬。開一個就夠。

第二步：用 CC Switch 配置

打開 CC Switch：

1 揀 Claude Code 做目標 Agent

2 加新供應商，填：

名稱：智譜 GLM
Base URL：https://open.bigmodel.cn/api/anthropic
API Key：頭先複製嗰串
Model：glm-5.1

3 保存，按啓用

第三步：驗證

新開一個終端窗口（重要，舊窗口環境變量冇刷新），打claude，入對話。

是但問一句：

你現在可以回答我問題嗎？

回覆成功，即係配置成功。呢度都可以睇到配置嘅模型名稱同版本號。

同樣嘅方式接 Minimax

Minimax 嘅 API 地址係https://api.minimax.chat/v1（OpenAI 兼容）或者佢嘅 Anthropic 兼容地址。

我嘅 OpenClaw 後端就係接 Minimax，單價低、併發額度大，特別適合跑批量任務，夜晚採集 100 篇文章、批量生成 50 張圖呢啲。

點解國產模型都可以接到 Claude Code 度

Claude 同 OpenAI 呢兩間，定義咗行業入面兩套主流嘅 API 標準。

所有 Agent 客戶端（Claude Code、Codex CLI、Cursor、OpenClaw 等）預設對接嘅就係呢兩套之一。

國產模型廠商為咗令自家模型可以被 Claude Code、Cursor 呢啲工具調用，做咗一件事：幫自家 API 套上 Anthropic 兼容或者 OpenAI 兼容嘅外殼。

例如智譜嘅 API，訪問https://open.bigmodel.cn/api/anthropic係 Anthropic 兼容格式，

訪問https://open.bigmodel.cn/api/paas/v4係 OpenAI 兼容格式。

DeepSeek、Kimi、Minimax、千問，全部都一樣。

所以可以咁樣組合：

Agent 仲係 Claude Code（殼）
模型換成 GLM 4.7（腦）
體驗流暢度幾乎冇分別，token 價格降到 1/10

07 Skill 嘅統一管理

講完模型層，最後講 Skill。呢個係 coding Agent 真正嘅殺手鐧。

1）Skill 係咩（一句話版本）

Skill = 寫畀 AI 嘅 SOP（工作標準說明書）

日常重複做嘅某一類任務，將流程拆出嚟、將要求寫低、將輸入輸出定義好，存成一個 SKILL.md 文件，掉到 Agent 可以讀到嘅目錄度。一個 Skill 就搞掂。

下次用一句話觸發，Agent 自動跟 SOP 執行。

我做過 100 幾個 Skill，覆蓋：內容創作、產品經理、圖片製作、數據分析等等。

每個 Skill 都係一個我曾經手動做過 N 次嘅工作流。

2）三層架構：點樣令所有 Agent 共用同一套 Skill

只用 Claude Code 一間，Skill 放喺~/.claude/skills/就行。

但我同時用 Claude Code、Codex、Cursor、OpenClaw，四個 Agent，唔需要每個都維護一份

我用嘅係軟連結加分類倉庫嘅三層架構：

核心規則只有一條：永遠改全局，再同步到分類倉庫。

我自己開源嘅 skill 倉庫係咁：

你直接複製下面倉庫名就可以訪問或下載：https://github.com/zephyrwang6/倉庫名

每週覆盤嘅時候，我會叫 Claude Code 自動掃描~/.claude/skills/有冇新增 Skill，然後歸類、commit、push。一條命令嘅事。

3）Skill 點樣裝

我自己做嘅 100 幾個 Skill 已經開源咗，倉庫地址喺我嘅 GitHub 主頁。流程係：

1git clone到本地，幫我從https://github.com/zephyrwang6/myskill

2 複製需要嘅 Skill 文件夾到~/.claude/skills/下

3 重啟 Agent，觸發詞一發就用得

亦可以直接叫 Claude Code 幫我裝：

幫我從 https://github.com/zephyrwang6/myskill 倉庫裏
下載 brand-article 這個 skill，安裝到全局 skill 目錄。

佢會自動 clone、複製、確認 SKILL.md 格式正確。

1）Skill 點樣用

每個 Skill 嘅 SKILL.md 頂部都有一個 description 字段，定義咗佢幾時會被觸發。

例如我寫嘅 brand-article Skill，觸發詞係「商單」「甲方文章」「品牌合作」「推廣文章」「寫商單」。

講嘢入面帶呢啲詞，Agent 就會自動加載呢個 Skill 嘅完整內容，跟住入面嘅流程行。

唔使記觸發詞，自然講就得。Anthropic 設計 Skill 嘅時候係用漸進式披露原則，平時只加載 Skill 名同描述，相關嘅時候先加載全文。

08 OpenClaw：令 Agent 一直生猛

行到呢一步，應該建立一個習慣：遇事不決，先揾 Agent。

查資料、下載互聯網上嘅任意內容、做數據分析、整理文件夾、搜尋電腦上嘅文件、做 PPT、做 Excel，再技術啲，OpenClaw 報錯、終端命令行操作失敗，都可以掉畀 Agent 解決。佢比互聯網上任何教學都可靠，因為佢可以直接睇到我電腦嘅真實狀態。

帶住呢個心態再嚟睇 OpenClaw。

1）OpenClaw 係咩，可以做啲咩

好多人問我：「你點樣做到飛書發條訊息佢就喺電腦上做嘢？」

答案就係 OpenClaw。

佢係一個常駐後台嘅 Claude Code，前面掛咗一個 IM 網關。

飛書度發條訊息 → IM 網關接收 → 餵畀 OpenClaw 後台 → 佢操作電腦文件、調 API、跑腳本 → 將結果發返去飛書。

我嘅 OpenClaw 配置：

後端 Agent：OpenClaw（小龍蝦）開源版本
接入 IM：飛書機械人
模型：Minimax（量大實惠）
任務類型：每日採集、定時歸檔、文檔同步、批量出圖、夜間爬蟲

佢最大嘅價值係離開電腦都可以用 Agent。出街嗰陣，見到一個唔錯嘅網頁內容，飛書度講一句「將呢個網頁存到我嘅素材庫 03 播客分類度」，OpenClaw 就會喺屋企嘅 Mac 上搞掂。

但啱啱入門就咪搞 OpenClaw 住。佢適合嗰啲已經將 Claude Code + Skill 跑通、有大量重複自動化需求嘅進階玩家。前 90% 嘅需求，Claude Code 桌面端加幾個 Skill 已經夠用。

2）安裝 OpenClaw

OpenClaw 係開源項目，去 GitHub 搜 OpenClaw 揾到官方倉庫。

安裝呢步唔使啃文檔，直接將官方倉庫 README 連結掉畀 Claude Code，叫佢邊讀邊裝：

幫我在本地安裝 OpenClaw。
倉庫地址是：https://github.com/.../openclaw
我的系統是 macOS。
裝完跑一次自檢，確認能正常啓動。

Agent 會自己 clone 倉庫、裝依賴、寫配置、跑啟動命令。中間有報錯就將報錯貼返去叫佢改，比起對住教學一行一行抄快十倍。

類似嘅開源 Agent 框架仲有 hermes，可以瞭解嚇，但唔推薦用，文檔同生態都比 OpenClaw 差一檔。

3）幫 OpenClaw 配置模型 API

OpenClaw 係開源框架，自帶模型，要運行就一定要接一個外部模型 API。

兩條路：

一係用 CC Switch 配置，同之前幫 Claude Code 配國產模型一個套路，揀 OpenClaw 做目標 Agent，加供應商，填 URL 同 Key 就得。

二係直接叫 Agent 幫我配。將模型廠商嘅文檔連結同 Key 掉畀 Claude Code：

我想在 OpenClaw 裏接智譜 GLM 4.7 的 API。
這是文檔：https://open.bigmodel.cn/dev/api
我的 Key 是 xxx
請配置好，並跑一次測試確認能用。

Agent 自己讀文檔、寫配置、改環境變量、跑測試。每間廠商嘅文檔都唔同，智譜、Minimax、Kimi 嘅參數位置都唔同，硬啃冇必要。

我自己 OpenClaw 後端用嘅係 Minimax。OpenClaw 嘅特點係任務量大、跑得耐（夜晚採集、定時歸檔），單價低嘅國產模型最抵。Minimax 嘅併發額度都大，跑批量任務唔易卡。

09 總結：實操路線

上面基本講曬所有你用得到嘅 Agent，接下來就差動手實踐，

安裝、註冊、登錄、訂閲只係開始，當你叫佢幫你製作你工作最常用嘅文檔，用 Skill 令佢喺你休息嘅時候幫你打工時，你就獲取到呢個時代最大嘅複利，令 Agent 為你打工。

下面做咗總結，一個全面嘅實踐路線圖

Stage 1：建立感覺（第 1 週）

下載 Claude Code 桌面端或 Codex 桌面端
訂閲 Pro 會員（搞唔掂就去鹹魚）
同佢傾一週，掉任意文件畀佢處理，感受嚇佢同豆包嘅分別

Stage 2：裝第一個 Skill（第 2 週）

安裝網絡上比較火嘅 skill
揾一個每日重複做嘅工作流
叫 Agent 幫我封裝成 Skill
用一句話觸發，體驗嚇「掉一句話出活」嘅感覺

Stage 3：進階 CLI（第 3 週）

裝 Claude Code CLI / Codex CLI
將工作目錄（例如 Obsidian 倉庫）接入落去
寫一個 CLAUDE.md 將偏好同工作流定義清楚

Stage 4：模型路由（第 4 週）

裝 CC Switch
註冊一個國產模型（智譜、minimax）
跑量任務全部轉到國產，主力套餐留俾攻堅

Stage 5：自動化（第 2 個月起）

搞掂 OpenClaw 或類似框架
將高頻自動化任務搬去後台
令 Agent 喺我瞓覺嘅時候繼續做嘢

10 最後

呢篇比較入門，適合第一次接觸 coding Agent 嘅人。

但講完呢啲，都只係工具嘅使用方法。

工具用得好嘅關鍵唔係工具本身，係理念。

要令 AI 真正變成生產力工具，讀文件、記偏好、跟 SOP 做嘢、人唔喺度嘅時候繼續工作，需要嘅係 coding Agent。

coding Agent 嘅核心從來唔係某一個工具。係模型、Harness、Skill 加上自己嘅上下文呢四樣嘢。

將呢步行通之後，可以叫佢接着做其他嘢。

點樣用 Agent 做知識管理，做 vibe coding，每一個方向單獨拎出嚟都係一篇長文。

如果大家想更系統咁掌握 coding Agent、Obsidian、Skill、Vibecoding 嘅技能，歡迎訂閲我嘅 AI 生產力專欄+社羣。接下來就會更新 Obsidian 更詳細系統嘅使用，仲有 vibecoding 基礎同 Coding Agent 嘅使用待更新。

前言

最近做了不少個人 Agent 定製諮詢，來諮詢的有產品、運營、營銷、自由職業的。

對於 AI 工具的使用和理解各不相同，唯有的共同點是都用過豆包。

聊到 Agent 的時候，很多人就各有各的理解。

chatbot、LLM、Agent、skill、Prompt，這些概念交錯起來。

讓有些人誤以為 chatbot 為代表的產品是 Agent、LLM 是 Agent。

但這些 AI 對話產品不像 Agent 那樣可以操作你的電腦、文件、skill...

使用豆包，每次想讓它乾點什麼，得手動傳文件給它，得把背景從頭交代一遍。它沒有記憶，沒有 Skill，也沒辦法主動操作電腦、瀏覽器、本地的任何工具。

Agent 不一樣。

它能直接讀電腦上的文件，調用工具，用 Skill 把一套工作流封裝成一個動作交付出來。

舉個最簡單的例子。想做一份 PPT，基於本地寫過的內容。常規流程是這樣：

選擇內容
確定風格
輸出成品

熟練之後，可以把這套流程做成一個 PPT 製作 Skill。

下次只要發一段內容，調用 Skill，PPT 就出來了。

再進一步，還可以讓它定時執行。每天早上 8 點，主動掃描電腦上當天新增的筆記，掃描訂閲的 RSS 源，自動生成當天的內容卡片、PPT 或者其他任何形式。

你睡着的時候它還在幫你幹活，這才是 Agent。

文章指引

如果還沒用過 coding Agent，或者已經在用但想更進一步，看完這篇你應該能搞清楚下面這些事：

什麼是 coding Agent，市面上的產品有哪些
怎麼下載、註冊、訂閲最主流的Agent 客戶端
怎麼從桌面端進階到 CLI
怎麼在 Claude Code 裏接國產模型 API 做平替
OpenClaw 怎麼配，怎麼把 Agent 接到飛書裏跑自動化
Skill 怎麼做到全局統一管理，多端複用

先說我目前的用法，建立個畫面：

1 我的主力是 codex 和 claude code。

Codex 用來做產品，寫代碼、做原型、跑工程；Claude Code 用來寫內容，公眾號、專欄、商單。

2 國產模型平替。

主力套餐都有 token 限制，跑大了會被限制。我在 Claude Code 裏接了智譜 GLM 和 Minimax 的 API，基礎的任務全走國產，便宜，夠用。

3 OpenClaw 接 Minimax 的 API。跑一些定時和自動化任務，自動化採集和投遞。

這套組合一個月成本大概 300-500 塊。

有了上面這個介紹，如果你想全面的瞭解和使用 Agent，下面正式開始。

01 什麼是 coding Agent

我看過比較清晰的一個定義：

模型（LLM）+ Harness 框架 = Agent

模型是大腦，Harness 是記憶和手腳。模型決定它有多聰明，Harness 決定怎麼做事情。

按這個定義，市面上的 coding Agent 大概可以分成幾類：

1）CLI 類（終端命令行）

特點是門檻高，得會用終端。但天花板也最高，可以接任意模型 API、裝 Skill、操作整個文件系統。

Claude Code：Anthropic 出品，寫作、長文分析、代碼輸出的天花板
Codex CLI：OpenAI 出品，工程能力強，做產品首選
Gemini CLI：Google 出品，多模態強，配合海量上下文
Kimi CLI / 千問 CLI：國內廠商跟進版本

2）桌面客戶端類

開箱即用，下載、登錄、訂閲會員就能跑。比 CLI 友好太多，深度定製能力弱一些。

Claude Cowork（Claude Desktop）：Anthropic 官方桌面端
Codex App：OpenAI 的桌面端
Minimax Agent、Skywork Desktop：國產桌面端

3）IDE / 代碼編輯器類

編輯器加 AI 的結合，適合一邊瀏覽代碼、文件，一邊讓 AI 改。

Cursor：基於 VS Code 改的 AI IDE，寫代碼神器
Trae：字節出品，國產 Cursor 平替
Antigravity：Google 出品，能白嫖一年 Gemini 額度
Codebuddy：騰訊出品

4）Agent 系統類

像一個一直活着的 Claude Code，不需要打開終端，可以對接即時通訊工具，如飛書、釘釘，發條消息它就去幹活。侷限性在於你看不到它在幹嘛，以及經常會抽風，換了模型效果就變了。

OpenClaw（小龍蝦）：開源 Agent 框架，可以接飛書、Telegram、Signal 等 IM
Hermes、Opencode：其他開源 Harness 框架

5）網頁端

適合交付物標準化的任務，生成網站、PPT、報告這種。但深度上下文不行，訂閲費一般都很貴。

Lovable、Figma Make、Notion AI、Manus：瀏覽器裏直接用的 Agent

02 最推薦的入門客戶端：Codex + Claude Code 桌面端

第一次接觸 coding Agent，建議不要直接上 CLI。先用桌面端，把感覺建立起來。

我現在主要推薦兩個：

Codex 桌面端：從chatgpt.com/codex下載，需要 ChatGPT Plus（$20/月）或 Pro（$200/月）
Claude Code 桌面端：從claude.ai下載，需要 Claude Pro（$20/月）或 Max 套餐

可以先用免費額度跑幾天試試感覺，再決定要不要訂閲。

註冊和訂閲這步，國內會卡一下，訂閲支付、虛擬手機號、節點之類的。

搞不定就去鹹魚解決，別在這一步就耗掉熱情了。

1）Codex 桌面端怎麼用

下載完打開，界面很乾淨，重點關注幾塊：

1 項目文件夾

最關鍵的設置。要讓 Codex 知道它能操作哪個文件夾。

我一般會指定一個項目目錄，比如某個 obsidian 倉庫，Codex 後面所有的讀寫都在這裏發生。

2 模型選擇

Codex 內部可以切模型，GPT-5.2、GPT-5.3 Codex、GPT-5.4 都行。

日常用默認就行，複雜任務切 Codex 專用模型。

3 安全策略

我自己的策略：日常項目設成自動執行所有命令，敏感項目（比如有線上憑據的）保持每次確認。

4 對話流、瀏覽器預覽、終端

Codex 桌面端的強項是有內置瀏覽器和終端。

寫完代碼可以直接打開瀏覽器預覽效果，跑命令也不用切窗口，所有動作在一個界面裏完成。

5 Skill 和插件

Codex 也支持 Skill（原生叫 Custom Instructions / Tools），可以裝第三方插件，也可以自己寫。

可以下載我開源的 skill：github.com/zephyrwang6/myskill

插件能套codex 和第三方平台連接，比如 github、figma、gmail 的插件，會讓你登錄你的賬號，後續 codex 就能獲取你賬號下的數據，推薦你可以安裝這幾個插件。

6 自動化

可以讓它每天某個時間自動跑一段流程。比如每天早上自動掃描 GitHub 上的 issue，生成 daily summary。

2）實操：用 Codex 裝一個 PPT Skill

來個最具體的練手場景。

打開 Codex，跟它說：

幫我作一個 HTML-PPT 的 Skill。流程是：1 我發一段文字內容；2 它問我要什麼風格（極簡 / 商務 / 活潑）；3 它用 pptx 庫生成 .pptx 文件保存到桌面。

Codex 會：

1 創建一個 Skill 文件夾，比如~/.codex/skills/ppt-maker/

2 寫一個 SKILL.md，定義觸發詞和執行流程

3 裝好需要的依賴（python-pptx）

4 跑一次測試，確認能用

下次發 "幫我把下面這段內容做成商務風 PPT"，Codex 自動調用這個 Skill，幾十秒後桌面上就多了一個 .pptx 文件。

3）Claude Code 桌面端

邏輯和 Codex 幾乎一樣，區別在於：

模型用的是 Claude（Opus / Sonnet）
寫作、長文分析、複雜指令理解上比 Codex 強一檔

兩邊各訂一個會員，加起來 $40/月

如果只能選一個，看主要場景：

主要做產品 / 寫代碼 → Codex
主要寫內容 / 做知識管理 → Claude Code

03 進階：CLI 版本 Agent 下載和安裝

桌面端用熟了之後，會感覺到它的天花板。

它沒辦法跑後台任務，沒辦法和 bash 工作流深度結合，沒辦法接任意模型 API。

這時候就該上 CLI 了。這裏我只推薦 claude code CLI，也可以搭配國產模型 API。

mac 上打開 terminal，window 打開 powershell

在命令行輸入下面，CLI 版本的下載也很簡單，一行命令：

# Claude Code CLI
npm install -g @anthropic-ai/claude-code

裝完之後在終端裏cd到項目目錄，敲claude或codex，回車，就進入對話界面了。

CLI 的體驗和桌面端最大的區別：它跑在真實的終端環境裏。

它能直接讀能直接執行任意 Bash、shell 命令、Git 操作、Docker 容器，能接入本地的任何腳本、工具、CLI。

可以學一些常用的快捷操作，比如 shift+TAB 切換模型，/調用命令。

對一個 AI 來說，能用終端約等於能操作整台電腦。

04 必備工具：CC switch

CLI 用熟之後，下一個問題就來了。

claude、oepnai 買的套餐 token 不夠用怎麼辦？

這時候需要的是國產模型 API 做平替。

現在智譜、minimax、DeepSeek 最新旗艦模型做的都挺不錯了，代碼場景完全可以用他們，價格還便宜不少。

但手動切模型很麻煩。

今天想用 Claude Sonnet，明天想切 GLM 4.7，後天又想切回去。

CC Switch 可以做到一鍵切換。

下載地址：

一個圖形化的 API 管理工具，專門管理 Claude Code、Codex CLI 等 Agent 的模型來源。在裏面可以：

註冊多個模型供應商（Anthropic 官方、智譜、Minimax、Kimi、各種中轉站）
一鍵切換當前 Agent 使用的 API
管理 API Key、統計用量
順便管理本地的 Skill 庫

操作流程巨簡單：

1 在主界面，選擇 Agent 廠商，比如 Claude Code

2 選擇模型 API 廠商，比如智譜

3 輸入 API Key

4 保存，點啓用

5 重新打開 Claude Code，已經在跑 GLM 了

切換一次大概 10 秒。

05 模型 API 是什麼

插一段基礎知識，因為很多人對 API 這個概念是模糊的。

模型 API，就是訪問大模型的地址和鑰匙。

每次和 Agent 發消息的時候，背後發生的事情大概是這樣：

我 → Agent 客戶端 → 模型 API 接口 → 大模型服務器 → 返回結果 → 顯示出來

中間那個模型 API 接口，由三個核心參數定義：

1 API 地址（URL / Base URL）。訪問到大模型的路徑，比如https://api.DeepSeek.com

2 API Key。身份憑證，證明有權限用，證明費用從這個賬户扣

3 模型名稱（Model）。用這家廠商的哪個具體模型，比如claude-opus-4-7或glm-4.6

這三個是必填項。剩下還有些可選參數：流式輸出、思考深度（thinking）、温度（temperature）、最大輸出長度等等，平時不太需要動。

06 實操：在 Claude Code 裏配置國產模型 API

來個手把手的例子。以智譜 GLM 4.7 為例，也是我自己主力的國產模型之一。

第一步：註冊拿 Key

去open.bigmodel.cn用國內手機號註冊，控制枱裏創建一個 API Key，複製保存。

智譜有個套餐叫 Coding 計劃，最低檔 49 元/月（國內各家價格都差不多），額度對個人用戶來說基本用不完。開一個就夠。

第二步：用 CC Switch 配置

打開 CC Switch：

1 選 Claude Code 作為目標 Agent

2 添加新供應商，填：

名稱：智譜 GLM
Base URL：https://open.bigmodel.cn/api/anthropic
API Key：剛才複製的那串
Model：glm-5.1

3 保存，點啓用

第三步：驗證

新開一個終端窗口（重要，舊窗口環境變量沒刷新），敲claude，進入對話。

隨便問一句：

你現在可以回答我問題嗎？

回覆成功，說明配置成功了。這裏也能看到配置的模型名稱和版本號。

同樣的方式接 Minimax

Minimax 的 API 地址是https://api.minimax.chat/v1（OpenAI 兼容）或者它的 Anthropic 兼容地址。

我的 OpenClaw 後端就是接的 Minimax，單價低、併發額度大，特別適合跑批量任務，夜裏採集 100 篇文章、批量生成 50 張圖這種。

為什麼國產模型也能接到 Claude Code 裏

Claude 和 OpenAI 這兩家，定義了行業裏兩套主流的 API 標準。

所有 Agent 客戶端（Claude Code、Codex CLI、Cursor、OpenClaw 等）默認對接的就是這兩套之一。

國產模型廠商為了讓自家模型能被 Claude Code、Cursor 這些工具調用，幹了一件事：給自家 API 套上 Anthropic 兼容或者 OpenAI 兼容的外殼。

比如智譜的 API，訪問https://open.bigmodel.cn/api/anthropic是 Anthropic 兼容格式，

訪問https://open.bigmodel.cn/api/paas/v4是 OpenAI 兼容格式。

DeepSeek、Kimi、Minimax、千問，全都一樣。

所以可以這樣組合：

Agent 還是 Claude Code（殼）
模型換成 GLM 4.7（腦）
體驗流暢度幾乎沒變化，token 價格降到 1/10

07 Skill 的統一管理

講完模型層，最後講 Skill 。這是 coding Agent 真正的殺手鐧。

1）Skill 是什麼（一句話版本）

Skill = 寫給 AI 的 SOP（工作標準說明書）

日常重複做的某一類任務，把流程拆出來、把要求寫下來、把輸入輸出定義好，存成一個 SKILL.md 文件，丟到 Agent 能讀到的目錄裏。一個 Skill 就成了。

下次用一句話觸發，Agent 自動按 SOP 執行。

我做過 100 多個 Skill，覆蓋：內容創作、產品經理、圖片製作、數據分析等等。

每個 Skill 都是一個我曾經手動做過 N 遍的工作流。

2）三層架構：怎麼讓所有 Agent 共用同一套 Skill

只用 Claude Code 一家，Skill 放在~/.claude/skills/就行。

但我同時用 Claude Code、Codex、Cursor、OpenClaw，四個 Agent，不需要每個都維護一份

我用的是軟連結加分類倉庫的三層架構：

核心規則只有一條：永遠改全局，再同步到分類倉庫。

我自己的開源的 skill倉庫是這樣：

你直接複製下面倉庫名就能訪問或下載：https://github.com/zephyrwang6/倉庫名

每週覆盤的時候，我會讓 Claude Code 自動掃描~/.claude/skills/有沒有新增 Skill，然後歸類、commit、push。一條命令的事。

3）Skill 怎麼裝

我自己做的 100 多個 Skill 已經開源了，倉庫地址在我的 GitHub 主頁。流程是：

1git clone到本地，幫我從https://github.com/zephyrwang6/myskill

2 複製需要的 Skill 文件夾到~/.claude/skills/下

3 重啓 Agent，觸發詞一發就能用

也可以直接讓 Claude Code 幫我裝：

幫我從 https://github.com/zephyrwang6/myskill 倉庫裏
下載 brand-article 這個 skill，安裝到全局 skill 目錄。

它會自動 clone、複製、確認 SKILL.md 格式正確。

1）Skill 怎麼用

每個 Skill 的 SKILL.md 頂部都有一個 description 字段，定義了它什麼時候被觸發。

比如我寫的 brand-article Skill，觸發詞是 "商單" "甲方文章" "品牌合作" "推廣文章" "寫商單"。

說話裏帶這些詞，Agent 就會自動加載這個 Skill 的完整內容，按裏面的流程走。

不需要記觸發詞，自然說就行。Anthropic 設計 Skill 的時候用的是漸進式披露原則，平時只加載 Skill 名字和描述，相關的時候才加載全文。

08 OpenClaw：讓 Agent 一直活着

走到這一步，應該建立起一個習慣：遇事不決，先找 Agent。

查資料、下載互聯網上的任意內容、做數據分析、整理文件夾、搜索電腦上的文件、做 PPT、做 Excel，再技術一點，OpenClaw 報錯、終端命令行操作失敗，都可以丟給 Agent 解決。它比互聯網上任何教程都靠譜，因為它能直接看到我電腦的真實狀態。

帶着這個心態再來看 OpenClaw。

1）OpenClaw 是什麼，能幹什麼

很多人問我："你怎麼做到飛書發條消息它就在電腦上幹活？"

答案就是 OpenClaw。

它是一個常駐後台的 Claude Code，前面掛了一個 IM 網關。

飛書裏發條消息 → IM 網關接收 → 餵給 OpenClaw 後台 → 它操作電腦文件、調 API、跑腳本 → 把結果發回飛書。

我的 OpenClaw 配置：

後端 Agent：OpenClaw（小龍蝦）開源版本
接入 IM：飛書機器人
模型：Minimax（量大實惠）
任務類型：每日採集、定時歸檔、文檔同步、批量出圖、夜間爬蟲

它最大的價值是離開電腦也能用 Agent。出門在外，看到一個不錯的網頁內容，飛書裏發一句 "把這個網頁存到我的素材庫 03 播客分類裏"，OpenClaw 就在家裏的 Mac 上把活幹完。

但剛入門先別折騰 OpenClaw。它適合那些已經把 Claude Code + Skill 跑通、有大量重複自動化需求的進階玩家。前 90% 的需求，Claude Code 桌面端加幾個 Skill 已經夠用了。

2）安裝 OpenClaw

OpenClaw 是開源項目，去 GitHub 搜 OpenClaw 找到官方倉庫。

安裝這一步不用啃文檔，直接把官方倉庫 README 連結丟給 Claude Code，讓它邊讀邊裝：

幫我在本地安裝 OpenClaw。
倉庫地址是：https://github.com/.../openclaw
我的系統是 macOS。
裝完跑一次自檢，確認能正常啓動。

Agent 會自己 clone 倉庫、裝依賴、寫配置、跑啓動命令。中間有報錯就把報錯貼回去讓它改，比對着教程一行一行抄快十倍。

類似的開源 Agent 框架還有 hermes，可以瞭解一下，但不推薦用，文檔和生態都比 OpenClaw 差一檔。

3）給 OpenClaw 配置模型 API

OpenClaw 是開源框架，自帶模型，跑起來必須接一個外部模型 API。

兩條路：

一是用 CC Switch 配置，和前面給 Claude Code 配國產模型一個套路，選 OpenClaw 作為目標 Agent，添加供應商，填 URL 和 Key 就行。

二是直接讓 Agent 幫我配。把模型廠商的文檔連結和 Key 丟給 Claude Code：

我想在 OpenClaw 裏接智譜 GLM 4.7 的 API。
這是文檔：https://open.bigmodel.cn/dev/api
我的 Key 是 xxx
請配置好，並跑一次測試確認能用。

Agent 自己讀文檔、寫配置、改環境變量、跑測試。每家廠商的文檔都不一樣，智譜、Minimax、Kimi 的參數位置都不同，硬啃沒必要。

我自己 OpenClaw 後端用的是 Minimax。OpenClaw 的特點是任務量大、跑得久（夜裏採集、定時歸檔），單價低的國產模型最划算。Minimax 的併發額度也大，跑批量任務不容易卡。

09 總結：實操路線

上面基本講完了所有你能用的到的 Agent，接下來就差動手實踐了，

安裝、註冊、登錄、訂閲只是開始，當你讓它為你製作你工作最常用的文檔，用 Skill 讓它在你休息的時候給你打工時，你就獲取到了這個時代最大的複利，讓 Agent 為你打工。

下面做了總結，一個全面的實踐路線圖

Stage 1：建立感覺（第 1 周）

下載 Claude Code 桌面端或 Codex 桌面端
訂閲 Pro 會員（搞不定就鹹魚）
跟它聊一週，丟任意文件給它處理，感受它和豆包的區別

Stage 2：裝第一個 Skill（第 2 周）

安裝網絡上比較火的 skill
找一個每天重複做的工作流
讓 Agent 幫我封裝成 Skill
用一句話觸發，體驗一下 "丟一句話出活" 的感覺

Stage 3：進階 CLI（第 3 周）

裝 Claude Code CLI / Codex CLI
把工作目錄（比如 Obsidian 倉庫）接入進去
寫一個 CLAUDE.md 把偏好和工作流定義清楚

Stage 4：模型路由（第 4 周）

裝 CC Switch
註冊一個國產模型（智譜、minimax）
跑量任務全切到國產，主力套餐留給攻堅

Stage 5：自動化（第 2個月起）

折騰 OpenClaw 或類似框架
把高頻自動化任務挪到後台
讓 Agent 在我睡覺的時候繼續幹活

10 最後

這篇比較入門，適合第一次接觸 coding Agent 的人。

但講完這些，也只是工具的使用方法。

工具用好的關鍵不是工具本身，是理念。

要讓 AI 真正變成生產力工具，讀文件、記偏好、按 SOP 幹活、人不在的時候繼續工作，需要的是 coding Agent。

coding Agent 的核心從來不是某一個工具。是模型、Harness、Skill 加上自己的上下文這四樣東西。

把這一步走通之後，可以讓它接着做別的事情。

怎麼用 Agent 做知識管理，做 vibe coding，每一個方向單獨拎出來都是一篇長文。

如果大家想要更系統的掌握 coding Agent、Obsidian、Skill、Vibecoding 的技能，歡迎訂閲我的 AI 生產力專欄+社羣。接下來就要更新 Obsidian 更詳細系統的使用、還有 vibecoding 基礎和 Coding Agent 的使用待更新。