【9類場景】給codex Agent加裝的能力手腳清單

作者:嬌姐話AI圈
日期:2026年6月26日 下午3:30
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

為 Agent 加裝真實工作能力:9 類場景工具清單與接入判斷法

整理版摘要

呢篇文章係嬌姐(前榮耀員工,專注 AI 效率工具)嘅第 562 篇分享。佢發現好多人用 AI Agent 仲停留喺「叫佢聊天、寫文案、改代碼」,但真正好用嘅 Agent 應該可以幫你查飛書日程、規劃高德路線、整理 Obsidian 筆記、處理 GitHub Issue、生成剪映草稿等等。佢想解決嘅問題係:點樣畀自己嘅 Agent 增加真實工作能力?

嬌姐整理咗 6 種加能力嘅方式:官方 CLI、官方 Skill、MCPAPI/SDK、瀏覽器自動化、本地文件權限。然後按 9 類場景(辦公、地圖、知識庫、網頁操作、資料抓取、內容創作、開發部署、設計工具、新手推薦)逐一介紹具體工具同接入方法,仲畀咗可信度判斷標準(官方 > 社區 > 風險)。整體結論係:先睇場景,再揀接法,優先揀官方工具,跟住佢推薦嘅安裝路線順序去做。

呢篇文唔單止係清單,仲係實戰指南,有曬安裝命令同配置範例,適合想用 Agent 真正做嘢嘅普通用戶同開發者。

  • 加能力有 6 種方式CLI、Skill、MCPAPI/SDK、瀏覽器自動化、本地文件權限,各有適用場景同穩定性。
  • 判斷工具可信度:官方 > 社區 > 風險(逆向接口/瀏覽器自動化),優先揀官方 CLIMCP
  • 辦公首選飛書官方 CLI + Skills;地圖用高德 MCP;知識庫用 Obsidian 本地文件權限或社區 MCP
  • 網頁操作同資料抓取分別用 PlaywrightMCP/CLI)同 Firecrawl;內容創作工具(剪映、小宇宙)多為社區方案,建議備份同用小號測試。
  • 新手安裝路線:先裝 Agent(Codex/Claude Code),再裝辦公、瀏覽器、地圖、知識庫,最後按職業補工具(開發、內容等)。
值得記低
工具

高德地圖 MCP 配置模板

用於 Codex 或 Claude Code 嘅 MCP 伺服器設定,需要先用高德開放平台申請 API Key。

Skill

飛書 Agent Skills 安裝

必須執行 npx skills add larksuite/cli -y -g 先安裝 Skills,Agent 先至可以正確調用飛書 CLI。

整理重點

一、加能力嘅6種方式同可信度判斷

好多人一講 Agent 工具就只諗到 MCP,但其實加能力至少有 6 種方式。嬌姐話,呢啲方式各有特性:官方 CLI、官方 Skill、MCPAPI / SDK、瀏覽器自動化同本地文件權限。

所有工具可以分三類可信度:官方(官方 CLIMCP、Skill,優先推薦);社區(成熟但要注意版本同維護狀態);風險(逆向接口或瀏覽器自動化,有失效同賬號風險)。判斷順序:有官方 CLI 優先官方 CLI,有官方 Agent Skill 就一齊安裝 Skill,有官方 MCP 就用官方 MCP,只有社區工具就標註非官方,無接口先考慮瀏覽器自動化,本地資料優先文件夾權限。

整理重點

二、辦公協作同地圖出行:飛書官方 + 高德 MCP

飛書好特別,唔係單純 MCP,而係官方 CLI + Agent Skills,接近一套完整工具箱。佢可以發消息、查日曆、寫飛書文檔、操作表格同多維表格 Base、查任務、處理會議紀要等等。

容易漏掉嘅一步:npx skills add larksuite/cli -y -g 唔係裝 CLI 本體,而係安裝飛書嘅 Agent Skills。無咗呢步,Agent 唔一定知道點樣更好咁調用飛書能力。

  • 請用 lark-cli 查詢我今日嘅日程,整理成待辦清單。
  • 請用 lark-cli 創建一篇飛書文檔,標題係「本週覆盤」。
  • 涉及羣發消息、改文檔、審批、外發內容時,最好等 Agent 生成草稿,再由人確認。

地圖類工具方面,高德地圖 MCP 係官方能力。可以做地點搜索、路線規劃、天氣查詢、POI 查詢、出行攻略。配置好簡單:去高德開放平台創建應用,揀 Web 服務,複製 AMAP_MAPS_API_KEY,放落 MCP 設定就得。

高德 MCP 配置範例 json
{
  "mcpServers": {
    "amap-maps": {
      "command": "cmd",
      "args": ["/c", "npx", "-y", "@amap/amap-maps-mcp-server"],
      "env": {
        "AMAP_MAPS_API_KEY": "你的高德Key"
      }
    }
  }
}
整理重點

三、知識庫、網頁操作同資料抓取:Obsidian / Playwright / Firecrawl

知識庫方面,Obsidian 最簡單接法係本地文件夾權限,因為 vault 本身就係 Markdown 文件夾。你可以叫 Agent 直接讀寫呢啲 .md 檔案,整理筆記、歸類選題都得。如果想用 API 操作,就要裝社區插件 Local REST API,配合Obsidian MCP(社區方案)。

好多網站無 API 亦無 MCP,例如後台、表單、內部系統,呢個時候可以叫 Agent 操作瀏覽器。

  1. 1 Playwright MCP:適合畀 Agent 自主探索網頁、點擊、填表、截圖。命令:npx @playwright/mcp@latest
  2. 2 Playwright CLI + Skills:官方推出嘅 playwright-cli,適合 coding agent,可能比 MCP 更省 token,因為 MCP 會將頁面快照塞入上下文。
  3. 3 Firecrawl:唔係要「點網頁」,而係要抓內容轉 Markdown 做總結。用 MCP 或 CLI 都得,要先註冊攞 API Key。常用於競品調研、資料抓取、網站轉 Markdown。
整理重點

四、內容創作同開發部署:社區工具謹慎用,官方 CLI 最穩陣

內容創作工具要特別小心。飛書、高德、GitHub 屬於官方能力,穩定性高;但剪映、小紅書、小宇宙、OiiOii、可靈、RunwaySuno 等,好多係社區 Skill、瀏覽器自動化或逆向接口。使用前建議:先備份素材、備份草稿、用小號或測試賬號,唔好一開始就批量操作。

  • 剪映 Skill(社區):可以創建草稿、導入素材、加字幕、加配音、加音樂、生成時間線。自動導出主要支援 Windows + 剪映專業版 5.9 及以下,6.0+ 可能有彈窗打斷。
  • 小宇宙 MCP(社區逆向):涉及登錄態同非官方接口,適合個人實驗,唔建議大規模自動化或接主力賬號。
  • AI 視頻平台(OiiOii等):常見接法係 Skill + 瀏覽器自動化 + 已登錄賬號,適合批量生成 prompt、自動提交任務。

至於開發部署工具,呢一類官方 CLI 最成熟,最適合 Agent 調用。例如 GitHub CLI(gh)、Vercel CLICloudflare Wrangler、Supabase CLI、Stripe CLI、Shopify CLI。你可以叫 Agent 用 gh 睇最近 issue、用 vercel 部署項目、用 supabase 初始化數據庫、用 stripe listen 啟動本地 webhook 測試。

Figma 唔係典型 CLI-first 工具,而家更適合用官方 MCP(https://mcp.figma.com/mcp)接 Agent,做到讀設計稿、生成代碼、對齊設計系統。

整理重點

五、新手安裝路線同總結

唔好一嚟就裝 50 個工具。建議跟住呢個順序:① 先裝 Agent(CodexClaude Code),跑通本地協作;② 裝辦公能力,優先飛書官方 CLI + Skills;③ 裝瀏覽器能力,用 Playwright;④ 裝地圖能力,接高德 MCP;⑤ 裝知識庫能力,最快係畀 Obsidian 文件夾權限;⑥ 按職業補工具。如果唔知自己需要邊個,可以先用 Composio、Zapier、Pipedream 呢類通用連接器兜底。

Agent 本身只係「大腦」。真正令佢變強嘅,係你幫佢接上嘅工具。

記住呢個判斷方法,你嘅 Agent 先至唔只係識得傾偈,而係真係開始幫你做嘢。


先關注後閲讀,嬌姐怕失去上進嘅你

文末嬌姐整理咗 heremes、openclaw 所有文章連結

想了解嬌姐撳文末連結


今日呢篇係嬌姐開公眾號以嚟嘅第562篇,我係持續堅持每日更新分享 AI 乾貨嘅嬌姐。

好多人用 AI Agent,仲停留喺「畀佢傾偈、寫文案、改程式碼」。

但真正好用嘅 Agent,唔止係識答問題,而係真係幫到你做嘢:查飛書日程、寫文檔、規劃高德路線、整理 Obsidian 筆記、打開網頁填表、讀取本地文件、部署網站、處理 GitHub Issue、生成剪映草稿、整理播客內容。

呢篇文章講一個核心問題:點樣畀自己嘅 Agent 增加真實工作能力?

一、畀 Agent 加能力,唔只有 MCP

而家好多人一提 Agent 工具,就淨係諗到 MCP。但實際上,畀 Agent 加能力至少有 6 種方式。

官方 CLI

是什麼官方命令行工具。

適合飛書、GitHub、部署、雲服務,穩定性通常最高。

官方 Skill

是什麼Agent 專用說明書同工具包。

適合複雜流程,例如辦公、文檔、內容生產。

MCP

是什麼Agent 通用工具協議。

適合地圖、網頁、數據庫、設計工具。

API / SDK

是什麼程式接口。

適合開發者深度定製。

瀏覽器自動化

是什麼等 Agent 好似人咁撳網頁。

適合冇 API/CLI 嘅網站。

本地文件權限

是什麼等 Agent 讀寫電腦資料夾。

適合整理資料、改文檔、批量處理。

CLI 係手,Skill 係說明書,MCP 係插口,API 係底層能力。

瀏覽器自動化係兜底方案,本地文件權限係最容易被忽略嘅生產力入口。

如果你係普通用戶,我建議你先從呢兩個 Agent 入手:Codex 適合程式碼、本地文件、自動化實操;Claude Code 適合 Skill 生態、複雜工作流程、MCP 接入。

Shell

# Codex Windows 官方安裝腳本

powershell -ExecutionPolicy

    ByPass -c "irm

    https://chatgpt.com/

    codex/install.ps1 | iex"

# Codex npm 安裝

npm install -g @openai/codex

# Claude Code

npm install -g

    @anthropic-ai/claude-code

claude

參考來源:OpenAI Codex CLI、openai/codex、Claude Code Quickstart。

二、先睇可信度,再決定裝唔裝

所有工具,我建議分成三類。

判斷 三類可信度

官方:官方 CLI、官方 MCP、官方 Skill,優先推薦。

社區:成熟社區工具,用得,但要睇版本同維護狀態。

風險:逆向接口或瀏覽器自動化,解決到問題,但有失效同賬號風險。

判斷順序:有官方 CLI 優先官方 CLI;有官方 Agent Skill 就一齊裝 Skill;有官方 MCP 就用官方 MCP;只有社區工具就標註非官方同風險;冇接口就考慮瀏覽器自動化;本地資料優先資料夾權限。

飛書 CLI、高德 MCP、GitHub CLI 呢類屬於官方能力,穩定性相對高。剪映 Skill、Obsidian MCP、小宇宙 MCP 呢類多數係社區工具,要睇維護狀態。小紅書、小宇宙逆向接口、各種網頁自動化,用得,但唔可以當成官方能力。

三、辦公協作:優先接官方 CLI

最典型係飛書。飛書比較特別,佢唔係單純 MCP,而係官方 CLI + Agent Skills,更接近一套完整工具箱。

佢可以發訊息、查日曆、寫飛書文檔、操作表格、操作多維表格 Base、查任務、處理會議紀要,亦可以處理電郵、審批、OKR 等辦公事項。

Shell

npm install -g @larksuite/cli

npx skills add larksuite/cli

    -y -g

lark-cli config init

lark-cli auth login

    --recommend

lark-cli auth status

容易漏咗嘅一步:npx skills add larksuite/cli -y -g 唔係裝 CLI 本身,而係安裝飛書嘅 Agent Skills。冇呢步,CLI 雖然可以畀人手動用,但 Agent 唔一定識得點樣更好噉調用飛書能力。

飛書 CLI 通常行登入授權,唔使你手動複製 API Key。執行 lark-cli auth login --recommend 之後,喺瀏覽器裏面登入授權就得。

示例 可以噉樣用

請用 lark-cli 查詢我今日嘅日程,並整理成待辦清單。

請用 lark-cli 創建一篇飛書文檔,標題係「本週覆盤」。

請將呢段會議記錄整理後寫入飛書文檔。

涉及羣發訊息、改文檔、審批、外發內容嘅時候,最好等 Agent 先生成草稿,再由人確認。

四、地圖出行:接高德 MCP

地圖類工具通常冇「畀普通人敲命令嘅官方 CLI」,更常見係官方 MCP 或 API。高德地圖 MCP 係官方能力。

佢可以做到地點搜索、路線規劃、天氣查詢、POI 查詢、出行攻略,亦可以將攻略點位導入高德地圖 App。

① 打開高德開放平台

入到控制枱,創建應用。

② 添加 Key

服務平台選擇 Web 服務。

③ 拎到環境變數

複製你嘅 AMAP_MAPS_API_KEY,用嚟做 MCP 配置。

JSON

{

  "mcpServers": {

    "amap-maps": {

      "command": "cmd",

      "args": ["/c", "npx",

        "-y", "@amap/

        amap-maps-mcp-server"],

      "env": {

        "AMAP_MAPS_API_KEY":

        "你嘅高德Key"

      }

    }

  }

}

適合場景包括旅行規劃、本地生活搜索、通勤路線、探店選址、城市攻略整理。你可以等佢規劃杭州一日遊、揾附近適合傾嘢嘅咖啡館,或者規劃從虹橋火車站到外灘最快嘅路線。

五、知識庫同筆記:Obsidian / Notion

呢類工具要分清楚:Notion 有官方 API/MCP 生態;Obsidian 更偏本地筆記軟件,主流係本地文件權限、社區插件同社區 MCP,唔係官方 CLI。

Obsidian 最簡單接法:本地資料夾權限

Obsidian 嘅 vault 本質上就係一個 Markdown 資料夾。所以最簡單嘅方式係:將 vault 所在資料夾授權畀 Agent,等 Agent 直接讀寫 Markdown。

示例 可以噉樣用

請讀取我嘅 Obsidian vault,揾出所有關於 Agent 嘅筆記,並整理成一篇公眾號選題庫。

請將呢啲零散筆記按「工具、場景、案例、安裝命令」重新歸類。

請幫我將呢 20 篇讀書筆記整理成一篇知識地圖。

Obsidian 進階接法:Local REST API + 社區 MCP

如果想等 Agent 通過 API 操作 Obsidian,需要先喺 Obsidian 裏面安裝社區插件 Local REST API,啟用插件,喺插件設定度生成 API Key,記低端口,預設通常係 27123,再配置 Obsidian MCP。

Shell

git clone https://github.com/

    cyanheads/obsidian-mcp-server.git

cd obsidian-mcp-server

bun install

cp .env.example .env

注意:呢個係社區方案,唔係 Obsidian 官方 CLI。用之前要睇維護狀態。

六、網頁操作:Playwright 有兩種接法

好多網站冇 CLI,亦冇 MCP,例如後台、表單、內部系統。呢個時候可以等 Agent 操作瀏覽器。

路線一:Playwright MCP

適合等 Agent 自主探索網頁、撳掣、填表、截圖。

npx @playwright/mcp@latest

路線二:Playwright CLI + Skills

Playwright 官方而家都推出咗面向 coding agents 嘅 playwright-cli。如果你係用 coding agent,CLI + Skills 可能比 MCP 更慳 token,因為 MCP 往往會將頁面快照、DOM 等資訊塞入上下文,而 CLI 可以按需要讀取。

需要 Agent 長時間自主瀏覽網頁:用 Playwright MCP。

需要穩定、可重用、token 更慳嘅網頁自動化:優先試 Playwright CLI。

七、網頁資料抓取:Firecrawl

如果你唔係要「撳網頁」,而係要將網頁內容拉落嚟、轉成 Markdown、總結資料,Firecrawl 更適合。

Shell

# MCP 方式,Claude Code 示例

claude mcp add firecrawl

  -e FIRECRAWL_API_KEY=你嘅key

  -- npx -y firecrawl-mcp

# CLI + Skill 形態

npx -y firecrawl-cli@latest

  init --all --browser

Key 獲取方式都好簡單:打開 Firecrawl 官網,註冊賬號,入 Dashboard,揾到 API Keys,創建並複製 FIRECRAWL_API_KEY。

佢適合競品調研、資料抓取、網站轉 Markdown、SEO/內容研究、產品文檔整理。

八、內容創作:剪映、小宇宙、OiiOii 呢類要小心

內容創作工具要分開講。飛書、高德、GitHub 呢類屬於官方能力,穩定性比較高;但剪映、小紅書、小宇宙、OiiOii、可靈、Runway、Suno 呢一類,好多係社區 Skill、瀏覽器自動化或者逆向接口。

用之前建議:先備份素材,先備份草稿,先用分身或測試賬號,唔好一開始就批量操作。

剪映 Skill,社區工具

Shell

git clone https://github.com/

  luoluoluo22/

  jianying-editor-skill.git

  .claude/skills/jianying-editor

cd .claude/skills/

  jianying-editor

pip install -r requirements.txt

playwright install chromium

常見能力包括創建剪映草稿、導入素材、加字幕、加配音、加音樂、生成時間線,部分環境下仲可以自動匯出視頻。

重要限制:呢個係非官方社區 Skill,唔係剪映官方 CLI。自動匯出主要支援 Windows + 剪映專業版 5.9 或以下;剪映 6.0+ 可能因為彈窗或 UI 改版打斷自動化腳本。

小宇宙 MCP,社區逆向工具

git clone https://github.com/

  MosesHe/xiaoyuzhoufm-mcp.git

呢個工具唔係小宇宙官方工具,亦唔係簡單讀取公開 RSS。佢涉及小宇宙登入態同非官方接口調用,屬於比較激進嘅社區逆向方式。更適合個人實驗、小範圍整理自己嘅播客資料,唔建議大規模自動化、接主力賬號或商業化批量抓取。

OiiOii、可靈、Runway、Suno 呢類 AI 內容平台,好多冇穩定官方 CLI,常見接法係 Skill + 瀏覽器自動化 + 已登入賬號。佢適合批量生成視頻 prompt、自動提交 AI 視頻任務、整理生成結果同半自動內容生產,但瀏覽器自動化係兜底方案,唔係最穩方案。

九、開發、部署同網站:優先官方 CLI

呢一類官方 CLI 最成熟,亦最適合 Agent 調用。

GitHub CLI

安裝winget install --id GitHub.cli / brew install gh

用途Issue、PR、倉庫、Release。

Vercel CLI / Cloudflare Wrangler

安裝npm i -g vercel / npm install -g wrangler。

用途部署網站、Workers、Pages、KV、R2。

Supabase / Firebase / Stripe / Shopify

登錄npx supabase login / firebase login / stripe login / shopify auth login。

用途數據庫遷移、雲函數開發、支付測試、Shopify App 同主題開發。

你可以等 Agent 用 gh 睇倉庫最近 5 個 issue 並按優先級整理,用 vercel 部署當前項目,用 supabase 初始化本地數據庫並生成遷移文件,或者用 stripe listen 啟動本地 webhook 測試。

十、設計工具:Figma 更適合 MCP

Figma 唔係典型 CLI-first 工具。而家佢更適合用官方 MCP 接 Agent。

做到嘅嘢包括讀取設計稿、根據設計稿生成程式碼、對齊組件同設計系統、分析頁面結構、輔助前端還原 UI。接入地址係 https://mcp.figma.com/mcp

十一、小白應該點樣揀?

記住呢張清單就夠喇。

發飛書、寫飛書文檔

推薦接法飛書官方 CLI + Skills。

可信度官方。

查路線、做旅行攻略

推薦接法高德 MCP。

可信度官方。

整理 Obsidian 筆記

推薦接法本地資料夾權限 / 社區 MCP。

可信度社區或本地權限。

操作冇 API 嘅網頁

推薦接法Playwright MCP / CLI。

可信度官方工具,但網頁本身可能變化。

剪視頻 / 整理播客 / 操作 AI 視頻平台

推薦接法社區 Skill、社區 MCP 或瀏覽器自動化。

可信度風險較高,適合測試後再擴展使用。

部署網站 / 管 GitHub / 接支付 / 管數據庫 / 設計稿轉程式碼

推薦接法Vercel、Cloudflare、GitHub、Stripe、Supabase、Figma 等官方 CLI 或 MCP。

可信度官方優先。

十二、推薦新手安裝路線

唔好一嚟就裝 50 個工具。建議跟順序嚟。

① 裝 Agent

先裝 Codex 同 Claude Code,行通最基本嘅本地協作。

② 裝辦公能力

優先飛書官方 CLI + Skills,因為呢個係普通人最容易感受到價值嘅場景。

③ 裝瀏覽器能力

用 Playwright MCP 或 CLI,覆蓋冇 API 嘅網頁場景。

④ 裝地圖能力

接高德 MCP,做本地生活、路線、旅行攻略。

⑤ 裝知識庫能力

最簡單係將 Obsidian vault 資料夾授權畀 Agent;進階再接 Local REST API 同社區 MCP。

⑥ 按職業補工具

開發者補 gh、vercel、wrangler、supabase;內容創作者補剪映 Skill、Firecrawl、小宇宙 MCP;辦公黨補飛書、Notion、Google Workspace、Microsoft 365;電商支付補 Shopify CLI、Stripe CLI;設計前端補 Figma MCP。

如果真係唔知自己需要邊個,都可以睇 Composio、Zapier、Pipedream 呢類通用連接器。佢哋可以一次接入好多應用,適合先用嚟兜底,等你摸清楚自己最常用邊啲工具,再換成對應嘅官方 CLI 或官方 MCP。

最後總結

Agent 本身只係「大腦」。真正令佢變強嘅,係你畀佢接上嘅工具。

CLI 係手,MCP 係插口,Skill 係說明書,API 係底層能力。

瀏覽器自動化係兜底方案,本地文件權限係最容易被忽略嘅生產力入口。

普通人唔需要一次過學曬所有技術。你只要記住一個判斷方法:先睇場景,再揀接法,再睇清楚係唔係官方。

要辦公,就接飛書。要地圖,就接高德。要知識庫,就接 Obsidian/Notion。要網頁操作,就接 Playwright。要抓資料,就接 Firecrawl。要部署,就接 Vercel/Cloudflare。要程式碼協作,就接 GitHub CLI。要內容創作,就接剪映、小紅書、小宇宙、OiiOii 呢類工具,但要接受佢哋好多係社區工具、逆向接口或瀏覽器自動化,冇官方 CLI 咁穩。

噉樣,你嘅 Agent 先唔止係識傾偈,而係真係開始幫你做到嘢。

關於嬌姐

40+ IT 從業者,前榮耀員工,而家專注 AI 效率工具研究與實踐。持續輸出 OpenClaw 及 AI 工具嘅乾貨教程同落地案例,間中分享職場思考同生活感受。


高考嘅堅持與感恩:我心入面嘅嗰座橋,跨越咗命運

40 + IT女從榮耀離職:揾工碰壁、陪仔焦慮嘅日子裏面,我靠 AI 公眾號揾返自己

想玩 AI 玩得更深入?三揀一

方案 1 自學黨 · 69 蚊(就快加價到99蚊)

OpenClaw + Hermes + codex + claude 全套資料包:

  • OpenClaw入門到精通教程
  • agent102 個實戰案例
  • OpenClaw避坑手冊(踩過嘅坑都畀你標好曬)
  • 幾百個 Skill 技能包
  • Hermes 實戰文檔
  • Hermes123指令 詳解
  • codex入門到精通手冊
  • claude入門到大師(非常詳細)

適合:想自己琢磨、慢慢啃嘅人。


方案 2 揾人帶 · 99 蚊(就快加價到169)

資料包全部內容,外加:

  • 羣組裏面實操交流,踩坑有人接
  • 唔定期乾貨分享
  • 一班同頻玩家,互相打氣

適合:想少行冤枉路、有人陪住一齊玩嘅人。


方案 3 就要呢兩個工具 · 私問諮詢(學習工作提升效率神器)

直接拎到嬌姐用 OpenClaw + Hermes 摸索咗大半年、調教成熟嘅兩個精華 Hermes Agent:

公眾號訂閲助手:訂閲咗嘅公眾號文章自動下載、自動入 Obsidian 知識庫,以後唔使手動複製貼上。

微信聊天記錄 AI 助手:微信本地聊天記錄接 AI,羣組私訊都支援,將聊天記錄變成可以搜尋、可以分析嘅數據資產,玩法好多。

唔止係工具,更加係實戰教程:配置方案入面每一步點樣做、點解咁樣配都講得好清楚,跟住行一次,Hermes Agent 點樣搭、點樣 tune、點樣落地,已經學到手。

適合:就要呢兩個工具、又想在實戰入面將 Hermes Agent 學明白嘅人。


方案 4 批量視頻生成工作流程

【人人都可以學識】分享我用 codex 製作實體舖抖音視頻嘅工作流程


點樣拎:後台私訊 kekohu,註明你想要邊個(資料 / 社羣 / 工具),見到就覆。


先關注後閲讀,嬌姐怕失去上進的你

文末嬌姐整理heremes、openclaw所有文章連結

想了解嬌姐點擊文末連結


今天這篇是嬌姐開公眾號以來的第562篇,我是持續堅持日更分享AI乾貨的嬌姐。

很多人用 AI Agent,還停留在“讓它聊天、寫文案、改代碼”。

但真正好用的 Agent,不只是會回答問題,而是能真的幫你做事:查飛書日程、寫文檔、規劃高德路線、整理 Obsidian 筆記、打開網頁填表、讀取本地文件、部署網站、處理 GitHub Issue、生成剪映草稿、整理播客內容。

這篇文章講一個核心問題:怎麼給自己的 Agent 增加真實工作能力?

一、給 Agent 加能力,不只有 MCP

現在很多人一提 Agent 工具,就只想到 MCP。但實際上,給 Agent 加能力至少有 6 種方式。

官方 CLI

是什麼官方命令行工具。

適合飛書、GitHub、部署、雲服務,穩定性通常最高。

官方 Skill

是什麼Agent 專用說明書和工具包。

適合複雜流程,比如辦公、文檔、內容生產。

MCP

是什麼Agent 通用工具協議。

適合地圖、網頁、數據庫、設計工具。

API / SDK

是什麼程序接口。

適合開發者深度定製。

瀏覽器自動化

是什麼讓 Agent 像人一樣點網頁。

適合沒有 API/CLI 的網站。

本地文件權限

是什麼讓 Agent 讀寫電腦文件夾。

適合整理資料、改文檔、批處理。

CLI 是手,Skill 是說明書,MCP 是插口,API 是底層能力。

瀏覽器自動化是兜底方案,本地文件權限是最容易被忽略的生產力入口。

如果你是普通用戶,我建議先從這兩個 Agent 入手:Codex 適合代碼、本地文件、自動化實操;Claude Code 適合 Skill 生態、複雜工作流、MCP 接入。

Shell

# Codex Windows 官方安裝腳本

powershell -ExecutionPolicy

    ByPass -c "irm

    https://chatgpt.com/

    codex/install.ps1 | iex"

# Codex npm 安裝

npm install -g @openai/codex

# Claude Code

npm install -g

    @anthropic-ai/claude-code

claude

參考來源:OpenAI Codex CLI、openai/codex、Claude Code Quickstart。

二、先看可信度,再決定要不要裝

所有工具,我建議分成三類。

判斷 三類可信度

官方:官方 CLI、官方 MCP、官方 Skill,優先推薦。

社區:成熟社區工具,可用,但要看版本和維護狀態。

風險:逆向接口或瀏覽器自動化,能解決問題,但有失效和賬號風險。

判斷順序:有官方 CLI 優先官方 CLI;有官方 Agent Skill 就一起安裝 Skill;有官方 MCP 就用官方 MCP;只有社區工具就標註非官方和風險;沒有接口再考慮瀏覽器自動化;本地資料優先文件夾權限。

飛書 CLI、高德 MCP、GitHub CLI 這類屬於官方能力,穩定性相對高。剪映 Skill、Obsidian MCP、小宇宙 MCP 這類多數是社區工具,要看維護狀態。小紅書、小宇宙逆向接口、各種網頁自動化,能用,但不能當成官方能力。

三、辦公協作:優先接官方 CLI

最典型的是飛書。飛書比較特殊,它不是單純 MCP,而是官方 CLI + Agent Skills,更接近一套完整工具箱。

它能發消息、查日曆、寫飛書文檔、操作表格、操作多維表格 Base、查任務、處理會議紀要,也能處理郵件、審批、OKR 等辦公事項。

Shell

npm install -g @larksuite/cli

npx skills add larksuite/cli

    -y -g

lark-cli config init

lark-cli auth login

    --recommend

lark-cli auth status

容易漏掉的一步:npx skills add larksuite/cli -y -g 不是裝 CLI 本體,而是安裝飛書的 Agent Skills。沒有這一步,CLI 雖然可以給人手動用,但 Agent 不一定知道怎麼更好地調用飛書能力。

飛書 CLI 通常走登錄授權,不需要你手動複製 API Key。執行 lark-cli auth login --recommend 後,在瀏覽器裏登錄授權即可。

示例 可以這樣用

請使用 lark-cli 查詢我今天的日程,並整理成待辦清單。

請用 lark-cli 創建一篇飛書文檔,標題是“本週覆盤”。

請把這段會議記錄整理後寫入飛書文檔。

涉及羣發消息、改文檔、審批、外發內容時,最好讓 Agent 先生成草稿,再由人確認。

四、地圖出行:接高德 MCP

地圖類工具通常沒有“給普通人敲命令的官方 CLI”,更常見的是官方 MCP 或 API。高德地圖 MCP 是官方能力。

它能做地點搜索、路線規劃、天氣查詢、POI 查詢、出行攻略,也能把攻略點位導入高德地圖 App。

① 打開高德開放平台

進入控制枱,創建應用。

② 添加 Key

服務平台選擇 Web 服務。

③ 拿到環境變量

複製你的 AMAP_MAPS_API_KEY,用於 MCP 配置。

JSON

{

  "mcpServers": {

    "amap-maps": {

      "command": "cmd",

      "args": ["/c", "npx",

        "-y", "@amap/

        amap-maps-mcp-server"],

      "env": {

        "AMAP_MAPS_API_KEY":

        "你的高德Key"

      }

    }

  }

}

適合場景包括旅行規劃、本地生活搜索、通勤路線、探店選址、城市攻略整理。你可以讓它規劃杭州一日遊、查附近適合談事情的咖啡館,或者規劃從虹橋火車站到外灘的最快路線。

五、知識庫和筆記:Obsidian / Notion

這類工具要分清楚:Notion 有官方 API/MCP 生態;Obsidian 更偏本地筆記軟件,主流是本地文件權限、社區插件和社區 MCP,不是官方 CLI。

Obsidian 最簡單接法:本地文件夾權限

Obsidian 的 vault 本質上就是一個 Markdown 文件夾。所以最簡單的方式是:把 vault 所在文件夾授權給 Agent,讓 Agent 直接讀寫 Markdown。

示例 可以這樣用

請讀取我的 Obsidian vault,找出所有關於 Agent 的筆記,並整理成一篇公眾號選題庫。

請把這些零散筆記按“工具、場景、案例、安裝命令”重新歸類。

請幫我把這 20 篇讀書筆記整理成一篇知識地圖。

Obsidian 進階接法:Local REST API + 社區 MCP

如果想讓 Agent 通過 API 操作 Obsidian,需要先在 Obsidian 裏安裝社區插件 Local REST API,啓用插件,在插件設置裏生成 API Key,記下端口,默認通常是 27123,再配置 Obsidian MCP。

Shell

git clone https://github.com/

    cyanheads/obsidian-mcp-server.git

cd obsidian-mcp-server

bun install

cp .env.example .env

注意:這是社區方案,不是 Obsidian 官方 CLI。使用前要看維護狀態。

六、網頁操作:Playwright 有兩種接法

很多網站沒有 CLI,也沒有 MCP,比如後台、表單、內部系統。這個時候可以讓 Agent 操作瀏覽器。

路線一:Playwright MCP

適合讓 Agent 自主探索網頁、點擊、填表、截圖。

npx @playwright/mcp@latest

路線二:Playwright CLI + Skills

Playwright 官方現在也推出了面向 coding agents 的 playwright-cli。如果你用的是 coding agent,CLI + Skills 可能比 MCP 更省 token,因為 MCP 往往會把頁面快照、DOM 等信息塞進上下文,而 CLI 可以按需讀取。

需要 Agent 長時間自主瀏覽網頁:用 Playwright MCP。

需要穩定、可複用、token 更省的網頁自動化:優先試 Playwright CLI。

七、網頁資料抓取:Firecrawl

如果你不是要“點網頁”,而是要把網頁內容抓下來、轉成 Markdown、總結資料,Firecrawl 更適合。

Shell

# MCP 方式,Claude Code 示例

claude mcp add firecrawl

  -e FIRECRAWL_API_KEY=你的key

  -- npx -y firecrawl-mcp

# CLI + Skill 形態

npx -y firecrawl-cli@latest

  init --all --browser

Key 獲取方式也很簡單:打開 Firecrawl 官網,註冊賬號,進入 Dashboard,找到 API Keys,創建並複製 FIRECRAWL_API_KEY。

它適合競品調研、資料抓取、網站轉 Markdown、SEO/內容研究、產品文檔整理。

八、內容創作:剪映、小宇宙、OiiOii 這類要謹慎

內容創作工具要單獨拎出來說。飛書、高德、GitHub 這類屬於官方能力,穩定性比較高;但剪映、小紅書、小宇宙、OiiOii、可靈、Runway、Suno 這一類,很多是社區 Skill、瀏覽器自動化或逆向接口。

使用前建議:先備份素材,先備份草稿,先用小號或測試賬號,不要一開始就批量操作。

剪映 Skill,社區工具

Shell

git clone https://github.com/

  luoluoluo22/

  jianying-editor-skill.git

  .claude/skills/jianying-editor

cd .claude/skills/

  jianying-editor

pip install -r requirements.txt

playwright install chromium

常見能力包括創建剪映草稿、導入素材、加字幕、加配音、加音樂、生成時間線,部分環境下還能自動導出視頻。

重要限制:這是非官方社區 Skill,不是剪映官方 CLI。自動導出主要支持 Windows + 剪映專業版 5.9 及以下;剪映 6.0+ 可能因為彈窗或 UI 改版打斷自動化腳本。

小宇宙 MCP,社區逆向工具

git clone https://github.com/

  MosesHe/xiaoyuzhoufm-mcp.git

這個工具不是小宇宙官方工具,也不是簡單讀取公開 RSS。它涉及小宇宙登錄態和非官方接口調用,屬於更激進的社區逆向方式。更適合個人實驗、小範圍整理自己的播客資料,不建議大規模自動化、接主力賬號或商業化批量抓取。

OiiOii、可靈、Runway、Suno 這類 AI 內容平台,很多沒有穩定官方 CLI,常見接法是 Skill + 瀏覽器自動化 + 已登錄賬號。它適合批量生成視頻 prompt、自動提交 AI 視頻任務、整理生成結果和半自動內容生產,但瀏覽器自動化是兜底方案,不是最穩方案。

九、開發、部署和網站:優先官方 CLI

這一類官方 CLI 最成熟,也最適合 Agent 調用。

GitHub CLI

安裝winget install --id GitHub.cli / brew install gh

用途Issue、PR、倉庫、Release。

Vercel CLI / Cloudflare Wrangler

安裝npm i -g vercel / npm install -g wrangler。

用途部署網站、Workers、Pages、KV、R2。

Supabase / Firebase / Stripe / Shopify

登錄npx supabase login / firebase login / stripe login / shopify auth login。

用途數據庫遷移、雲函數開發、支付測試、Shopify App 和主題開發。

你可以讓 Agent 用 gh 查看倉庫最近 5 個 issue 並按優先級整理,用 vercel 部署當前項目,用 supabase 初始化本地數據庫並生成遷移文件,或用 stripe listen 啓動本地 webhook 測試。

十、設計工具:Figma 更適合 MCP

Figma 不是典型 CLI-first 工具。它現在更適合用官方 MCP 接 Agent。

能做的事情包括讀取設計稿、根據設計稿生成代碼、對齊組件和設計系統、分析頁面結構、輔助前端還原 UI。接入地址是 https://mcp.figma.com/mcp

十一、小白應該怎麼選?

記住這張清單就夠了。

發飛書、寫飛書文檔

推薦接法飛書官方 CLI + Skills。

可信度官方。

查路線、做旅行攻略

推薦接法高德 MCP。

可信度官方。

整理 Obsidian 筆記

推薦接法本地文件夾權限 / 社區 MCP。

可信度社區或本地權限。

操作沒有 API 的網頁

推薦接法Playwright MCP / CLI。

可信度官方工具,但網頁本身可能變化。

剪視頻 / 整理播客 / 操作 AI 視頻平台

推薦接法社區 Skill、社區 MCP 或瀏覽器自動化。

可信度風險較高,適合測試後再擴大使用。

部署網站 / 管 GitHub / 接支付 / 管數據庫 / 設計稿轉代碼

推薦接法Vercel、Cloudflare、GitHub、Stripe、Supabase、Figma 等官方 CLI 或 MCP。

可信度官方優先。

十二、推薦新手安裝路線

不要一上來裝 50 個工具。建議按順序來。

① 裝 Agent

先裝 Codex 和 Claude Code,跑通最基礎的本地協作。

② 裝辦公能力

優先飛書官方 CLI + Skills,因為這是普通人最容易感知到價值的場景。

③ 裝瀏覽器能力

用 Playwright MCP 或 CLI,覆蓋沒有 API 的網頁場景。

④ 裝地圖能力

接高德 MCP,做本地生活、路線、旅行攻略。

⑤ 裝知識庫能力

最簡單是把 Obsidian vault 文件夾授權給 Agent;進階再接 Local REST API 和社區 MCP。

⑥ 按職業補工具

開發者補 gh、vercel、wrangler、supabase;內容創作者補剪映 Skill、Firecrawl、小宇宙 MCP;辦公黨補飛書、Notion、Google Workspace、Microsoft 365;電商支付補 Shopify CLI、Stripe CLI;設計前端補 Figma MCP。

如果實在不知道自己需要哪個,也可以看 Composio、Zapier、Pipedream 這類通用連接器。它們可以一次接入很多應用,適合先兜底,等你摸清楚自己最常用哪些工具,再換成對應的官方 CLI 或官方 MCP。

最後總結

Agent 本身只是“大腦”。真正讓它變強的,是你給它接上的工具。

CLI 是手,MCP 是插口,Skill 是說明書,API 是底層能力。

瀏覽器自動化是兜底方案,本地文件權限是最容易被忽略的生產力入口。

普通人不需要一次性學完所有技術。你只要記住一個判斷方法:先看場景,再選接法,再看清楚是不是官方。

要辦公,就接飛書。要地圖,就接高德。要知識庫,就接 Obsidian/Notion。要網頁操作,就接 Playwright。要抓資料,就接 Firecrawl。要部署,就接 Vercel/Cloudflare。要代碼協作,就接 GitHub CLI。要內容創作,就接剪映、小紅書、小宇宙、OiiOii 這類工具,但要接受它們很多是社區工具、逆向接口或瀏覽器自動化,不像官方 CLI 那麼穩。

這樣,你的 Agent 才不只是會聊天,而是真的能開始替你做事。

關於嬌姐

40+ IT 從業者,前榮耀員工,現專注 AI 效率工具研究與實踐。持續輸出 OpenClaw 及 AI 工具的乾貨教程與落地案例,偶爾分享職場思考與生活感悟。


高考的堅持與感恩:我心中的那座橋,跨越了命運

40 + IT女從榮耀離職:找工作碰壁、陪娃焦慮的日子裏,我靠 AI 公眾號找到了自我

想玩AI得更深?三選一

方案 1 自學黨 · 69 元(即將漲價到99元)

OpenClaw + Hermes+codex+claude 全套資料包:

  • OpenClaw入門到精通教程
  • agent102 個實戰案例
  • OpenClaw避坑手冊(踩過的坑都給你標好了)
  • 數百個 Skill 技能包
  • Hermes 實戰文檔
  • Hermes123指令 詳解
  • codex入門到精通手冊
  • claude入門到大師(非常詳細)

適合:想自己琢磨、慢慢啃的人。


方案 2 找人帶 · 99 元(即將漲價到169)

資料包全部內容,外加:

  • 羣內實操交流,踩坑有人接
  • 不定期乾貨分享
  • 一羣同頻玩家,互相打氣

適合:想少走彎路、有人配置一起玩的人。


方案 3 就要這兩個工具 · 私聊諮詢(學習工作提效神器)

直接拿到嬌姐用 OpenClaw + Hermes 摸索大半年、調教成熟的兩個精華 Hermes Agent:

公眾號訂閲助手:訂閲的公眾號文章自動下載、自動進 Obsidian 知識庫,再也不用手動複製粘貼。

微信聊天記錄 AI 助手:微信本地聊天記錄接 AI,羣聊私聊都支持,把聊天記錄變成可檢索、可分析的數據資產,玩法超多。

不光是工具,更是實戰教程:配置方案裏每一步怎麼走、為什麼這麼配都講得清清楚楚,照着跑一遍,Hermes Agent 怎麼搭、怎麼調、怎麼落地,已經學到手了。

適合:就要這兩個工具、又想在實戰裏把 Hermes Agent 學明白的人。


方案 4 批量視頻生成工作流

【人人都可以學會】分享我用codex製作實體店抖音視頻的工作流


怎麼領:後台私信 kekohu,備註你要哪個(資料 / 社羣 / 工具),看到就回。