這款神級 Skill 徹底殺瘋，公眾號/飛書/推文通殺！任何 URL 都能轉成 Markdown

作者：小智AI指南

日期：2026年3月22日下午10:00

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

markdown-proxy：一個Claude Code Skill，自動將任何URL轉為乾淨Markdown，解決反爬、噪音同降級問題

整理版摘要

大家好，我係小智，專注AI工具、AI智能體同編程提效痛點分析。對於搞內容矩陣嘅朋友嚟講，有一個高頻痛點：每日都需要透過URL抓取大量文章、推文或文檔作為參考資料。但係直接將連結掉畀AI，結果往往唔多理想——要麼因為防爬蟲機制提取唔出內容，要麼只係拎到一堆充滿噪音嘅HTML代碼。要知道，餵畀大模型嘅數據，質量越高、結構越清晰（尤其係Markdown格式），佢輸出嘅結果先至越精準。

markdown-proxy就係專門為解決呢個痛點而生嘅方案。佢係一個極其強大嘅Claude Code Skill，安裝之後，你只需要將任何URL掉畀Claude，佢就會自動判斷連結類型，選擇最合適嘅抓取通道，為你輸出乾淨、結構化嘅Markdown內容。無論係反爬嚴格嘅微信公眾號、需要認證嘅飛書文檔，定係X/Twitter嘅推文，佢都能輕鬆搞定。

整體結論：markdown-proxy以不足400行Python代碼，結合免費代理服務，實現咗一個零API Key依賴（除飛書外）、能應對多種平台限制嘅URL轉Markdown方案。佢嘅Skill化設計令用戶無需記命令，喺對話中直接發連結即可，大大降低使用門檻。無論係開發者定係內容創作者，都能從中獲益。

markdown-proxy係一個Claude Code Skill，能夠將任何URL自動轉換為乾淨Markdown，顯著提升AI對網頁內容嘅理解同處理效果。
採用路由分發 + 四層降級架構：微信公眾號用Playwright無頭瀏覽器繞過反爬；飛書文檔直接調用開放API轉換Block；YouTube用專用skill；其他URL經r.jina.ai、defuddle.md、agent-fetch、defuddle CLI四級降級，確保高可用。
相比Claude Code內置WebFetch，解決咗三大硬傷：過唔到登錄牆、輸出充滿噪音、無自動降級策略。
Skill化設計示範咗點樣將複雜工具整合到AI對話中，用戶唔需要學習新指令，直接發連結就搞掂，係AI工具整合嘅最佳實踐。
可以立即用`npx skills add joeseesun/markdown-proxy`安裝，基礎功能開箱即用；如需抓取公眾號，額外安裝Playwright；如需飛書文檔，設定環境變量FEISHU_APP_ID同FEISHU_APP_SECRET。

值得記低

連結 github.com

markdown-proxy GitHub 項目

Claude Code Skill，將任意URL轉為Markdown，支援微信公眾號、飛書文檔、Twitter等平台。

整理重點

URL轉Markdown嘅痛點與一次過解決方案

對於需要經常將網頁內容餵畀AI分析嘅開發者或內容創作者嚟講，直接將URL丟畀Claude Code往往唔work，因為內置WebFetch有三個硬傷：登錄牆過唔到、輸出噪音多、無自動降級策略。

直接將URL丟畀AI，往往只拎到噪音HTML或空白頁面，數據質量大打折扣。

為咗解決呢個高頻痛點，小智推薦咗一個Claude Code Skill——markdown-proxy，佢可以自動判斷連結類型，選擇最合適嘅抓取通道，輸出乾淨嘅Markdown內容。無論係反爬嚴格嘅微信公眾號、需要認證嘅飛書文檔，定係X/Twitter推文，都搞得掂。

內置WebFetch有三個硬傷：登錄牆、噪音、無降級，呢啲都係日常使用嘅主要障礙。

登錄牆過唔去：微信公眾號有反爬機制，飛書文檔需要API認證，X/Twitter內容難直接獲取。
輸出噪音太多：HTML混雜導航欄、側邊欄、廣告、JS代碼，提取後需大量清理。
無降級策略：一個代理服務跪低就徹底抓唔到，冇自動切換能力。

整理重點

路由分發 + 四層降級：點樣保證可用性

markdown-proxy嘅核心設計係路由分發加多層降級。收到一個URL後，先判斷連結類型，再選擇對應嘅抓取通道：微信公眾號用Playwright無頭瀏覽器，飛書文檔用開放API，YouTube用專用Skill，其他所有URL就用代理級聯。

四層降級確保任何URL都有備用方案，唔會一個服務跪低就全軍覆沒。

通用URL嘅代理級聯從第一層到第四層分別係：r.jina.ai（內容最全）、defuddle.md（輸出最乾淨）、agent-fetch（本地工具，用npx執行）、defuddle CLI（本地CLI）。每一層掛咗都會自動跳到下一層。

專有平台走專用通道，保證抓取成功率；通用URL有四層降級，任何一層掛了自動跳到下一層。

呢個設計令markdown-proxy喺任何情況下都有備案，可用性極高。

整理重點

四大抓取通道詳解：微信、飛書、通用、Twitter

markdown-proxy針對唔同平台設計咗專屬抓取通道，以下係詳細運作方式：

1 微信公眾號：用Playwright無頭Chromium瀏覽器繞過反爬，成功加載後用BeautifulSoup解析出標題、作者、時間同正文，輸出帶YAML frontmatter嘅Markdown。腳本約120行Python。
2 飛書文檔：直接調用飛書開放API拉取Blocks，然後逐個轉換為Markdown。支援docx、docs同wiki三種文檔類型，Blocks映射覆蓋標題、列表、代碼塊、引用等十幾種，代碼塊支援70種語言。腳本約280行Python，需配置FEISHU_APP_ID同FEISHU_APP_SECRET。
3 通用URL：唔需要自己搭建服務，巧妙組合兩個免費在線代理（r.jina.ai、defuddle.md）同兩個本地工具（agent-fetch、defuddle CLI）形成四級降級。r.jina.ai內容最完整，defuddle.md輸出更乾淨，agent-fetch用npx執行，defuddle CLI係最終防線。
4 Twitter推文：將呢部分委託畀專用嘅Twitter Skill處理，支援文字同多媒體信息，輸出排版良好嘅Markdown。

通用URL抓取零API Key依賴，r.jina.ai同defuddle.md都係免費服務，唔需要註冊賬號。

飛書Block解析覆蓋全面，對於未知類型亦有兜底邏輯，嘗試提取文本元素。

Twitter推文委託專用Skill，確保多媒體內容完整保留。

飛書語言代碼映射（節選） python

lang_map = {
 7: "bash", 8: "c", 10: "cpp", 25: "go",
 31: "java", 32: "javascript", 50: "python",
 53: "rust", 62: "typescript", ...
}

整理重點

一行指令安裝，零API Key依賴嘅技術亮點

安裝markdown-proxy非常簡單，只需一條命令：

npx skills add joeseesun/markdown-proxy 一鍵安裝，立即可用。

基礎功能（通用URL抓取）只需要curl，macOS同Linux都自帶，開箱即用。如果需要抓取公眾號，額外安裝Playwright同相關Python套件；如需飛書文檔，設定環境變量就得。

零API Key依賴係通用URL抓取嘅最大亮點，只有飛書文檔需要額外認證（因為權限模型限制）。

使用體驗非常順暢：裝好之後，直接喺Claude對話中發URL就得，唔需要任何特殊指令。Claude會自動識別URL類型，選擇對應嘅抓取通道，輸出格式化嘅Markdown內容。

直接喺對話中發連結，Claude自動搞掂，唔使記任何命令或切換工具。

大家好，我係小智，專注 AI 工具、AI 智能體同編程提效

痛點分析

對於搞內容矩陣嘅朋友嚟講，有一個高頻痛點：每日都需要經 URL 去抓大量文章、推文或者文檔做參考資料。但直接掉個連結俾 AI，結果通常都唔太理想——一係因為防爬蟲機制提取唔到內容，一係只係拎到一堆充滿噪音嘅 HTML code。要知道，餵俾大模型嘅數據，質量越高、結構越清晰（尤其係 Markdown 格式），佢輸出嘅結果先至越精準。

markdown-proxy 就係專為解決呢個痛點而設計嘅。佢係一個極之強大嘅 Claude Code Skill，安裝之後，你只需要將任何 URL 掉俾 Claude，佢就會自動判斷連結類型，揀最啱嘅抓取通道，為你輸出乾淨、結構化嘅 Markdown 內容。無論係反爬嚴格嘅微信公眾號、需要認證嘅飛書文檔，定係 X/Twitter 嘅推文，佢都可以輕鬆搞掂。

項目地址：https://github.com/joeseesun/markdown-proxy

點解需要佢？

Claude Code 本身有 WebFetch 工具，但佢有幾個致命傷：

第一，登錄牆過唔到。 微信公眾號文章有反爬機制，直接請求會拎到空白頁面。飛書文檔需要 API 認證，裸抓乜都拎唔到。X/Twitter 嘅內容亦都越來越難直接獲取。

第二，輸出噪音太多。 就算頁面開得到，HTML 裏面混咗導航欄、側邊欄、廣告、JavaScript code，提取出嚟嘅內容需要大量清理。

第三，冇降級策略。 一個代理服務死咗就徹底抓唔到，冇自動切換嘅能力。

markdown-proxy 針對呢三個問題分別俾咗方案：用專用腳本搞掂登錄牆，代理服務輸出乾淨 Markdown，四層級聯保證可用性。

工作原理

markdown-proxy 嘅核心設計係路由分發 + 多層降級。收到一個 URL 之後，佢會先判斷連結類型，再揀對應嘅抓取通道：

URL 進來
  │
  ├─ mp.weixin.qq.com    → Playwright 無頭瀏覽器抓取
  ├─ feishu.cn / larksuite.com → 飛書開放 API 抓取
  ├─ youtube.com / youtu.be    → 專用 YouTube skill
  └─ 其他所有 URL        → 代理級聯
                             ├─ 1. r.jina.ai（內容最全）
                             ├─ 2. defuddle.md（輸出最乾淨）
                             ├─ 3. agent-fetch（本地工具）
                             └─ 4. defuddle CLI（本地 CLI）

呢個設計有兩個好處：一來專有平台行專用通道，保證抓取成功率；二來通用 URL 有四層降級，任何一層死咗會自動跳到下一層。

四大抓取通道詳解

1. 微信公眾號：Playwright 無頭瀏覽器

公眾號文章嘅反爬係出名嘅嚴格，普通 HTTP request 拎到嘅一係空頁面，一係驗證碼。markdown-proxy 用 Playwright 開一個無頭 Chromium 瀏覽器嚟繞過呢個限制。好似下面咁，系統會喺後台自動打開並成功加載公眾號頁面：

核心邏輯喺 scripts/fetch_weixin.py，大約 120 行 Python code：

async with async_playwright() as p:
    browser = await p.chromium.launch(headless=True)
    page = await browser.new_page(
        user_agent="Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) ..."
    )
    await page.goto(url, wait_until="domcontentloaded", timeout=30000)
    await page.wait_for_selector("#js_content", timeout=15000)
    html = await page.content()

拎到完整 HTML 之後，用 BeautifulSoup 解析出標題、作者、發佈時間同正文內容，圖片連結都會保留。最終輸出帶 YAML frontmatter 嘅乾淨 Markdown 文件，提取效果非常之好：

2. 飛書文檔：開放 API 直連

飛書文檔唔係普通網頁，佢嘅內容係經 API 以 Block 結構化數據嘅形式儲存。markdown-proxy 內置咗 scripts/fetch_feishu.py（約 280 行），直接調用飛書開放 API 拉取文檔 blocks，然後逐個轉換做 Markdown。你可以見到，就算係複雜嘅飛書文檔結構都可以被精準還原：

支援三種飛書文檔類型：

類型	URL 示例	處理方式
新版文檔（docx）	`feishu.cn/docx/xxx`	直接獲取 blocks
舊版文檔（doc）	`feishu.cn/docs/xxx`	直接獲取 blocks
知識庫頁面（wiki）	`feishu.cn/wiki/xxx`	先解析節點獲取實際文檔 ID，再獲取 blocks

Block 轉 Markdown 嘅映射非常全面，覆蓋咗標題、列表、code block、引用、待辦事項、公式、圖片等十幾種類型。code block 仲支援 70 種編程語言嘅語法標識映射：

# 飛書的語言代碼到字符串的映射（節選）
lang_map = {
    7: "bash", 8: "c", 10: "cpp", 25: "go",
    31: "java", 32: "javascript", 50: "python",
    53: "rust", 62: "typescript", ...
}

使用前需要配置飛書應用嘅 FEISHU_APP_ID 和 FEISHU_APP_SECRET 環境變數，並俾應用授予 docx:document:readonly 權限。

3. 通用 URL：代理服務級聯

對於普通網頁，markdown-proxy 唔需要任何自建基礎設施，佢巧妙地組合咗兩個免費嘅在線代理服務同兩個本地工具：

r.jina.ai（首選）—— Jina AI 提供嘅免費 URL 轉 Markdown 服務。用法極之簡單，喺原始 URL 前面加上 https://r.jina.ai/ 就行：

curl -sL "https://r.jina.ai/https://example.com/article"

內容最完整，圖片連結都會保留。

defuddle.md（備選）—— 另一個免費嘅文章提取服務，輸出更乾淨，仲帶 YAML frontmatter 元信息。用法類似，URL 前面加 https://defuddle.md/。

agent-fetch（本地降級）—— 當兩個在線代理都唔得嘅時候，回退到本地工具。經 npx 直接運行，唔需要預裝。

defuddle CLI（最終降級）—— 最後一道防線，本地 CLI 工具，適合普通網頁。

4. Twitter 推文

Twitter 推文有專門嘅工具鏈（元信息解析等），markdown-proxy 將呢部分委託俾專用嘅 Twitter skill 處理。無論係簡單嘅文字推文定係帶有多媒體信息嘅推文：

透過 markdown-proxy，都可以被完整提取並轉換為排版良好嘅 Markdown 格式：

安裝與使用

安裝

一行命令搞掂：

npx skills add joeseesun/markdown-proxy

安裝過程非常簡單，控制枱會顯示安裝進度同相關依賴嘅配置情況：

驗證安裝成功：

ls ~/.claude/skills/markdown-proxy/SKILL.md

前置依賴

基礎功能（通用 URL 抓取）只需要 curl，macOS 同 Linux 都自帶，開箱即用。

如果需要抓取公眾號文章，額外安裝 Playwright：

pip install playwright beautifulsoup4 lxml
playwright install chromium

如果需要抓取飛書文檔，配置環境變數：

export FEISHU_APP_ID="your_app_id"
export FEISHU_APP_SECRET="your_app_secret"

使用

安裝好之後，直接掉個 URL 俾 Claude 就得，唔需要任何特殊指令：

幫我讀一下這篇文章：https://example.com/post
抓取這條推文：https://x.com/user/status/123456
讀一下這篇公眾號：https://mp.weixin.qq.com/s/abc123
把這個飛書文檔轉成 Markdown：https://xxx.feishu.cn/docx/xxxxxxxx

Claude 會自動識別 URL 類型，揀對應嘅抓取通道，輸出格式化後嘅 Markdown 內容。

技術實現亮點

代碼量極細。 成個項目得兩個 Python script 加一個 SKILL.md 配置文件。公眾號抓取約 120 行，飛書 API 約 280 行。通用 URL 抓取甚至唔需要 code，直接用 curl 調用外部代理。

零 API Key 依賴。 通用 URL 抓取用嘅 r.jina.ai 同 defuddle.md 都係免費服務，唔使註冊賬號或配置 API Key。只有飛書文檔先需要額外認證——因為飛書嘅文檔權限模型決定咗一定要行 API。

Skill 化設計。 作為 Claude Code Skill 而唔係獨立工具，佢嘅使用體驗係無縫嘅。用戶唔需要記命令、唔需要切換工具，直接喺對話中掉連結就得。SKILL.md 裏面定義咗完整嘅路由邏輯同降級策略，Claude 會自動執行。

飛書 Block 解析覆蓋全面。 飛書文檔嘅 Block 類型有二十幾種，markdown-proxy 覆蓋咗最常用嘅十幾種，包括標題（1-7 級）、有序/無序列表、code block（70 種語言）、引用、公式、待辦、分割線、圖片等。對於未知類型都有兜底邏輯，嘗試提取裏面嘅文本元素。

常見問題速查

問題	解決方法
公眾號抓取失敗	運行 `playwright install chromium` 安裝瀏覽器
飛書返回權限錯誤	檢查 `FEISHU_APP_ID` 和 `FEISHU_APP_SECRET`環境變數，確認應用有文檔讀取權限
飛書知識庫頁面抓取失敗	確認應用有 `wiki:wiki:readonly` 權限
r.jina.ai 返回空內容	無需操作，會自動降級到 defuddle.md
所有代理都失敗	URL 可能有嚴格認證限制，試試 `npx agent-fetch`

適合邊個用？

markdown-proxy 適合所有 Claude Code 用戶，尤其係：

• 日常需要俾 Claude 閲讀和分析網頁文章嘅開發者
• 需要抓取微信公眾號內容做研究或整理嘅人
• 團隊協作中需要將飛書文檔內容導出做 Markdown 嘅人
• 經常需要從 X/Twitter 等社交平台提取信息嘅人

入羣交流 & 領取福利

關於點樣使用 Claude Code 和 OpenClaw 嘅各種玩法，小智開咗一個學習交流羣，歡迎大家一齊交流玩法心得。

往期文章推薦

騰訊QClaw全面放開，三步搞掂，微信就可以遙控電腦

Nano Banana Skill：4張圖話你知點樣從一萬條 AI 繪圖入面揾到最佳提示詞

狂攬 7624 Stars！Claude HUD 插件：俾你嘅 Claude Code 裝返個儀表盤

OpenMAIC開源引爆教育圈！AI教育公司面臨危機？一鍵生成多智能體互動課堂

從AstronClaw 到 Coding Plan，訊飛做到咗人人可用

手機養龍蝦案例之 paddleocr+openclaw打造一個發票管理助手

如果本文對你有幫助，都請幫手點個讚👍 + 在看啦！❤️關注小智AI指南公眾號，AI 路上唔迷路

大家好，我是小智，專注 AI 工具，AI 智能體和編程提效

痛點分析

對於搞內容矩陣的朋友們來說，有一個高頻痛點：每天都需要通過 URL 抓取大量文章、推文或文檔作為參考資料。但直接把連結丟給 AI，結果往往不盡如人意——要麼因為防爬蟲機制提取不出內容，要麼只拿到一堆充滿噪音的 HTML 代碼。要知道，餵給大模型的數據，質量越高、結構越清晰（尤其是 Markdown 格式），它輸出的結果才越精準。

markdown-proxy 就是專門為解決這個痛點而生的。它是一個極其強大的 Claude Code Skill，安裝之後，你只需要把任何 URL 丟給 Claude，它就能自動判斷連結類型，選擇最合適的抓取通道，為你輸出乾淨、結構化的 Markdown 內容。不管是反爬嚴格的微信公眾號、需要認證的飛書文檔，還是 X/Twitter 的推文，它都能輕鬆搞定。

項目地址：https://github.com/joeseesun/markdown-proxy

為什麼需要它？

Claude Code 本身有 WebFetch 工具，但它有幾個硬傷：

第一，登錄牆過不去。 微信公眾號文章有反爬機制，直接請求拿到的是空白頁面。飛書文檔需要 API 認證，裸抓什麼也拿不到。X/Twitter 的內容也越來越難直接獲取。

第二，輸出噪音太多。 即使頁面能打開，HTML 裏混着導航欄、側邊欄、廣告、JavaScript 代碼，提取出的內容需要大量清理。

第三，沒有降級策略。 一個代理服務掛了就徹底抓不到了，沒有自動切換的能力。

markdown-proxy 針對這三個問題分別給出了方案：專用腳本搞定登錄牆，代理服務輸出乾淨 Markdown，四層級聯保證可用性。

工作原理

markdown-proxy 的核心設計是路由分發 + 多層降級。收到一個 URL 後，它先判斷連結類型，再選擇對應的抓取通道：

URL 進來
  │
  ├─ mp.weixin.qq.com    → Playwright 無頭瀏覽器抓取
  ├─ feishu.cn / larksuite.com → 飛書開放 API 抓取
  ├─ youtube.com / youtu.be    → 專用 YouTube skill
  └─ 其他所有 URL        → 代理級聯
                             ├─ 1. r.jina.ai（內容最全）
                             ├─ 2. defuddle.md（輸出最乾淨）
                             ├─ 3. agent-fetch（本地工具）
                             └─ 4. defuddle CLI（本地 CLI）

這個設計有兩個好處：一是專有平台走專用通道，保證抓取成功率；二是通用 URL 有四層降級，任何一層掛了自動跳到下一層。

四大抓取通道詳解

1. 微信公眾號：Playwright 無頭瀏覽器

公眾號文章的反爬是出了名的嚴格，普通 HTTP 請求拿到的要麼是空頁面，要麼是驗證碼。markdown-proxy 用 Playwright 啓動一個無頭 Chromium 瀏覽器來繞過這個限制。就像下面這樣，系統會在後台自動打開併成功加載公眾號頁面：

核心邏輯在 scripts/fetch_weixin.py，大約 120 行 Python 代碼：

async with async_playwright() as p:
    browser = await p.chromium.launch(headless=True)
    page = await browser.new_page(
        user_agent="Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) ..."
    )
    await page.goto(url, wait_until="domcontentloaded", timeout=30000)
    await page.wait_for_selector("#js_content", timeout=15000)
    html = await page.content()

拿到完整 HTML 後，用 BeautifulSoup 解析出標題、作者、發佈時間和正文內容，圖片連結也會保留。最終輸出帶 YAML frontmatter 的乾淨 Markdown 文件，提取效果非常出色：

2. 飛書文檔：開放 API 直連

飛書文檔不是普通網頁，它的內容是通過 API 以 Block 結構化數據的形式存儲的。markdown-proxy 內置了 scripts/fetch_feishu.py（約 280 行），直接調用飛書開放 API 拉取文檔 blocks，然後逐個轉換為 Markdown。你可以看到，即便是複雜的飛書文檔結構也能被精準還原：

支持三種飛書文檔類型：

類型	URL 示例	處理方式
新版文檔（docx）	`feishu.cn/docx/xxx`	直接獲取 blocks
舊版文檔（doc）	`feishu.cn/docs/xxx`	直接獲取 blocks
知識庫頁面（wiki）	`feishu.cn/wiki/xxx`	先解析節點獲取實際文檔 ID，再獲取 blocks

Block 轉 Markdown 的映射非常全面，覆蓋了標題、列表、代碼塊、引用、待辦事項、公式、圖片等十幾種類型。代碼塊還支持 70 種編程語言的語法標識映射：

# 飛書的語言代碼到字符串的映射（節選）
lang_map = {
    7: "bash", 8: "c", 10: "cpp", 25: "go",
    31: "java", 32: "javascript", 50: "python",
    53: "rust", 62: "typescript", ...
}

使用前需要配置飛書應用的 FEISHU_APP_ID 和 FEISHU_APP_SECRET 環境變量，並給應用授予 docx:document:readonly 權限。

3. 通用 URL：代理服務級聯

對於普通網頁，markdown-proxy 不需要任何自建基礎設施，它巧妙地組合了兩個免費的在線代理服務和兩個本地工具：

r.jina.ai（首選）—— Jina AI 提供的免費 URL 轉 Markdown 服務。用法極其簡單，在原始 URL 前面加上 https://r.jina.ai/ 就行：

curl -sL "https://r.jina.ai/https://example.com/article"

內容最完整，圖片連結也會保留。

defuddle.md（備選）—— 另一個免費的文章提取服務，輸出更乾淨，還帶 YAML frontmatter 元信息。用法類似，URL 前面加 https://defuddle.md/。

agent-fetch（本地降級）—— 當兩個在線代理都不可用時，回退到本地工具。通過 npx 直接運行，不需要預裝。

defuddle CLI（最終降級）—— 最後一道防線，本地 CLI 工具，適合普通網頁。

4. Twitter 推文

Twitter 推文有專門的工具鏈（元信息解析等），markdown-proxy 把這部分委託給專用的 Twitter skill 來處理。不管是簡單的文本推文還是帶有多媒體信息的推文：

通過 markdown-proxy，都能被完整地提取並轉換為排版良好的 Markdown 格式：

安裝與使用

安裝

一行命令搞定：

npx skills add joeseesun/markdown-proxy

安裝過程非常簡單，控制枱會顯示安裝進度和相關依賴的配置情況：

驗證安裝成功：

ls ~/.claude/skills/markdown-proxy/SKILL.md

前置依賴

基礎功能（通用 URL 抓取）只需要 curl，macOS 和 Linux 都自帶，開箱即用。

如果需要抓取公眾號文章，額外安裝 Playwright：

pip install playwright beautifulsoup4 lxml
playwright install chromium

如果需要抓取飛書文檔，配置環境變量：

export FEISHU_APP_ID="your_app_id"
export FEISHU_APP_SECRET="your_app_secret"

使用

安裝好之後，直接給 Claude 發 URL 就行，不需要任何特殊指令：

幫我讀一下這篇文章：https://example.com/post
抓取這條推文：https://x.com/user/status/123456
讀一下這篇公眾號：https://mp.weixin.qq.com/s/abc123
把這個飛書文檔轉成 Markdown：https://xxx.feishu.cn/docx/xxxxxxxx

Claude 會自動識別 URL 類型，選擇對應的抓取通道，輸出格式化後的 Markdown 內容。

技術實現亮點

代碼量極小。 整個項目只有兩個 Python 腳本加一個 SKILL.md 配置文件。公眾號抓取約 120 行，飛書 API 約 280 行。通用 URL 抓取甚至不需要代碼，直接用 curl 調用外部代理。

零 API Key 依賴。 通用 URL 抓取用的 r.jina.ai 和 defuddle.md 都是免費服務，不需要註冊賬號或配置 API Key。只有飛書文檔需要額外認證——因為飛書的文檔權限模型決定了必須走 API。

Skill 化設計。 作為 Claude Code Skill 而不是獨立工具，它的使用體驗是無縫的。用戶不需要記命令、不需要切換工具，直接在對話中發連結就行。SKILL.md 裏定義了完整的路由邏輯和降級策略，Claude 會自動執行。

飛書 Block 解析覆蓋全面。 飛書文檔的 Block 類型有二十多種，markdown-proxy 覆蓋了最常用的十幾種，包括標題（1-7 級）、有序/無序列表、代碼塊（70 種語言）、引用、公式、待辦、分割線、圖片等。對於未知類型也有兜底邏輯，嘗試提取其中的文本元素。

常見問題速查

問題	解決方法
公眾號抓取失敗	運行 `playwright install chromium` 安裝瀏覽器
飛書返回權限錯誤	檢查 `FEISHU_APP_ID` 和 `FEISHU_APP_SECRET`環境變量，確認應用有文檔讀取權限
飛書知識庫頁面抓取失敗	確認應用有 `wiki:wiki:readonly` 權限
r.jina.ai 返回空內容	無需操作，會自動降級到 defuddle.md
所有代理都失敗	URL 可能有嚴格認證限制，試試 `npx agent-fetch`

適合誰用？

markdown-proxy 適合所有 Claude Code 用戶，特別是：

• 日常需要讓 Claude 閲讀和分析網頁文章的開發者
• 需要抓取微信公眾號內容做研究或整理的人
• 團隊協作中需要把飛書文檔內容導出為 Markdown 的人
• 經常需要從 X/Twitter 等社交平台提取信息的人

進羣交流 & 領取福利

關於如何使用 Claude Code 和 OpenClaw 的各種玩法，小智建了一個學習交流羣，歡迎大家一起溝通玩法心得。

往期文章推薦

騰訊QClaw全面放開，三步搞定，微信就能遙控電腦

Nano Banana Skill：4張圖告訴你如何從一萬條 AI 繪圖中找到最佳提示詞

狂攬 7624 Stars！Claude HUD 插件：給你的 Claude Code 裝一塊儀表盤

OpenMAIC開源引爆教育圈！AI教育公司面臨危機？一鍵生成多智能體互動課堂

從AstronClaw 到 Coding Plan，訊飛做到了人人可用

手機養龍蝦案例之 paddleocr+openclaw打造一個發票管理助手

如果本文對您有幫助，也請幫忙點個贊👍 + 在看哈！❤️關注小智AI指南公眾號，AI 路上不迷路