Obsidian 推出了 Defuddle, 把 Obsidian Web Clipper 推到了一個新的高度

作者:效率火箭
日期:2026年3月8日 上午7:30
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Obsidian 推出 Defuddle,將網頁抽取能力獨立開放

整理版摘要

作者一向鍾意 Obsidian 嘅本地優先、文件為中心理念,尤其係 Web Clipper 插件可以將網頁剪藏成 Markdown,仲支援模板同邏輯操作。不過默認模板有門檻,Power User 先會自己調教。而家 Obsidian 推出 Defuddle.md,將 Web Clipper 背後最核心嘅網頁抽取功能獨立開放。

佢係一個純粹嘅「清洗層」,畀一個 URL 就幫你剷走廣告同雜亂元素,輸出乾淨 HTML 或 Markdown。最重要係開源,可以自己部署,完全體現 File Over App 理念。相比 Jina AI 嘅付費 Reader API,Defuddle 免費又開放,但作者擔心會被濫用或封鎖。

  • 結論DefuddleObsidian Web Clipper 嘅核心抽取層,獨立開放後任何人都可以用,仲係開源。
  • 方法:支援三種使用方式——瀏覽器直接輸入 URLURL 接口畀 AI/開發者、整合入 Web Clipper 插件。
  • 差異:其他剪藏工具通常鎖定用戶畀特定 App,Defuddle 開源可自部署,用戶自己控制數據。
  • 啟發URL 接口令 AI Agent 可以輕易獲取乾淨網頁內容,大幅降低網頁爬取同清洗嘅開發成本。
  • 可行動點:立即試用 Defuddle.md,或者自部署開源版本,用嚟打造自己嘅網頁剪藏工具。
值得記低
連結 defuddle.md

Defuddle.md - 網頁轉 Markdown 工具

Obsidian 推出嘅開源網頁抽取工具,提供 URL 接口同自部署選項,將網頁內容轉成乾淨 Markdown。

整理重點

Web Clipper:網頁變 Markdown 嘅進化

Obsidian Web Clipper 已經超越傳統剪藏,佢支援極靈活嘅模板,可以提取作者、發佈時間等元數據,仲有條件判斷同循環邏輯。

Web Clipper 嘅模板支援條件判斷同循環,令採集階段就已經整理好內容,直接變成結構化本地 Markdown 文件。

整理重點

Defuddle:開放嘅網頁淨化引擎

DefuddleWeb Clipper 背後嘅核心抽取層,獨立開放後變成一個專注清洗網頁嘅工具。畀一個連結,佢就幫你剷走廣告、推薦區等雜訊,提取乾淨正文同元數據。

Defuddle 一個連結,佢就幫你清洗廣告同雜亂元素,提取乾淨正文,完全係一個網頁淨化器。

  1. 1 普通用戶:瀏覽器訪問 defuddle.md,貼上網址即可查看清洗後 HTMLMarkdown
  2. 2 AI Agent 或開發者:通過 URL 接口程式化調用,獲取轉換結果。
  3. 3 Obsidian 用戶:直接使用 Web Clipper 插件,背後已經用緊 Defuddle
整理重點

File Over App:開源帶來嘅自由

市面上好多剪藏插件嘅目的係鎖定用戶到某個特定 App,但 Obsidian 嘅理念係 File Over App。Defuddle 進一步將核心功能開源,任何人都可以自己部署,真正讓 App 成為用戶控制嘅系統。

Defuddle 嘅開源令 App 成為用戶控制嘅系統,唔係反過來,呢點好 Obsidian

不過作者擔心開源後會被濫用或者被網站封鎖,畢竟呢類工具太方便,可能會衝擊原有生態。

整理重點

下一步:立即試用 Defuddle

唔使等,而家就可以去 defuddle.md 貼條連結試下效果。如果你係開發者,可以拉個開源專案自己部署,整合到你哋嘅工作流程。

唔好擔心被濫用,開源社羣會持續維護,而且你可以自己控制部署方式,確保服務穩定。

  • 試用 Defuddle.md 網站,體驗網頁轉 Markdown 嘅效果。
  • fork 開源倉庫,自部署一個私人實例。
  • URL 接口整合到 AI Agent 或用戶端工具,實現自動化網頁收集。
圖片

我一向好鍾意 Obsidian 嘅核心諗法:本地優先,乜都係文件,而且係純粹嘅 Markdown 文字檔案。喺呢種模式之下,筆記完全屬於我哋自己,可以自由咁配搭唔同嘅組件或者插件,跟住自己嘅習慣去定製操作同工作流程。而且,資訊嘅保存、備份同步,全部都係喺我哋自己控制之下。

我之前介紹過 Obsidian 自己推出嘅 Web Clipper,一個網頁剪藏類嘅瀏覽器插件,同樣跟住上面講嘅「文件中心」理念,將我哋成日瀏覽嘅網頁內容變成一個 Markdown 筆記,存落 Obsidian 嘅資料庫入面,而且仲包含元資訊。

最近 Obsidian 推出咗一個新網站,Defuddle.md,Defuddle 係 Obsidian 本地文件生態系統裏面一個好勁嘅工具,簡單啲講,係 Obsidian Web Clipper 嘅網頁版。

如果將 Obsidian 睇成一個本地筆記嘅 OS,我哋之前介紹過 CLI(命令行接口),呢個 Defuddle 更加似 Obsidian Web Clipper 嘅一個 URL 接口。

所以,喺詳細講解 Defuddle 之前,我哋快速回顧一下 Web Clipper。

Obsidian Web Clipper:將網頁變成 Markdown

講到 Obsidian Web Clipper,我個人認為佢最吸引人嘅地方,係在於佢一早已經超越咗傳統嘅網頁保存擷取功能。

圖片


佢唔單止係將網頁捉落嚟,更加犀利嘅係支援非常靈活嘅 Obsidian 模板。Web Clipper 可以提取網頁入面嘅各種元數據(例如作者、發佈時間、甚至特定嘅頁面元素)。更令我驚喜嘅係,佢而家仲支援條件判斷、循環呢啲邏輯操作。呢個意味住,喺收集網頁嘅階段,我哋就可以跟住自己嘅規則將內容整理好,直接變成乾淨、有結構嘅本地 Markdown 檔案。

當然缺點係,如果用戶唔鍾意預設嘅整理模板,就要自己設定,呢個過程可能有啲門檻(其實可以叫 AI 幫你搞)。

但係總括嚟講,Obsidian Clipper 完美咁配合咗 Obsidian 嘅生態,令到網頁內容好順暢咁融入我哋個人嘅知識庫。對於 Power User,又提供咗自己搞嘅空間。唔好睇小呢啲 Power User,咁多 Obsidian 插件,大部分都係用戶自己整出嚟嘅。

Defuddle.md:專心清洗嘅抽取層

而 Defuddle 嘅出現,令我覺得 Obsidian 係將 Web Clipper 背後最核心嘅網頁抽取能力單獨開放咗出嚟。

如果大家係某個資訊領域嘅資料收集者、研究者、數據分析者……如果自己又稍微識得搞兩下,又或者藉助 AI(包括最近好紅嘅小龍蝦)搞兩下,咁 Defuddle.md 絕對係一個驚喜!

圖片

畀 Defuddle 一個連結,佢就可以幫你清洗走網頁上嘅廣告、推薦區等雜亂元素,盡量提取出乾淨嘅正文同有結構嘅元數據。就好似一個專門負責將複雜網頁轉化為標準 Markdown 文字嘅淨化器。有咗呢個,任何人都可以做一個自己嘅 Web Clipper,而且唔需要隸屬於 Obsidian。

Defuddle 提供幾種訪問方式。

  • 普通用戶,用瀏覽器訪問,輸入要轉換嘅網頁網址,睇清洗過嘅 HTML 或 Markdown
  • AI Agent 或者開發者,經 URL 接口,取得清洗轉換結果
  • Obsidian 用戶,直接用 Web Clipper 插件就得(背後就係 Defuddle)。

其中最有價值嘅,我覺得就係「URL 接口」,想像我係一個小龍蝦,又聾又盲,按用戶要求收集訪問網頁好痛苦,又係無頭瀏覽器,又係俾人封鎖,就算攞到網頁,入面嘅雜質噪音好多;而家好喇,直接調用 Defuddle 就搞掂曬。

而且,好重要嘅係,Defuddle 係開源嘅。我哋甚至可以自己喺本地部署。呢個就好 Obsidian 喇。令 App 成為用戶自己可以控制嘅系統,而唔係將用戶變成 App 嘅附庸。

最後

市面上,其實剪藏插件好多,其中唔少嘅目的係鎖定用戶去某個特定 App。而 Obsidian Web Clipper 唔同,因為 Obsidian 嘅理念係 File Over App。而家,更進一步,Defuddle 被開放咗出嚟,大家可以直接用喇,而且仲係開源嘅。所以,有啲太過闊綽,反而唔適應。

如果對呢類網頁擷取(作為 PKM 重要部分)有興趣嘅話,之前 Jina.ai 都提供咗付費嘅 Reader API(下圖)。Jina 係好多 AI 從業者嘅首選,而家就覺得有咗一個免費開源嘅對手。當然,Jina 號稱係用 AI 模型清洗擷取,仲有啲唔同。

圖片

講真,我而家反而開始擔心 Defuddle 會俾人濫用(或者俾人封鎖)。


圖片
圖片

我一直很喜歡 Obsidian 的核心理念:本地優先,萬物皆文件,而且是單純的 Markdown 文本文件。在這樣的模式下,筆記完全屬於我們自己,我們可以自由地搭配各種組件或插件,按照自己的習慣去定製操作和工作流。 而且,信息的保存備份同步,都在我們自己的控制下。

我之前介紹過 Obsidian 自家推出的 Web Clipper, 一個網頁剪藏類的瀏覽器插件,同樣秉承了上述的「文件中心」理念,把我們正在瀏覽的網頁內容變為一個Markdown 筆記, 存入 Obsidian 的資料庫中,而且還包含元信息。

最近 Obsidian 推出了 一個新的網站,Defuddle.md,Defuddle 是 Obsidian 本地文件生態系統裏一個非常強力的工具,通俗來說,是 Obsidian Web Clipper 的網頁版。

如果把 Obsidian 看作一個本地筆記的 OS, 我們之前介紹過 CLI(命令行接口),這個 Defuddle 更像Obsidian Web Clipper 的一個 URL 接口。

所以,在詳解 Defuddle 之前,我們先快速回顧一下 Web Clipper。

Obsidian Web Clipper :網頁變 Markdown

聊到 Obsidian Web Clipper,我個人覺得它最吸引人的地方,在於它早就超越了傳統的網頁保存抓取功能。

圖片


它不僅僅是把網頁抓下來,更厲害的是它支持極其靈活的 Obsidian 模板。Web Clipper 能夠提取網頁裏的各種元數據(比如作者、發佈時間、甚至特定的頁面元素)。更讓我驚喜的是,它現在還支持條件判斷、循環這些邏輯操作。這意味着,在採集網頁的階段,我們就可以按照自己的規則把內容整理好,直接變成乾淨、結構化的本地 Markdown 文件。

當然弊端是,如果用戶不喜歡默認的整理模板,需要自己配置,這個過程可能會有一些門檻(其實可以讓 AI 來配)。

但總的來說,Obsidian Clipper 完美契合了 Obsidian 的生態,讓網頁內容非常順滑地融入我們個人的知識庫。對於 Power User,又提供了自己搗鼓的空間。不要小看這些 Power User, 那麼多 Obsidian 插件,大多都是用戶自己搗鼓出來的。

Defuddle.md:專注清洗的抽取層

而 Defuddle 的出現,讓我覺得 Obsidian 是把 Web Clipper 背後最核心的網頁抽取能力單獨開放出來了。

如果,大家是某個信息領域的資料收集者,調研者,數據分析者 …… 如果自己又能稍微搗鼓兩下,又或者藉助 AI(包括最近大火的小龍蝦)搗鼓兩下。 那麼Defuddle.md 絕對是一個驚喜!

圖片

給 Defuddle 一個連結,它就能幫你清洗掉網頁上的廣告、推薦區等雜亂元素,儘量提取出乾淨的正文和結構化的元數據。它就像是一個專門負責把複雜網頁轉化為標準 Markdown 文本的淨化器。 有了這個,任何人都可以做一個自己的 Web Clipper,而且不用隸屬於 Obsidian。

Defuddle 提供幾種訪問方式。

  • 普通用戶,瀏覽器訪問,輸入需要轉換的網頁網址,查看清洗過的 HTML 或 Markdown
  • AI Agent 或 開發者, 通過 URL 接口,獲取清洗轉換結果
  • Obsidian 用戶, 直接使用 Web Clipper 插件 即可(背後就是 Defuddle)。

其中最有價值的,我覺得就是 「URL 接口」,想象我是一個小龍蝦,又聾又瞎,按用戶要求收集訪問網頁非常痛苦,又是無頭瀏覽器,又是被屏蔽,即使取得網頁,裏面的雜質噪音又很多; 現在好了,直接調用 Defuddle 一切解決。

而且,很重要的是,Defuddle 是開源的。我們甚至可以自己本地部署。這就很 Obsidian 了。 讓 App 成為用戶自己可以控制的系統,而不是把用戶變成 App 的附庸。

最後

市面上,其實剪藏插件很多,其中不少的目的是鎖定用戶到某個特定App。 而 Obsidian Web Clipper 不同, 因為 Obsidian 理念是 File Over App。 現在,更進一步, Defuddle 被開放出來,大家可以直接用了,而且還是開源的。 所以,有點太闊綽了,反而不適應了。

如果對這類網頁抓取(作為PKM重要組成部分)有興趣的話,之前 Jina.ai 也提供了付費的 Reader API (下圖)。Jina 是很多 AI 從業者的首選,現在則感覺有了一個免費開源的對手。當然,Jina號稱是 AI模型 清洗抓取,還略有不同。

圖片

說實話,我現在反而開始擔心 Defuddle 要被人濫用了(或者被屏蔽了)。


圖片