為了讀懂前沿AI論文,我做了個Skill把論文變成互動課程

作者:Zerox在探索
日期:2026年5月11日 下午10:38
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

做個Skill將論文變互動課程,幫你跨過論文門檻

整理版摘要

作者 Zerox 係一個 AI 領域探索者,佢發現自己雖然每日自動收集最新論文,但真正讀完嘅好少,因為論文實在太難啃。佢觀察到網上資訊好多都係被人咀嚼過嘅 n 手信息,細節同限定條件都丟失曬,得返個聳動標題。為咗可以直接接觸一手信息,佢決定整一個工具幫自己讀論文。

受到 Zara Zhang 嘅 codebase-to-course 項目啟發,作者整咗一個叫 paper-to-course 嘅 Claude Code Skill。畀佢一篇論文嘅 PDF 或 arXiv 連結,佢就會生成一個完整嘅 HTML 課程頁面。呢個課程唔係翻譯或者概括,而係好似一個家教咁,帶住你由背景知識開始,一步步理解論文嘅核心概念、方法同實驗結果,仲有好多互動元素,例如數學推導分步走、偽代碼逐行走、研究脈絡樹等等。

作者認為,一手信息正在變成稀缺資源,大部分人都唔會花時間追原文。而呢個工具嘅目的,就係將論文「睇唔明」道門檻拆低啲,令你有能力去接觸一手信息,然後自己作出判斷。咁樣先可以喺判斷力上拉開同其他人嘅差距。

  • 一手信息稀缺,論文係源頭但難讀,需要工具降低門檻先可以拉開判斷力差距。
  • 方法係整一個 paper-to-course Skill,將論文轉成互動 HTML 課程,包含背景知識模塊同直覺到形式化嘅學習順序。
  • 同傳統概括工具唔同,呢個工具像家教咁帶你理解,唔係只畀結論,而係解釋點解同點樣。
  • 啟發來自 Zara Zhang 將代碼變課程嘅思路,證明論文都可以用相同邏輯轉成可互動嘅學習體驗。
  • 可行動點:安裝 skill 後用自然語言指令,例如「幫我把這篇論文轉成教程」,就會生成可直接打開嘅 HTML 檔案。
值得記低
工具 github.com

paper-to-course Skill

將論文PDF或arXiv連結轉換成互動HTML課程的Claude Code Skill。安裝後用自然語言指令如「幫我把這篇論文轉成教程」即可使用。

整理重點

一手信息嘅稀缺與論文難題

作者發現自己每日收一堆論文,但大多數都冇真正讀完。佢形容呢個模式:張三讀論文寫摘要,李四讀摘要做可視化,王五讀可視化發帖話「AI 又革命咗」;你最後刷到嘅係王五,資訊已經被咀嚼咗好幾輪。

一手信息正在變成稀缺資源

作者明白要追一手信息就要讀論文,但論文真係太難讀——一入正文就懷疑人生,公式睇唔明,前置概念又跳過,最後得個「收咗等於讀咗」嘅幻覺。

整理重點

從「概括工具」到「論文家教」

作者一開始試過用工具概括論文,但發現概括只畀結論,唔解釋點解同點樣,好似知道答案但唔識解題過程。佢需要嘅係一個真正嘅老師角色——補齊背景知識、帶住推導核心公式、隨時解釋疑惑。

我需要一個真正的老師角色

呢個念頭嚟自 Zara Zhang 嘅 codebase-to-course 項目,佢將成個代碼庫變成互動課程。作者借鑑呢個思路,整咗 paper-to-course。畀論文嘅 PDF 或 arXiv 連結,就會生成一個完整嘅 HTML 課程頁面,唔係翻譯或者概括,而係一個家教。

Module 0

課程由背景知識開始(Module 0),先幫你補齊前置概念,例如 GRPO 論文會先講強化學習同策略梯度。然後每章順序係「直覺→形式化」:先用日常例子建立直覺,再睇公式,最後解釋公式講咩。呢個順序反轉傳統論文嘅定義-定理-證明路徑,更符合人類學習。

整理重點

互動元素:唔再「好像明」

課程包含大約18種交互元素,每種都係為咗令你真係理解,而唔係「好似明」。以下係幾個突出例子:

  • 數學推導分步走:逐一點擊睇公式點推出來,每一步有白話解釋。
  • 偽代碼逐行走:高亮每一行代碼,右邊同步顯示呢行做咩,唔使再呆望。
  • 結果對比交互:動態切換評估指標,睇不同方法嘅條形圖變化,一眼睇出誰好同好幾多。
  • 研究脈絡樹:點一個節點展開論文關係圖,睇清誰啟發咗佢、同邊篇對比、同邊篇一脈相承。
  • 選擇題測驗、拖拽配對、消融切換、術語懸浮提示等

18種交互元素

整理重點

製作流程:深度閲讀與課程設計

  1. 1 深度讀論文:理解核心內容。
  2. 2 知識擴展:用 WebSearch 揾論文依賴嘅前置概念、相關論文同研究脈絡。
  3. 3 課程設計:將知識組織成5到8個模塊,每個模塊係故事嘅一章,從背景講到問題再到方法同實驗,係敍事而唔係逐節翻譯。呢步要做取捨——放邊啲、跳過邊啲、順序點排。
  4. 4 構建:一個模塊一個模塊寫 HTML
  5. 5 審查:開瀏覽器逐項檢查。

整篇論文大概花一兩個鐘,但比起自己硬啃一下午,價值高得多,至少真係讀得明。

整理重點

即裝即用,拉開判斷力差距

呢個係畀 Claude Code 用嘅 skill。直接將安裝命令發畀 agent:「幫我安裝呢個技能:https://github.com/ZeroxZhang/paper-to-course.git」。安裝後用自然話指令就得,例如「幫我把這篇論文轉成教程」或「turn this paper into a course」。畀 PDF 或論文連結,其餘自動搞掂。生成嘅 index.html 直接用瀏覽器打開,唔使裝嘢或搭 server,唯一依賴係 Google Fonts 同 KaTeX CDN,第一次加載後可以離線用。

拆低一點門檻

全文約2100字 | 閲讀大概需要5分鐘


為咗睇明前沿AI論文,我做咗個Skill將論文變成互動課程

一手資訊正在變成稀缺資源。呢個工具幫你跨過論文嗰道「睇唔明」嘅門檻。

作者 | Zerox在探索
編輯 | Zerox在探索

大家有冇發現,我哋每日都喺度食緊人哋咀嚼過嘅n手資訊。

圖片


尤其係AI領域。互聯網討論一個AI新進展,每個人都在轉同一篇公眾號嘅解讀,但好少人真係睇緊嗰篇原始論文或者前沿博客。

呢個係個幾普遍嘅模式。張三讀咗一篇論文,寫咗個摘要。李四讀咗張三嘅摘要,做咗個可視化。王五讀咗李四嘅可視化,出咗個post話「AI又革命啦」。你碌到嘅係王五。

資訊喺呢種傳遞裏面被咀嚼咗好幾輪。細節冇咗。限制條件冇咗。作者小心嘅措辭都冇咗。最後剩低一個煽動嘅標題,一個過分簡化嘅結論。

我唔係話呢類內容冇價值。但係如果你對AI嘅認知,完全建立喺被人反覆消化過嘅知識上面,咁你對技術嘅判斷力,大概會比人慢一拍。

前沿嘅增量資訊,喺論文裏面。呢個道理我知。但問題係。

論文真係太難睇喇。

01.我每日收一堆論文,然後……基本上冇讀

為咗令自己盡可能接近資訊源頭,之前我幫我個agent set咗個定時任務。每日自動去ArXiv度摷當日最新嘅AI論文,整合成一份簡報send畀我。(提示詞可以pm我拎)

一開始都幾興奮㗎。每日朝早起身開email,覺得自己企喺知識嘅最前線。有啲「我喺度追一手資訊」嘅幻覺。

但好快我就發現一個問題:收咗,唔代表睇咗。睇咗,更加唔代表明咗。

大部分論文嘅體驗係咁。標題好吸引,摘要勉強睇得明,一入正文就開始懷疑人生。第一個公式出現嘅時候你仲頂得住,第三個公式出現嘅時候你已經唔知前面講乜。

而且唔止係公式嘅問題。你會發現論文假設你知道一大堆前置概念。咩係policy gradient?咩係KL divergence?咩係zero-advantage problem?作者覺得呢啲都係「顯然嘅」,一句輕輕帶過。但係你唔知,所以你卡住咗。

我書籤裏面嘅論文越嚟越多。真正睇完嘅,一隻手數得曬。

02.有冇可能,叫AI教我睇論文?

一開始我試過最簡單嘅方法:將論文掉畀工具,叫佢幫我歸納。

有用,但係唔夠。歸納畀你嘅係一個結論。你知道呢篇論文提出咗乜,但係你唔理解佢點解咁做、點樣做、前提假設係乜。就好似知道考試答案但係唔識解題過程。下次換一條題目,你都係唔識。

我需要嘅係一個真正嘅老師角色。幫我補返背景知識,帶住我一步步推導核心公式,喺我腦入面彈出疑問嘅時候解釋畀我聽。

呢個時候我想起之前見到嘅一個嘢。

Zara Zhang做咗一個叫Codebase to CourseCodebase to Course嘅技能。將成個代碼庫變做一份互動式網頁課程,帶住你一步步理解代碼點樣運作。

呢個俾咗我好重要嘅啟發:如果代碼可以變做課程,論文點解唔得?

呢度要特別多謝Zara。如果你對「將代碼變做課程」呢件事有興趣,可以睇佢嘅codebase-to-course項目。我做嘅呢個工具,喺任務設計上大量參考咗佢嘅思路。好嘅靈感係會傳染㗎。

03.所以我做咗一個「論文轉課程」嘅工具

佢叫paper-to-course。

畀佢一篇論文嘅PDF或者arXiv連結,佢會生成一個完整嘅HTML課程頁面。你直接用瀏覽器打開就得。

佢做嘅嘢,唔係翻譯,亦唔係歸納。佢更加似係俾咗你一個補習老師,帶住你由頭到尾讀明一篇論文。

圖片

左邊有一個固定嘅目錄欄

好似Coursera或者Notion嘅課程頁面咁。你隨時知道自己學到邊度,亦可以直接跳去任何一個模塊。碌頁面嘅時候,目錄會自動highlight當前所在嘅章節。

課程係由「你唔知嘅嘢」開始嘅

呢個係我覺得最唔同嘅地方。傳統讀論文嘅路徑:打開第一頁,由頭開始死啃。但係論文作者預設你知道好多嘢,佢唔會喺正文入面幫你補返。

所以每門課都有一個Module 0,叫「背景同前置知識」。喺學論文內容之前,先幫你補返需要嘅概念。例如一篇講GRPO嘅論文,Module 0會先講清楚乜嘢係強化學習、乜嘢係策略梯度。有咗呢啲概念再去看論文,唔會迷路。

佢按照「直覺→形式化」嘅順序講

每一章先話畀你知呢件事大概係乜意思,用一個日常例子幫你建立直覺。然後再畀你睇公式。公式睇完,再解釋呢個公式到底講乜。

呢個順序係調轉嘅。論文本身嘅順序基本上都係:定義、定理、證明、實驗。但呢個工具將順序反轉咗:直覺、背景、方法、實驗、限制。

我自己覺得,呢個先係人類學習嘅自然路徑。

圖片

呢個係一個生成示例

04.佢唔止係一堆文字

呢個課程入面塞咗唔少互動嘅嘢。講幾個我比較鍾意嘅。

數學推導逐步解說

你唔會見到一個完整嘅公式然後呆咗。你可以一步步撳,睇嚇呢個公式點樣推導出嚟。每一步側邊都有白話解釋。

偽代碼逐行解讀

好多論文會有一段算法偽代碼。講真我以前見到偽代碼基本上係跳過嘅。但呢個工具會highlight算法嘅每一行,右邊同步顯示呢一行做緊乜。終於唔使對住偽代碼發呆。

結果對比互動

論文裏面嘅實驗結果通常係一張靜態表格。喺課程入面,你可以切換唔同嘅評估指標,睇唔同方法之間嘅對比條形圖動態變化。邊個比邊個好、好咗幾多,一眼就睇得出。

研究脈絡圖

撳一個節點,展開呢篇論文同其他論文嘅關係。邊個啟發咗佢、佢同邊個對比過、佢同邊個係一脈相承。論文唔係一個孤島,呢張圖可以令你睇到佢喺成個研究版圖入面嘅位置。

仲有選擇題測驗、拖拽配對、消融切換、術語懸浮提示。加埋大概有18種互動元素。每個元素背後嘅邏輯係一樣:令你真正理解,而唔係「好似明咗」。

05.點樣做出嚟

講嚇呢個工具背後嘅流程。唔使講得太細,但我覺得了解呢個過程,可以令你知道佢唔係隨便翻譯。

深度讀論文。

知識擴展。上WebSearch,揾呢篇論文依賴嘅前置概念、最重要嘅相關論文、佢所在嘅研究脈絡。

課程設計。將知識組織成5到8個模塊,每個模塊係故事嘅一個章節。由背景講到問題,由問題講到方法,由方法講到實驗,由實驗講到限制。係成個敍事,唔係論文嘅逐節翻譯。呢一步要做好多取捨,邊啲放落去、邊啲跳過、順序點排。

構建。一個模塊一個模塊咁寫HTML。

審查。打開瀏覽器,逐項檢查。

成個過程行落嚟,一篇論文大概要花我一兩個鐘。但係呢一兩個鐘花得嚟,比起自己死啃成個下晝論文值得多。至少我真係讀明咗。

圖片


06.怎麼用

呢個工具係畀Claude Code用嘅一個skill。

直接將安裝命令send畀你個agent就得:

幫我安裝這個技能:https://github.com/ZeroxZhang/paper-to-course.git


安裝之後,你用最自然嘅話同佢講就得:

  • 「幫我將呢篇論文轉成教程」
  • 「用呢個arXiv連結做一份課程」
  • 「turn this paper into a course」

畀佢PDF或者論文連結,剩低嘅佢自己搞掂。生成嘅index.html直接用瀏覽器打開,唔使裝任何嘢,唔使搭伺服器。唯一嘅依賴係Google Fonts同KaTeX嘅CDN,第一次load完之後可以離線用。

代碼開源喺GitHub,歡迎Star,Apache 2.0協議。歡迎拎走,歡迎改,亦歡迎話畀我知邊度做得唔好。

最後講兩句

返去開頭講嗰件事。

資訊流動越嚟越快,一手資訊正在變成稀缺資源。大部分人唔會花時間去追原文、追論文。但正正因為大部分人都唔做,啲願意做嘅人,就能夠喺判斷力上拉開差距。

呢個工具唔係取代你思考。佢只係幫你將「睇唔明」嗰道門檻拆低少少。

令你有能力去接觸一手資訊,然後自己做出判斷。

互動話題

你係點樣獲取AI前沿資訊嘅?有冇遇到過論文睇唔明嘅情況?留言傾嚇,亦歡迎推薦你覺得好用嘅論文閲讀工具。


本文為原創內容,版權歸「Zerox在探索」所有

多謝 Zara Zhang 同佢嘅 codebase-to-course 項目帶嚟嘅啟發

歡迎關注、讚好、分享到朋友圈

全文約2100字 | 閲讀大約需要5分鐘


為了讀懂前沿AI論文,我做了個Skill把論文變成互動課程

一手信息正在變成稀缺資源。這個工具幫你跨過論文那道"看不懂"的門檻。

作者 | Zerox在探索
編輯 | Zerox在探索

大家有沒有發現,我們每天都在進食別人咀嚼過的n手信息。

圖片


尤其是AI領域。互聯網討論一個AI新進展,每個人都在轉同一篇公眾號的解讀,但很少有人真的在看那篇原始論文或者前沿博客。

這是個挺普遍的模式。張三讀了一篇論文,寫了個摘要。李四讀了張三的摘要,做了個可視化。王五讀了李四的可視化,發了個帖子說"AI又革命了"。你刷到的是王五。

信息在這種傳遞裏被咀嚼了好幾輪。細節丟了。限定條件丟了。作者的謹慎措辭也丟了。最後剩下一個聳動的標題,一個過度簡化的結論。

我不是說這類內容沒價值。但如果你的AI認知,全建立在被人反覆咀嚼過的知識上,那你對技術的判斷力,大概率比別人慢一拍。

前沿的增量信息,在論文裏。這道理我知道。但問題是。

論文真的太難讀了。

01.我每天收一堆論文,然後……基本沒讀

為了讓自己儘可能的靠近信息源,前陣子我給agent做了一個定時任務。每天自動去ArXiv上扒當天最新的AI論文,彙總成一份簡報發給我。(提示詞可以私我獲取)

一開始還挺興奮的。每天早上醒來打開郵箱,覺得自己站在知識的最前沿。多少有點"我在追一手信息"的幻覺。

但很快我就發現一個問題:收了,不代表讀了。讀了,更不代表懂了。

大部分論文的體驗是這樣的。標題很誘人,摘要勉強看懂,一進正文就開始懷疑人生。第一個公式出現的時候你還能撐住,第三個公式出現的時候你已經不知道前面在說什麼了。

而且不只是公式的問題。你會發現論文假設你知道一堆前置概念。什麼是policy gradient?什麼是KL divergence?什麼是zero-advantage problem?作者覺得這些都是"顯然的",一句話帶過。但你不知道,所以你卡住了。

我收藏夾裏的論文越來越多。真正讀完的,一隻手數得過來。

02.有沒有可能,讓AI來教我看論文?

一開始我試過最簡單的方法:把論文丟給工具,讓它幫我概括。

有用,但不夠。概括給你的是一個結論。你知道這篇論文提出了什麼,但你不理解它為什麼這麼做、怎麼做的、前提假設是什麼。就像知道了考試答案但不會解題過程。下次換一道題,你還是不會。

我需要的是一個真正的老師角色。幫我補齊背景知識,帶着我一步步推導核心公式,在我腦子冒出疑問的時候給我解釋。

這時候我想起來之前看到的一個東西。

Zara Zhang做了一個叫Codebase to Course的技能。把一整個代碼庫變成一份交互式網頁課程,帶着你一步步理解代碼是怎麼工作的。

這給了我非常重要的啓發:如果代碼可以變成課程,論文為什麼不行?

這裏要特別感謝一下Zara。如果你對"把代碼變成課程"這件事感興趣,可以去看她的codebase-to-course項目。我做的這個工具,在任務設計上大量借鑑了她的思路。好的靈感是會傳染的。

03.所以我做了一個"論文轉課程"的工具

它叫 paper-to-course。

給它一篇論文的PDF或arXiv連結,它生成一個完整的HTML課程頁面。你直接用瀏覽器打開就行。

它做的事,不是翻譯,也不是概括。它更像是給你配了一個家教,帶着你從頭到尾讀透一篇論文。

圖片

左邊有一個固定的目錄欄

就像Coursera或Notion的課程頁面一樣。你隨時知道自己學到哪裏了,也可以直接跳到任何一個模塊。滾動頁面的時候,目錄會自動高亮當前所在的章節。

課程是從"你不知道的東西"開始的

這是我覺得最不一樣的地方。傳統讀論文的路徑:打開第一頁,從頭開始啃。但論文作者默認你知道很多東西,他不會在正文裏幫你補。

所以每門課都有一個Module 0,叫"背景與前置知識"。在學習論文內容之前,先幫你把需要的概念補上。比如一篇講GRPO的論文,Module 0會先講清楚什麼是強化學習、什麼是策略梯度。有了這些概念再去看論文,不會迷路。

它按照"直覺→形式化"的順序講

每一章先告訴你這件事大概是什麼意思,用一個日常例子幫你建立直覺。然後再給你看公式。公式看完,再解釋這個公式到底在說什麼。

這個順序是反過來的。論文本身的順序基本都是:定義、定理、證明、實驗。但這個工具把順序反轉了:直覺、背景、方法、實驗、侷限性。

我自己覺得,這才是人類學習的自然路徑。

圖片

這是一個生成示例

04.它不只是一堆文字

這個課程裏塞了不少交互的東西。說幾個我比較喜歡的。

數學推導分步走讀

你不會看到一個完整的公式然後呆住。你可以一步步點擊,看這個公式是怎麼推導出來的。每一步旁邊都有白話解釋。

偽代碼逐行走讀

很多論文會有一段算法偽代碼。說實話我以前看到偽代碼基本上是跳過的。但這個工具會高亮算法的每一行,右邊同步顯示這一行在做什麼。終於不用盯着偽代碼發呆了。

結果對比交互

論文裏的實驗結果通常是一張靜態表格。在課程裏,你可以切換不同的評估指標,看不同方法之間的對比條形圖動態變化。誰比誰好、好了多少,一眼就能看出來。

研究脈絡樹

點一個節點,展開這篇論文跟其他論文的關係。誰啓發了它、它跟誰對比了、它跟誰是一脈相承的。論文不是一個孤島,這個圖能讓你看到它在整個研究版圖裏的位置。

還有選擇題測驗、拖拽配對、消融切換、術語懸浮提示。加在一起大概有18種交互元素。每個元素背後的邏輯是一樣的:讓你真正理解,而不是"好像懂了"。

05.怎麼做出來的

說一下這個工具背後的流程。不用講太細,但我覺得了解這個過程,能讓你知道它不是在隨便翻譯。

深度讀論文。

知識擴展。上WebSearch,找這篇論文依賴的前置概念、最重要的相關論文、它所在的研究脈絡。

課程設計。把知識組織成5到8個模塊,每個模塊是故事的一個章節。從背景講到問題,從問題講到方法,從方法講到實驗,從實驗講到侷限。是一整個敍事,不是論文的逐節翻譯。這一步要做很多取捨,哪些放進去、哪些跳過、順序怎麼排。

構建。一個模塊一個模塊地寫HTML。

審查。打開瀏覽器,逐項檢查。

整個過程走下來,一篇論文大概要花我一兩個小時。但這一兩個小時花的,比自己硬啃一下午論文值多了。至少我真的讀懂了。

圖片


06.怎麼用

這個工具是給Claude Code用的一個skill。

直接把安裝命令發給你的agent就行了:

幫我安裝這個技能:https://github.com/ZeroxZhang/paper-to-course.git


安裝之後,你用最自然的話告訴它就行:

  • "幫我把這篇論文轉成教程"
  • "用這個arXiv連結做一份課程"
  • "turn this paper into a course"

給它PDF或論文連結,剩下的它自己搞定。生成的index.html直接用瀏覽器打開,不需要裝任何東西,不需要搭服務器。唯一的依賴是Google Fonts和KaTeX的CDN,第一次加載之後可以離線用。

代碼開源在GitHub,歡迎Star,Apache 2.0協議。歡迎拿走,歡迎改,也歡迎告訴我哪裏做得不好。

最後說兩句

回到開頭說的那件事。

信息流動越來越快,一手信息正在變成稀缺資源。大部分人不會花時間去追原文、追論文。但恰恰因為大部分人不做。那些願意做的人,就能在判斷力上拉開差距。

這個工具不是替代你思考。它只是幫你把"看不懂"那道門檻拆低一點。

讓你有能力去接觸一手信息,然後自己做出判斷。

互動話題

你是怎麼獲取AI前沿信息的?有沒有遇到過論文讀不懂的情況?留言聊聊,也歡迎推薦你覺得好用的論文閲讀工具。


本文為原創內容,版權歸「Zerox在探索」所有

感謝 Zara Zhang 和她的 codebase-to-course 項目帶來的啓發

歡迎關注、點贊、在看、轉發到朋友圈