Week #6|我花1小時寫了一個YouTube轉PDF逐字稿的Skill

作者:瞬時電壓
日期:2026年3月15日 下午12:05
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

我花1小時用Vibe Coding寫咗個YouTubePDF逐字稿嘅Skill,順便反思OpenClaw炒作背後嘅安全問題

整理版摘要

呢篇文章係作者分享自己喺週末用一個鐘頭寫咗個實用Skill嘅經歷。作者本身喺度搭建OpenClaw Skills,留意到OpenClaw最近好快出圈,但好少人討論安全性同後續使用成本,覺得盲目推廣對普通用家唔負責任。

作者平時會聽英文播客,想將經典內容整理成排版好嘅PDF逐字稿,但YouTube官方transcript同第三方網站抄出嚟嘅文字都係一嚿嚿冇結構,好難搞。後來見到Zara ZhangFrontend Slides Skill同數字生命卡茲克介紹Claude Code Skill更新,突然諗到可以自己寫一個Skill:輸入YouTube網址,自動生成排版好嘅PDF。

佢直接用Codex Vibe Coding,一個鐘頭就寫好咗,成功將一集播客轉成PDF。之後參考Claude Code文檔完善咗兼容性、測試同結構,放咗上GitHub開源。佢覺得好多嘢睇落複雜,其實只係冇人整好工具;與其等,不如自己動手。

  • OpenClaw出圈快但安全性同API成本討論嚴重不足,盲目推廣對普通人好唔負責任,同詐騙冇分別。
  • 作者受Zara ZhangFrontend Slides Skill同數字生命卡茲克文章啟發,決定自己寫一個啱用嘅Skill。
  • 需求源自想將YouTube播客逐字稿整理成排版好嘅PDF,但現有方法太麻煩。
  • Codex Vibe Coding花咗1個鐘寫好第一個版本,成功將《How to Build a Cult》轉成PDF,成就感好大。
  • 完善後開源,體會到工具一旦存在,好多需求就會變得好簡單;與其等,不如自己寫一個。
值得記低
連結 github.com

YouTube Transcript PDF Skill repo

作者開源嘅Codex Skill,用嚟將YouTube影片轉為排版好嘅PDF逐字稿。

整理重點

OpenClaw炒作背後嘅安全隱憂

呢兩週OpenClaw以近乎詭異嘅速度出圈,覆蓋面好廣,但關於安全性同後續使用成本嘅討論並冇隨熱度擴散。好多人淨係話Agent好強、可以自動化、開源,好少講Agent權限、API成本先係費用大頭、本地環境安全隔離呢啲實際問題。

整理重點

兩個助推:Zara嘅Skill同博主文章

需求好簡單:想將英文播客經典內容整理成排版好嘅PDF逐字稿,但YouTube同第三方網站嘅transcript都係一嚿冇結構嘅文字,之前試過一次就放棄咗。

第一個助推係Zara ZhangFrontend Slides Skill,雖然唔可以直接用,但睇佢項目結構時發現佢係修改Claude Code built-in skill嚟嘅,啟發咗自己可以用類似方法。第二個助推係數字生命卡茲克嘅文章提到Claude Code官方Skill Create Skills做咗大更新,令佢諗起Codex入面都有個skill-creator。

整理重點

一個鐘頭由零整出嚟

諗到「如果讓agent寫一個skill,輸入YouTube URL就自動生成排版好嘅PDF」,即刻動手。大概用咗一個鐘頭就寫好,用佢將Lulu Cheng嗰集《How to Build a Cult》成功轉成排版好嘅PDF。第一次vibe coding整出個對自己真係有用嘅小工具,成就感好大。

  • 做咗啲兼容性處理
  • 加咗少少測試
  • 調整咗結構
整理重點

去做你喜歡做嘅事,順便整污糟對手

呢週嘅感受:做自己喜歡做嘅事,把手弄髒,好多嘢其實冇想像中咁難。學到嘅嘢包括:Learn in PublicBuild in Public,仲有善用Codex嘅skill-creator。

呢個禮拜做咗兩件事:

  1. 配置 OpenClaw Skills
  2. 用 Codex 自己整咗一個自己用嘅 Skill

結果第二件事意外地比第一件事有意思得多。


第一件事:OpenClaw 到底係邊個喺度炒作啊

個人項目嘅框架整好咗,跟住就係配置 Skills。

畢竟唔似對住聊天視窗亂噏唔使諗費用,呢樣嘢一跑起上嚟,每一次對話、每一次調用工具,都係要燒錢嘅。所以基本嘅安全配置同慳錢配置都係要先搞掂。

呢兩個禮拜 OpenClaw 以一個近乎詭異嘅速度爆紅,覆蓋範圍之廣,真係嚇親人。

但奇怪嘅地方係:

關於 安全性,以及 後續使用成本 嘅討論,並冇隨住傳播嘅熱度一齊擴散開嚟。

好多人只係話:

  • • Agent 好勁
  • • 可以自動化
  • • 開源

但好少人講:

  • • Agent 嘅權限
  • • API 嘅後續成本(呢個先係費用大頭!)
  • • 本地環境嘅安全隔離

好難話唔係背後有一股勢力想揾老襯。

個人覺得,盲目推銷對普通人嚟講非常不負責任。

咁同詐騙有咩分別?

圖片

第二件事:去做你鍾意做嘅事,搞到對手污糟曬

呢個禮拜 vibe 咗一個自己用嘅 Skill。

都係本着 Learn in Public / Build in Public 嘅心態,寫嘅第一個 Skill。

呢個 Skill 嘅出現,其實係 一個需求 + 兩個助推


第一個助推:Zara Zhang 嘅 Skill

Zara Zhang 做咗一個 vibe skill,叫 Frontend Slides

佢做咗一個 Frontend Presentation 嘅小工具,可以將數據或者 pptx 轉成靜態前端頁面嚟展示。

我隨便掟咗兩個數據試咗下,效果還可以。但距離我日常工作嘅需求仲有啲距離。

不過真正有價值嘅地方唔係呢樣嘢可唔可以直接用。

而係我睇佢項目結構嘅時候突然發現:

呢個 Skill 嘅呈現效果其實同 Claude Code built-in 嘅 skill 好相似,只係喺上面做咗一啲修改。

呢個算係第一個助推。


第二個助推:AI博主嘅一篇文章

第二個助推嚟自 up 主 數字生命卡茲克 嘅一篇文章。

佢喺文章裏面講 Claude Code 官方嘅 skill Create Skills 最近做咗一次比較大嘅更新。

睇到呢度嘅時候我突然諗起:

Codex 裏面其實都有一個類似嘅 built-in skill —— skill-creator

都係一個官方用嚟 創建同更新技能嘅技能

呢個係第二個助推。


我嘅需求

我平時會聽一啲英文 podcast。

有啲內容非常經典,我會希望將佢整理成逐字稿保存落嚟。

例如 Lulu Cheng 嘅一期 podcast:

《How to Build a Cult》

呢一期講傳播學,資訊密度非常高。

喺接觸到 vibe coding 之前,我其實嘗試過喺網上揾呢期 podcast 嘅逐字稿。

揾到內容唔難。

難的是 排版

無論係從 YouTube 官方 transcript,定係第三方 transcript 網站複製出嚟嘅全文,基本都係一大嚿冇結構嘅文字。

如果想將佢整理成 閲讀體驗比較好嘅 PDF,其實要花唔少時間。

我試過一次之後就放棄咗呢種粗笨嘅 copy paste 方法。


一個突然出現嘅想法

後來遇到前面兩個助推嘅時候,我腦裏面突然冒出一個想法:

如果叫 agent 寫一個 skill,

輸入一個 YouTube URL,自動生成排版好嘅 PDF 逐字稿。

以後呢啲事咪會變得好簡單?


話做就做

於是就直接動手。

大概用咗一個鐘,呢個 Skill 就寫好咗。

然後我用佢將呢一期 podcast 成功轉咗一份排版好嘅 PDF。

第一次 vibe coding 寫出一個 對自己真係有用嘅小工具,成就感都唔錯㗎。

所以我將呢個 skill 嘅 repo 放咗上 GitHub。

(GitHub地址:https://github.com/SissiMeow/codex-skill-YouTube-Transcript-PDF.git)

算係自己 Build in Public 嘅第一個小作品。

成品自己用落都幾好,比較簡單易讀。

圖片


後來又參考 Claude Code 發佈嘅工程化 Skills 文檔,將呢個 Skill 稍微完善咗下:

  • • 做咗一啲兼容性處理
  • • 加咗少少測試
  • • 調整咗下結構

呢個禮拜有一個好直接嘅感受。

好多嘢睇起嚟複雜,其實只係因為冇人將工具整出嚟。

當工具存在之後,好多需求都會突然變得好簡單。

有時都唔使等其他人做。

自己寫一個就得。

做自己鍾意做嘅事,

順便搞到對手污糟啲。

這周幹了兩件事:

  1. 配置 OpenClaw Skills
  2. 用 Codex 手搓了一個自己用的 Skill

結果第二件事意外地比第一件事有意思得多。


第一件事:OpenClaw 到底是誰在炒作啊

個人項目的框架搭好了,接着就是配置 Skills。

畢竟不像對着聊天窗口嗨聊不用考慮費用,這玩意一旦跑起來,每一次對話、每一次調用工具,都是要燒錢的。所以基本的安全配置和省錢配置還是得先搞上。

這兩週 OpenClaw 以一個近乎詭異的速度出圈,覆蓋面之廣,令人咋舌。

但奇怪的地方在於:

關於 安全性,以及 後續使用成本 的討論,並沒有隨着傳播的熱度一起擴散開來。

很多人只是在說:

  • • Agent 很強
  • • 可以自動化
  • • 開源

但很少有人講:

  • • Agent的權限
  • • API 的後續成本 (這個才是費用大頭!)
  • • 本地環境的安全隔離

很難說不是背後有一股勢力想要劃拉W。

個人覺得,盲目推蝦對普通人來說非常不負責任。

這個跟詐騙有什麼區別?

圖片

第二件事:去做你喜歡做的事,把手弄髒

這周 vibe 了一個自己用的 Skill。

也是本着 Learn in Public / Build in Public 的心態,寫的第一個 Skill。

這個 Skill 的出現,其實是 一個需求 + 兩個助推


第一個助推:Zara Zhang 的 Skill

Zara Zhang 做了一個 vibe skill,叫 Frontend Slides

她做了一個 Frontend Presentation 的小工具,可以把數據或者 pptx 轉成靜態前端頁面來展示。

我隨便甩了兩個數據試用了一下,效果還可以。但距離我日常工作的需求還是有點距離。

不過真正有價值的地方不在於這個東西能不能直接用。

而是我在看她項目結構的時候突然發現:

這個 Skill 的呈現效果其實跟 Claude Code built-in 的 skill 很像,只是在上面做了一些修改。

這個算是第一個助推。


第二個助推:AI博主的一篇文章

第二個助推來自 up 主 數字生命卡茲克 的一篇文章。

他在文章裏講 Claude Code 官方的 skill Create Skills 最近做了一次比較大的更新。

看到這裏的時候我突然想起來:

Codex 裏面其實也有一個類似的 built-in skill —— skill-creator

也是一個官方用來 創建和更新技能的技能

這是第二個助推。


我的需求

我平時會聽一些英文播客。

有些內容非常經典,我會希望把它整理成逐字稿保存下來。

比如 Lulu Cheng 的一期播客:

《How to Build a Cult》

這一期講傳播學,信息密度非常高。

在接觸到 vibe coding 之前,我其實嘗試過在網上找這期播客的逐字稿。

找到內容不難。

難的是 排版

無論是從 YouTube 官方 transcript,還是第三方 transcript 網站複製出來的全文,基本都是一整坨沒有結構的文本。

如果想把它整理成 閲讀體驗比較好的 PDF,其實要花不少時間。

我試過一次之後就放棄了這種粗笨的 copy paste 方法。


一個突然出現的想法

後來遇到前面兩個助推的時候,我腦子裏突然冒出來一個想法:

如果讓 agent 寫一個 skill,

輸入一個 YouTube URL,自動生成排版好的 PDF 逐字稿。

以後這種事情不就會變得非常簡單?


說幹就幹

於是就直接動手。

大概花了一個小時,這個 Skill 就寫好了。

然後我用它把這一期播客成功轉成了一份排版好的 PDF。

第一次 vibe coding 寫出一個 對自己真的有用的小工具,成就感還是很不錯的。

所以我把這個 skill 的 repo 放到了 GitHub。

(GitHub地址:https://github.com/SissiMeow/codex-skill-YouTube-Transcript-PDF.git)

算是自己 Build in Public 的第一個小作品。

成品自己用起來還可以,比較簡單易讀。

圖片


後來又參照 Claude Code 發佈的工程化 Skills 文檔,把這個 Skill 稍微完善了一下:

  • • 做了一些兼容性處理
  • • 加了一點測試
  • • 調整了一下結構

這一週有一個挺直接的感受。

很多事情看起來複雜,其實只是因為沒人把工具做出來。

當工具存在之後,很多需求都會突然變得很簡單。

有時候也不用等別人做。

自己寫一個就行。

做自己喜歡做的事,

順便把手弄髒一點。