Week #6|我花1小時寫了一個YouTube轉PDF逐字稿的Skill
整理版優先睇
我花1小時用Vibe Coding寫咗個YouTube轉PDF逐字稿嘅Skill,順便反思OpenClaw炒作背後嘅安全問題
呢篇文章係作者分享自己喺週末用一個鐘頭寫咗個實用Skill嘅經歷。作者本身喺度搭建OpenClaw Skills,留意到OpenClaw最近好快出圈,但好少人討論安全性同後續使用成本,覺得盲目推廣對普通用家唔負責任。
作者平時會聽英文播客,想將經典內容整理成排版好嘅PDF逐字稿,但YouTube官方transcript同第三方網站抄出嚟嘅文字都係一嚿嚿冇結構,好難搞。後來見到Zara Zhang嘅Frontend Slides Skill同數字生命卡茲克介紹Claude Code Skill更新,突然諗到可以自己寫一個Skill:輸入YouTube網址,自動生成排版好嘅PDF。
佢直接用Codex Vibe Coding,一個鐘頭就寫好咗,成功將一集播客轉成PDF。之後參考Claude Code文檔完善咗兼容性、測試同結構,放咗上GitHub開源。佢覺得好多嘢睇落複雜,其實只係冇人整好工具;與其等,不如自己動手。
- OpenClaw出圈快但安全性同API成本討論嚴重不足,盲目推廣對普通人好唔負責任,同詐騙冇分別。
- 作者受Zara Zhang嘅Frontend Slides Skill同數字生命卡茲克文章啟發,決定自己寫一個啱用嘅Skill。
- 需求源自想將YouTube播客逐字稿整理成排版好嘅PDF,但現有方法太麻煩。
- 用Codex Vibe Coding花咗1個鐘寫好第一個版本,成功將《How to Build a Cult》轉成PDF,成就感好大。
- 完善後開源,體會到工具一旦存在,好多需求就會變得好簡單;與其等,不如自己寫一個。
YouTube Transcript PDF Skill repo
作者開源嘅Codex Skill,用嚟將YouTube影片轉為排版好嘅PDF逐字稿。
OpenClaw炒作背後嘅安全隱憂
呢兩週OpenClaw以近乎詭異嘅速度出圈,覆蓋面好廣,但關於安全性同後續使用成本嘅討論並冇隨熱度擴散。好多人淨係話Agent好強、可以自動化、開源,好少講Agent權限、API成本先係費用大頭、本地環境安全隔離呢啲實際問題。
兩個助推:Zara嘅Skill同博主文章
需求好簡單:想將英文播客經典內容整理成排版好嘅PDF逐字稿,但YouTube同第三方網站嘅transcript都係一嚿冇結構嘅文字,之前試過一次就放棄咗。
第一個助推係Zara Zhang嘅Frontend Slides Skill,雖然唔可以直接用,但睇佢項目結構時發現佢係修改Claude Code built-in skill嚟嘅,啟發咗自己可以用類似方法。第二個助推係數字生命卡茲克嘅文章提到Claude Code官方Skill Create Skills做咗大更新,令佢諗起Codex入面都有個skill-creator。
一個鐘頭由零整出嚟
諗到「如果讓agent寫一個skill,輸入YouTube URL就自動生成排版好嘅PDF」,即刻動手。大概用咗一個鐘頭就寫好,用佢將Lulu Cheng嗰集《How to Build a Cult》成功轉成排版好嘅PDF。第一次vibe coding整出個對自己真係有用嘅小工具,成就感好大。
- 做咗啲兼容性處理
- 加咗少少測試
- 調整咗結構
去做你喜歡做嘅事,順便整污糟對手
呢週嘅感受:做自己喜歡做嘅事,把手弄髒,好多嘢其實冇想像中咁難。學到嘅嘢包括:Learn in Public、Build in Public,仲有善用Codex嘅skill-creator。
呢個禮拜做咗兩件事:
配置 OpenClaw Skills 用 Codex 自己整咗一個自己用嘅 Skill
結果第二件事意外地比第一件事有意思得多。
第一件事:OpenClaw 到底係邊個喺度炒作啊
個人項目嘅框架整好咗,跟住就係配置 Skills。
畢竟唔似對住聊天視窗亂噏唔使諗費用,呢樣嘢一跑起上嚟,每一次對話、每一次調用工具,都係要燒錢嘅。所以基本嘅安全配置同慳錢配置都係要先搞掂。
呢兩個禮拜 OpenClaw 以一個近乎詭異嘅速度爆紅,覆蓋範圍之廣,真係嚇親人。
但奇怪嘅地方係:
關於 安全性,以及 後續使用成本 嘅討論,並冇隨住傳播嘅熱度一齊擴散開嚟。
好多人只係話:
• Agent 好勁 • 可以自動化 • 開源
但好少人講:
• Agent 嘅權限 • API 嘅後續成本(呢個先係費用大頭!) • 本地環境嘅安全隔離
好難話唔係背後有一股勢力想揾老襯。
個人覺得,盲目推銷對普通人嚟講非常不負責任。
咁同詐騙有咩分別?

第二件事:去做你鍾意做嘅事,搞到對手污糟曬
呢個禮拜 vibe 咗一個自己用嘅 Skill。
都係本着 Learn in Public / Build in Public 嘅心態,寫嘅第一個 Skill。
呢個 Skill 嘅出現,其實係 一個需求 + 兩個助推。
第一個助推:Zara Zhang 嘅 Skill
Zara Zhang 做咗一個 vibe skill,叫 Frontend Slides。
佢做咗一個 Frontend Presentation 嘅小工具,可以將數據或者 pptx 轉成靜態前端頁面嚟展示。
我隨便掟咗兩個數據試咗下,效果還可以。但距離我日常工作嘅需求仲有啲距離。
不過真正有價值嘅地方唔係呢樣嘢可唔可以直接用。
而係我睇佢項目結構嘅時候突然發現:
呢個 Skill 嘅呈現效果其實同 Claude Code built-in 嘅 skill 好相似,只係喺上面做咗一啲修改。
呢個算係第一個助推。
第二個助推:AI博主嘅一篇文章
第二個助推嚟自 up 主 數字生命卡茲克 嘅一篇文章。
佢喺文章裏面講 Claude Code 官方嘅 skill Create Skills 最近做咗一次比較大嘅更新。
睇到呢度嘅時候我突然諗起:
Codex 裏面其實都有一個類似嘅 built-in skill —— skill-creator。
都係一個官方用嚟 創建同更新技能嘅技能。
呢個係第二個助推。
我嘅需求
我平時會聽一啲英文 podcast。
有啲內容非常經典,我會希望將佢整理成逐字稿保存落嚟。
例如 Lulu Cheng 嘅一期 podcast:
《How to Build a Cult》
呢一期講傳播學,資訊密度非常高。
喺接觸到 vibe coding 之前,我其實嘗試過喺網上揾呢期 podcast 嘅逐字稿。
揾到內容唔難。
難的是 排版。
無論係從 YouTube 官方 transcript,定係第三方 transcript 網站複製出嚟嘅全文,基本都係一大嚿冇結構嘅文字。
如果想將佢整理成 閲讀體驗比較好嘅 PDF,其實要花唔少時間。
我試過一次之後就放棄咗呢種粗笨嘅 copy paste 方法。
一個突然出現嘅想法
後來遇到前面兩個助推嘅時候,我腦裏面突然冒出一個想法:
如果叫 agent 寫一個 skill,
輸入一個 YouTube URL,自動生成排版好嘅 PDF 逐字稿。
以後呢啲事咪會變得好簡單?
話做就做
於是就直接動手。
大概用咗一個鐘,呢個 Skill 就寫好咗。
然後我用佢將呢一期 podcast 成功轉咗一份排版好嘅 PDF。
第一次 vibe coding 寫出一個 對自己真係有用嘅小工具,成就感都唔錯㗎。
所以我將呢個 skill 嘅 repo 放咗上 GitHub。
(GitHub地址:https://github.com/SissiMeow/codex-skill-YouTube-Transcript-PDF.git)
算係自己 Build in Public 嘅第一個小作品。
成品自己用落都幾好,比較簡單易讀。

後來又參考 Claude Code 發佈嘅工程化 Skills 文檔,將呢個 Skill 稍微完善咗下:
• 做咗一啲兼容性處理 • 加咗少少測試 • 調整咗下結構
呢個禮拜有一個好直接嘅感受。
好多嘢睇起嚟複雜,其實只係因為冇人將工具整出嚟。
當工具存在之後,好多需求都會突然變得好簡單。
有時都唔使等其他人做。
自己寫一個就得。
做自己鍾意做嘅事,
順便搞到對手污糟啲。
這周幹了兩件事:
配置 OpenClaw Skills 用 Codex 手搓了一個自己用的 Skill
結果第二件事意外地比第一件事有意思得多。
第一件事:OpenClaw 到底是誰在炒作啊
個人項目的框架搭好了,接着就是配置 Skills。
畢竟不像對着聊天窗口嗨聊不用考慮費用,這玩意一旦跑起來,每一次對話、每一次調用工具,都是要燒錢的。所以基本的安全配置和省錢配置還是得先搞上。
這兩週 OpenClaw 以一個近乎詭異的速度出圈,覆蓋面之廣,令人咋舌。
但奇怪的地方在於:
關於 安全性,以及 後續使用成本 的討論,並沒有隨着傳播的熱度一起擴散開來。
很多人只是在說:
• Agent 很強 • 可以自動化 • 開源
但很少有人講:
• Agent的權限 • API 的後續成本 (這個才是費用大頭!) • 本地環境的安全隔離
很難說不是背後有一股勢力想要劃拉W。
個人覺得,盲目推蝦對普通人來說非常不負責任。
這個跟詐騙有什麼區別?

第二件事:去做你喜歡做的事,把手弄髒
這周 vibe 了一個自己用的 Skill。
也是本着 Learn in Public / Build in Public 的心態,寫的第一個 Skill。
這個 Skill 的出現,其實是 一個需求 + 兩個助推。
第一個助推:Zara Zhang 的 Skill
Zara Zhang 做了一個 vibe skill,叫 Frontend Slides。
她做了一個 Frontend Presentation 的小工具,可以把數據或者 pptx 轉成靜態前端頁面來展示。
我隨便甩了兩個數據試用了一下,效果還可以。但距離我日常工作的需求還是有點距離。
不過真正有價值的地方不在於這個東西能不能直接用。
而是我在看她項目結構的時候突然發現:
這個 Skill 的呈現效果其實跟 Claude Code built-in 的 skill 很像,只是在上面做了一些修改。
這個算是第一個助推。
第二個助推:AI博主的一篇文章
第二個助推來自 up 主 數字生命卡茲克 的一篇文章。
他在文章裏講 Claude Code 官方的 skill Create Skills 最近做了一次比較大的更新。
看到這裏的時候我突然想起來:
Codex 裏面其實也有一個類似的 built-in skill —— skill-creator。
也是一個官方用來 創建和更新技能的技能。
這是第二個助推。
我的需求
我平時會聽一些英文播客。
有些內容非常經典,我會希望把它整理成逐字稿保存下來。
比如 Lulu Cheng 的一期播客:
《How to Build a Cult》
這一期講傳播學,信息密度非常高。
在接觸到 vibe coding 之前,我其實嘗試過在網上找這期播客的逐字稿。
找到內容不難。
難的是 排版。
無論是從 YouTube 官方 transcript,還是第三方 transcript 網站複製出來的全文,基本都是一整坨沒有結構的文本。
如果想把它整理成 閲讀體驗比較好的 PDF,其實要花不少時間。
我試過一次之後就放棄了這種粗笨的 copy paste 方法。
一個突然出現的想法
後來遇到前面兩個助推的時候,我腦子裏突然冒出來一個想法:
如果讓 agent 寫一個 skill,
輸入一個 YouTube URL,自動生成排版好的 PDF 逐字稿。
以後這種事情不就會變得非常簡單?
說幹就幹
於是就直接動手。
大概花了一個小時,這個 Skill 就寫好了。
然後我用它把這一期播客成功轉成了一份排版好的 PDF。
第一次 vibe coding 寫出一個 對自己真的有用的小工具,成就感還是很不錯的。
所以我把這個 skill 的 repo 放到了 GitHub。
(GitHub地址:https://github.com/SissiMeow/codex-skill-YouTube-Transcript-PDF.git)
算是自己 Build in Public 的第一個小作品。
成品自己用起來還可以,比較簡單易讀。

後來又參照 Claude Code 發佈的工程化 Skills 文檔,把這個 Skill 稍微完善了一下:
• 做了一些兼容性處理 • 加了一點測試 • 調整了一下結構
這一週有一個挺直接的感受。
很多事情看起來複雜,其實只是因為沒人把工具做出來。
當工具存在之後,很多需求都會突然變得很簡單。
有時候也不用等別人做。
自己寫一個就行。
做自己喜歡做的事,
順便把手弄髒一點。