自己做了一個 YouTube 視頻摘要 Skill

作者:幻覺大的很
日期:2026年4月21日 上午11:49
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

自己做咗個 YouTube 視頻摘要 Skill,按片類型自訂摘要,仲幫你決定值唔值得睇

整理版摘要

呢篇文章係作者因為訂閲太多 YouTube 頻道,每日新片睇唔曬,所以自己整咗個 YouTube 視頻摘要 Skill。作者試過市面上嘅 Skill,效果一般而且格式一律,滿足唔到佢對唔同類型影片(訪談、教程、Vlog等)嘅摘要需求。

最終佢用 Claude Code 輔助開發咗一個 Skill,流程係:先拉字幕存本地,判斷長短(30分鐘以下整段處理,以上就切10分鐘一段,重疊1分鐘),再按類型用唔同提示詞生成結構化摘要,包括基本信息、一句話總結、關鍵要點、內容時間線、詳細內容同「值得觀看嗎」判斷。

作者已經將呢個 Skill 開源喺 GitHub,用法好簡單,喺支援 Skill 嘅 Agent 度打 /youtube-summarizer 再加連結就得。佢仲用 Lex Fridman 訪問黃仁勳嘅兩個半小時影片示範,結果同佢自己睇完嘅感受一致,特別係「值得觀看嗎」部分幫佢快速篩選有興趣嘅段落。

  • 作者因為 YouTube 訂閲太多,時間有限,想用 AI 篩選值得睇嘅影片,但現有 Skill 唔順手,所以自己整一個。
  • 製作流程:先用 Python 腳本拉字幕,判斷影片長短——短過30分鐘就一次過做摘要,長過就切10分鐘一段(重疊1分鐘)避免話題被切斷。
  • 核心差異:按影片類型(訪談、教程、Vlog、評論等)用唔同提示詞組織摘要,例如訪談按話題列觀點、標爭議點;教程列教學目標同步驟。
  • 啟發:最後嘅「值得觀看嗎」判斷係最關鍵功能,直接畀出要睇或跳過嘅理由,幫讀者快速篩選。
  • 可行動點:Skill 已開源喺 GitHub,安裝後喺任何支援 Skill 嘅 Agent 打 /youtube-summarizer 加上 YouTube 連結就用得,仲可以一次過處理多個連結。
值得記低
連結 github.com

YouTube 影片摘要 Skill 開源倉庫

作者將整嘅 YouTube 摘要 Skill 開源咗喺 GitHub,用法係 /youtube-summarizer + YouTube 連結。

整理重點

點解要自己整呢個 Skill

作者喺 YouTube 訂閲咗好多頻道,包括 PodcastVlog、教程、科普、測評,每日新片睇唔曬。佢想用 AI 幫手篩選,但試過幾個現成嘅 Skill,效果一般,而且 唔同影片類型嘅摘要格式都一樣,唔符合佢嘅需要。

於是作者決定自己整一個,用 Claude Code 輔助開發——佢話「嚴格嚟講係我指揮 Claude Code 整嘅」。

整理重點

對摘要嘅幾點要求

  1. 1 唔同影片類型要有唔同摘要方法,例如訪談、教程、評論,提煉核心內容嘅方式都唔同。
  2. 2 長視頻要切段做摘要,唔可以一口氣做曬。
  3. 3 要知道每個時間段講咩,方便跳去指定片段,例如 15:00-18:00 講 Claude Code 技巧。
  4. 4 最終要話畀我知呢條片值唔值得睇,畀出理由。
整理重點

具體實現流程

首先寫咗個 Python 腳本去 YouTube 拉字幕,以 JSON 形式存喺本地,下次再處理同一條片就直接用本地檔案,唔重複拉。

然後判斷影片長短:少過30分鐘就整段做摘要;大過就切段,每段10分鐘,段與段之間留1分鐘重疊,防止話題俾邊界切斷。

最後做摘要本身:短視頻一把梭,長視頻先逐段摘要、每段保存成獨立文件,再讀所有段摘要合併成最終結構化摘要。摘要嘅提示詞裡面專登叫模型先判斷 影片類型(訪談、教程、Vlog、評論、評測、演講),再根據類型選擇唔同嘅組織方式。

  • 訪談類:按話題列各方觀點、標爭議點同金句。
  • 教程類:列教學目標、前置知識、關鍵步驟。
  • Vlog:按時間線梳理關鍵事件。

最終輸出格式包括:基本信息(影片類型、主題領域、字幕來源、時長)、一句話總結、關鍵要點(5-10條)、內容時間線(長視頻先有,標註每段起止時間同話題)、詳細內容(按類型組織)、值得觀看嗎(畀出要睇或跳過嘅理由)。

整理重點

點樣用同實際效果

呢個 Skill 已經 開源喺 GitHub(https://github.com/huanjuedadehen/skills)。由於場景固定,佢冇設計成 Agent 自動加載,需要顯式調用。用法好簡單:喺任何支援 Skill 嘅 Agent 度打 /youtube-summarizer 再加 YouTube 連結就得,仲可以一次過掉幾個連結入去批量處理,佢會逐個跑完然後報告進度。

作者用 Lex Fridman 訪問黃仁勳(近兩個半小時)做測試。結果出咗摘要,佢用幾分鐘掃一眼就判斷到邊啲段落最感興趣,直接跳到對應時間點睇。Skill 最後結論係「強烈推薦觀看」,並畀出理由,同佢自己睇完嘅感受一致。

作者最後感慨:而家唔再需要先識寫程式先有屬於自己嘅工具,只要知道自己想要咩,再講清楚就夠——呢個就係 VibeCoding 嘅力量。

網上做 YouTube 視頻摘要嘅 Skill 唔少,但係冇一個啱手。啱啱好 Claude Code 喺手,自己整一個都唔算難,所以就鬱手整。嚴格嚟講唔係自己整嘅,係我指揮 Claude Code 整嘅——以後我整嘅幾乎所有嘢都係咁講㗎喇。

點解要自己做一個

我喺 YouTube 訂閲咗好多頻道,有 Podcast、Vlog、教學、科普、評測等等,而家每日更新嘅視頻睇都睇唔曬。畢竟人一日得 24 個鐘,分俾 YouTube 嘅時間好有限,所以想叫 AI 幫我篩一篩先。
初頭試咗幾個現成嘅 Skill,效果一般般,而且無論咩視頻類型,做出嚟嘅摘要格式都一樣,呢樣唔係我想要嘅。
我對視頻摘要嘅要求有幾點:
  • 唔同嘅視頻類型要用唔同嘅摘要方法,例如訪問、教學、評論呢啲,提煉核心內容嘅方法都唔同。
  • 長視頻唔可以一次過做摘要,要分段做。
  • 要知道每個時段嘅視頻講緊乜,方便我跳去指定片段,例如 15:00-18:00 嗰位作者喺度講 Claude Code 嘅使用技巧。
  • 呢條視頻值唔值得睇,要俾理由。

點樣做

流程其實唔複雜。
首先寫咗個 Python 腳本去 YouTube 拉字幕,字幕以 JSON 格式儲存喺本地,下次再處理同一條視頻就直接用本地檔案,唔使重複拉。
跟住要判斷視頻長短。短過 30 分鐘嘅就成段做摘要;長過嘅就分段處理,每段 10 分鐘,段同段之間留 1 分鐘重疊,防止話題喺邊界被切斷。
最後先做摘要本身。短視頻一次過做,長視頻就逐段做摘要、每段儲存做獨立檔案,然後讀曬所有段摘要合併成最終嘅結構化摘要。
摘要嘅提示詞入面專登叫模型先判斷視頻類型(訪問、教學、Vlog、評論、評測、演講),再根據類型揀選唔同嘅組織方式。訪問類就按話題列各方觀點、標記爭議點同金句;教學類就列教學目標、前置知識、關鍵步驟;Vlog 就按時間線梳理關鍵事件。
最終輸出嘅格式大概係咁:
  • 基本資訊(視頻類型、主題領域、字幕來源、時長)
  • 一句話總結
  • 關鍵要點(5-10 條)
  • 內容時間線(長視頻先有,標明每段嘅起止時間同話題)
  • 詳細內容(按視頻類型組織)
  • 值得睇嗎?(俾出要睇或者可以 skip 嘅理由)
最後嗰個「值得睇嗎」係我自己最在意嘅部分,畢竟做呢個 Skill 嘅初衷就係想叫 AI 幫我做篩選。

喺邊度用、點樣用

呢個 Skill 我已經開源咗: https://github.com/huanjuedadehen/skills
由於呢個 Skill 做嘅嘢場景固定,我冇設計成 Agent 自動加載嘅方式,要顯式調用。
用法好簡單,安裝後喺任何支援 Skill 嘅 Agent 入面調用就可以,打 /youtube-summarizer 再貼上 YouTube 連結就得:
/youtube-summarizer https://www.youtube.com/watch?v=xxxxx
亦可以一次過掟幾個連結入去批量處理,佢會逐個執行然後報告進度。
圖片

實際跑一個睇下

前排放 Lex Fridman 同黃仁勳做咗個深度訪問,長達差唔多兩個半鐘。下面係我透過呢個 Skill 得到嘅結果:
圖片
圖片
圖片
兩個半鐘嘅視頻,我用幾分鐘睇一眼摘要就判斷到邊啲段落係我最感興趣嘅,然後直接跳去對應時間點睇。Skill 最後俾出嘅結論係:

強烈推薦觀看。呢次係一次極為深入嘅對話,唔單止覆蓋咗 NVIDIA 嘅技術戰略(極端協同設計、CUDA 決策、硬件預判、供應鏈管理),更難得嘅係 Jensen 毫不保留咁分享咗佢嘅決策哲學、領導力方法、應對壓力嘅方式同人生觀。尤其適合對 AI 基礎設施、半導體行業、企業管理同領導力感興趣嘅觀眾。Jensen 嘅「光速」方法論、「塑造信念體系」嘅領導力實踐、以及對智能同人性嘅區分,都係極具啟發性嘅思考框架。

同我自己睇完之後嘅感受大致一樣。

最後

做呢個 Skill 其實都冇用好長時間,大部分工作就係同 Claude Code 傾需求、睇佢寫出嚟嘅嘢、俾意見叫佢改。真正需要自己鬱手嘅地方好少。
呢個大概就係而家嘅節奏:你唔再需要先識寫 code 先可以有一個屬於自己嘅工具,你只需要知道自己想要乜,然後將呢件事講清楚就夠。
網上做 YouTube 視頻摘要的 Skill 不少,但沒一個用着順手。剛好 Claude Code 在手,自己擼一個也不算難,就動手了。嚴謹點說不是自己擼的,是我指揮 Claude Code 擼的——以後我做的幾乎所有東西估計都得這麼說了。

為什麼要自己做一個

我在 YouTube 上訂閲了很多頻道,Podcast、Vlog、教程、科普、測評各種各樣都有,現在每天更新的視頻都看不過來了。畢竟人一天只有 24 小時,留給 YouTube 的時間很有限,於是就想讓 AI 先幫我篩一道。
剛開始試了幾個現成的 Skill,效果一般般,而且不管什麼視頻類型做出來的摘要形式都一樣,這不是我想要的。
我對視頻摘要有幾點需求:
  • 不同的視頻類型有不同的摘要方法,如訪談類、教程類、評論類,這些提煉核心內容的方法都不一樣。
  • 長視頻不能一口氣做摘要,要切段做。
  • 能知道每個時間段視頻在說什麼,方便我跳到指定片段,比如 15:00-18:00 作者在聊 Claude Code 的使用技巧。
  • 這個視頻值不值得看,給出理由。

怎麼做的

流程其實不復雜。
先寫了個 Python 腳本去 YouTube 拉字幕,字幕以 JSON 形式落盤到本地,下次再處理同一個視頻就直接用本地的,不重複拉。
然後要判斷視頻長短。小於 30 分鐘的就整段做摘要;大於的就切段處理,每段 10 分鐘,段與段之間留 1 分鐘重疊,防止話題在邊界被切斷。
最後才是做摘要本身。短視頻一把梭,長視頻先逐段摘要、每段保存成獨立文件,再讀所有段摘要合併成最終的結構化摘要。
摘要的提示詞裏專門讓模型先判斷視頻類型(訪談、教程、Vlog、評論、評測、演講),再根據類型選擇不同的組織方式。訪談類就按話題列各方觀點、標爭議點和金句;教程類就列教學目標、前置知識、關鍵步驟;Vlog 就按時間線梳理關鍵事件。
最終輸出的格式大致長這樣:
  • 基本信息(視頻類型、主題領域、字幕來源、時長)
  • 一句話總結
  • 關鍵要點(5-10 條)
  • 內容時間線(長視頻才有,標註每段的起止時間和話題)
  • 詳細內容(按視頻類型組織)
  • 值得觀看嗎?(給出要看或可以跳過的理由)
最後那個「值得觀看嗎」是我自己最在意的一塊,畢竟做這個 Skill 的初衷就是想讓 AI 幫我做篩選。

在哪裏用、怎麼用

這個 Skill 我已經開源在: https://github.com/huanjuedadehen/skills
由於這個 Skill 做的事情場景固定,我並沒有設計成 Agent 自動加載的方式,需顯式調用。
用法很簡單,安裝後在你任何支持 Skill 的 Agent 裏調用就可以,敲 /youtube-summarizer 再貼上 YouTube 連結就行:
/youtube-summarizer https://www.youtube.com/watch?v=xxxxx
也可以一次扔好幾個連結進去批量處理,它會挨個跑完然後報告進度。
圖片

實際跑一個看看

前段時間 Lex Fridman 對黃仁勳做了一個深度訪談,長達近兩個半小時。下面就是我通過這個 Skill 得到的結果:
圖片
圖片
圖片
兩個半小時的視頻,我花幾分鐘掃一眼摘要就能判斷出哪些段落是我最感興趣的,然後直接跳到對應時間點去看。Skill 最後給出的結論是:

強烈推薦觀看。這是一次極為深入的對話,不僅覆蓋了 NVIDIA 的技術戰略(極端協同設計、CUDA 決策、硬件預判、供應鏈管理),更難得的是 Jensen 毫不保留地分享了他的決策哲學、領導力方法、應對壓力的方式和人生觀。尤其適合對 AI 基礎設施、半導體行業、企業管理和領導力感興趣的觀眾。Jensen 的"光速"方法論、"塑造信念體系"的領導力實踐、以及對智能與人性的區分,都是極具啓發性的思考框架。

跟我自己看完之後的感受基本一致。

最後

做這個 Skill 其實也沒花多長時間,大部分工作就是跟 Claude Code 聊需求、看它寫出來的東西、提意見讓它改。真正需要自己動手的地方很少。
這大概就是現在的節奏:你不再需要先會寫代碼才能有一個屬於自己的工具,你只要知道自己想要什麼,再把這件事說清楚就夠了。