更新啦!我用 Claude Skills 做的剪輯 Agent!識別效果+交互大升級

作者:AI產品自由
日期:2026年1月28日 下午11:10
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

剪輯 Skills 大升級:用 API 取代本地模型,識別更準、界面更直觀,15分鐘搞掂剪口播

整理版摘要

呢篇文章係由成峯分享佢開發嘅剪輯 Skills 嘅重大更新。佢之前推出咗一個用本地模型嘅 AI 剪輯工具,但收到好多用戶反饋話下載 5GB 模型太耐,同埋喺文字稿入面揾口誤好辛苦。所以今次佢做咗全面改版:用火山引擎嘅 API 取代本地模型,重新設計口誤識別系統,仲加咗一個類似剪映嘅可視化審核界面。

整體嚟講,佢嘅結論係:呢個新版本令到剪口播嘅過程快好多、準好多,而且用戶可以自己修改識別規則,仲有自更新機制,越用越懂你嘅表達習慣。成峯強調,呢個工具唔係取代剪映,而係用 AI 幫你慳時間,特別係對於要處理大量口播影片嘅創作者。

文章入面詳細講解咗四個步驟:下載 Skills、配置 API Key、剪口播、加字幕,成個流程 15 分鐘就搞掂。佢仲對比咗剪映嘅識別效果,顯示 Skills 可以捉到剪映漏咗嘅口誤,而且展示效果更好。

  • 核心改進:用火山引擎 API 取代 5GB 本地模型,下載同運作都快好多,唔使等幾個鐘
  • 口誤識別系統重構:逐段分析靜音、重複句、卡頓詞、語氣詞,識別規則透明化,用戶可以直接改文件
  • 新增可視化審核界面:類似剪映剪口播,仲有倍速播放同「複製刪除列表」功能,方便 AI 學習用戶習慣
  • 自更新機制:用戶確認審核結果後,AI 會分析刪除片段,下次剪輯更準確,越用越懂你
  • 使用流程簡單:下載、配 API Key、剪口播、加字幕,15 分鐘完成,全程可視化操作
值得記低
連結 github.com

GitHub 倉庫:videocut-skills

下載剪輯 Skills,存放喺 .claude/skills/ 目錄

筆記

識別規則文件夾

所有識別規則放喺獨立文件夾,用戶可以直接改 md 文件新增或修改規則

整理重點

點解要更新?用戶反饋係最大動力

上一版剪輯 Skills 推出之後,成峯收到好多用戶反饋。最多人反映嘅問題有兩個:第一,要下載 5GB 嘅模型,等成幾十分鐘,好多人都放棄咗;第二,喺文檔入面一行行揾口誤,真係好攰。

今次大改就係針對呢兩個痛點

佢換咗火山引擎嘅音視頻識別模型,同時提升咗交互界面。成峯仲直接對比剪映,用同一段視頻測試,結果係呢個 AI 可以識別出剪映漏咗嘅口誤,而且展示效果更好。

整理重點

三大核心改進,全面升級

更快API 替代本地模型

以前要下載成 5GB 嘅模型,好多人嫌麻煩。而家直接 call API,下載快,運行都快,因為 API 服務器快過你部電腦好多。

更準:口誤識別系統重構

以前嘅識別比較粗暴,而家成個系統重構咗。模型換咗豆包嘅音視頻字幕,係成峯體驗過最準嘅。AI 會逐段分析:靜音、重複句、卡頓詞、語氣詞……而且所有識別規則都放咗喺獨立文件夾,用戶可以自己改。想加新規則?新建一個 md 文件就得。

更直觀:可視化審核界面

呢個係最大嘅改進。以前 AI 喺命令行出審查稿,你要喺文字入面揾問題。而家啟動剪輯後,會自動開一個審核服務,喺瀏覽器睇到類似剪映剪口播嘅界面。仲額外加咗兩個功能:加速按鈕可以倍速聽片,同埋「複製刪除列表」可以將你確認嘅刪除片段複製俾 AI 學習,呢個就係自更新機制——越用越懂你。

  1. 1 加速按鈕:倍速聽完整個視頻,適合講話慢嘅片
  2. 2 複製刪除列表:俾 AI 學習你嘅表達習慣,下次剪輯更準確
整理重點

四步搞掂,15 分鐘完成剪輯

第1步:下載 Skills

GitHub 下載倉庫,放喺 .claude/skills/ 目錄,直接克隆,唔好創建子文件夾。

第2步:配置 API Key

用火山引擎嘅「音視頻字幕生成」能力,有免費 20 個鐘試用。登錄火山的模型管理開通,獲取 API Key,然後喺 Claude 輸入 /v 選擇 videocut:安裝,輸入 Key 就得。

第3步:剪口播

輸入 /v 選擇 videocut:剪口播,俾個視頻路徑。AI 會自動做三件事:call API 轉錄、啟動審核本地服務、俾條審核界面連結。打開連結,你就可以用 Shift + 拖動揀選片段。四個功能按鈕:播放、倍速播放、複製刪除列表、執行剪輯。

  • 播放:自動跳過已選中片段,同剪映一樣
  • 倍速播放:剪映冇嘅功能,適合慢速視頻
  • 複製刪除列表:將你嘅刪除結果俾 AI 學習
  • 執行剪輯:確認無誤後自動完成

第4步:加字幕

輸入 /v 選擇 videocut:字幕,記得喺詞典文件加入專有名詞,字幕準確率會更高。完成之後就會多一個名稱結尾係 cut 嘅視頻。

整理重點

注意事項同使用貼士

如果你之前試過覺得麻煩,今次可以再試試。成峯話歡迎喺評論區討論。記住要用家習慣使用,先可以發揮自更新機制嘅威力。

識別規則透明化,你可以自由修改

唔使怕 AI 唔準,因為你可以直接改規則文件。呢個係成峯成個設計嘅精髓——唔係黑盒,而係俾你參與。

越用越懂你,自更新機制係關鍵

大家好,我係成峯。

 

剪輯 Skills 更新咗啦。

 

上一版出咗之後,收到好多反饋:

圖片

 

最多人問嘅問題有兩個:

  • 下載 5GB 模型要等成幾十分鐘,好多人直接放棄咗

  • 喺文件入面逐行揾口誤,太攰啦

 

所以今次做咗一次大改:

圖片

 

換咗火山引擎嘅音視頻識別模型,提升咗交互介面。

 

效果點樣?直接對比剪映:

剪輯 Skills:

圖片

 

剪映:

圖片

 

同樣一段視頻,剪映漏咗嘅口誤,AI 全部識別曬出嚟,而且仲有更好嘅展示效果。

三個核心改進

根據用戶反饋,今次主要更新咗三個方面。

1.更快:API 取代本地模型


上一版要下載 5GB 嘅本地模型,好多人話下載得太慢。

今次直接改用 API 調用。


  • 下載快:唔使等幾個鐘下模型

  • 運行快:API 伺服器比你部電腦快好多

2.更準:口誤識別系統重構

以前嘅口誤識別比較粗疏,而家成個系統重構咗。


模型替換

豆包嘅音視頻字幕,係我用過嚟講識別最準嘅。

(多謝 @極客傑尼 提供情報)


AI 語義理解

而家 AI 會逐段分析:

圖片

根據規則判斷每一段:靜音、重複句、卡頓詞、語氣詞……


用戶習慣透明化

所有嘅識別規則,都放咗喺一個獨立嘅文件夾度:

圖片

 

你覺得邊條規則唔啱,直接改文件就得。想加新規則,開一個新嘅 md 文件就得。

3.更直觀:可視化審核介面

呢個係最大嘅改進。

 

以前剪輯完成之後,AI 會喺命令列度輸出一個審查稿。你要喺文字入面揾問題,然後話俾 AI 知要改邊度。

 

而家啟動剪輯之後,會自動啟動一個審核服務。

 

打開瀏覽器,你會見到一個類似剪映剪口播嘅介面:

圖片

 

額外加多咗兩個功能:

 

功能 1:加速按鈕

可以倍速聽曬成條片。

 

功能 2:複製刪除列表

呢個功能係俾 AI 學習用嘅。

 

確認審核結果之後,撳「複製刪除列表」,將刪除咗嘅片段資訊複製出嚟,然後話俾 AI 知。AI 就會分析你嘅表達習慣,下次剪輯時就可以更準確咁識別。

 

呢個就係我一直強調嘅自更新機制 ——越用越明你。

圖片

使用方法

過程更加簡單咗,15分鐘搞掂。

圖片

第1步:下載 Skills(1分鐘)

幫我下載剪輯 Skills:
- 地址:https://github.com/Ceeon/videocut-skills
- 存放路徑:.claude/skills/(直接克隆到此目錄,不要創建子文件夾)

第2步:配置 API Key(3分鐘)

今次用嘅係火山嘅「音視頻字幕生成」能力。

 

佢有試用,免費 20 個鐘:

圖片

 

登入火山嘅模型管理,開通「音視頻字幕生成」:

圖片

 

獲取 API Key:

圖片

 

輸入 /v,選擇 videocut:安裝,輸入 API Key,完成配置。

圖片

第3步:剪口播(10分鐘)

輸入 /v,選擇 videocut:剪口播,輸入視頻路徑。

圖片

 

AI 會自動:
1.調用 API 轉錄
2.啟動審核本地服務
3.俾一個審核介面嘅連結

圖片

 

打開連結,就可以見到審核介面:

圖片

 

我哋可以喺度檢查 AI 識別得準唔準。

 

操作方法:Shift + 拖動,揀選或取消揀選片段。

 

四個功能按鈕

1.播放 — 同剪映一樣,自動跳過已揀選嘅片段
2.倍速播放 — 剪映冇嘅功能,講嘢慢嘅片可以加速聽
3.複製刪除列表 — 如果差別好大,可以將自己嘅刪除結果複製俾 AI 學習用,佢會學習你嘅習慣
4.執行剪輯 — 確認冇問題之後,撳掣自動完成剪輯

 

剪輯完成之後,就會多咗一個名尾叫 cut 嘅影片。

圖片

第4步:加字幕(3分鐘)

同之前一樣,輸入 /v,選擇 videocut:字幕

圖片

 

記得喺詞典文件入面加入你嘅專有名詞,字幕準確率會更高。

圖片

 

四步搞掂,全程可視化。

 

如果你之前試過覺得麻煩,今次可以再試試。

 

羣討論

圖片

歡迎喺評論區話俾我知。

大家好,我是成峯。

 

剪輯 Skills 更新了。

 

上一版發出去後,收到很多反饋:

圖片

 

最多的問題是兩個:

  • 下載 5GB 模型要等幾十分鐘,很多人直接放棄了

  • 文檔裏一行行找口誤,太累了

 

所以這次做了一次大改:

圖片

 

替換了火山引擎的音視頻識別模型,提升了交互界面。

 

效果怎麼樣?直接對比剪映:

剪輯 Skills:

圖片

 

剪映:

圖片

 

同樣一段視頻,剪映漏掉的口誤,AI全識別出來了,並且也有更好的展示效果。

三個核心改進

根據用戶反饋,這次主要更新了三個方面。

1.更快:API 替代本地模型


上一版需要下載 5GB 的本地模型,很多人反饋下載太慢。

這次直接換成 API 調用。


  • 下載快:不用等幾個小時下模型

  • 運行快:API 服務器比你的電腦快得多

2.更準:口誤識別系統重構

以前的口誤識別比較粗暴,現在整個系統重構了。


模型替換

豆包的音視頻字幕,是我體驗下來識別最準的。

(感謝 @極客傑尼 提供情報)


AI語義理解

現在 AI 會逐段分析:

圖片

根據規則判斷每一段:靜音、重複句、卡頓詞、語氣詞……


用戶習慣透明化

所有的識別規則,都放在一個獨立的文件夾裏:

圖片

 

你覺得哪條規則不對,直接改文件就行。想加新規則,新建一個 md 文件就行。

3.更直觀:可視化審核界面

這是最大的改進。

 

以前剪輯完成後,AI 會在命令行裏輸出一個審查稿。你需要在文本里找問題,然後告訴 AI 要改哪裏。

 

現在啓動剪輯後,會自動啓動一個審核服務。

 

打開瀏覽器,你能看到一個類似剪映剪口播的界面:

圖片

 

額外多加了兩個功能:

 

功能 1:加速按鈕

可以倍速聽完整個視頻。

 

功能 2:複製刪除列表

這個功能是給 AI 學習用的。

 

確認審核結果後,點擊「複製刪除列表」,把刪除的片段信息複製出來,然後告訴 AI。AI 會分析你的表達習慣,下次剪輯時就能更準確地識別。

 

這就是我一直強調的自更新機制 —— 越用越懂你。

圖片

使用方法

過程更加簡單了,15 分鐘搞定。

圖片

第1步:下載 Skills(1分鐘)

幫我下載剪輯 Skills:
- 地址:https://github.com/Ceeon/videocut-skills
- 存放路徑:.claude/skills/(直接克隆到此目錄,不要創建子文件夾)

第2步:配置 API Key(3分鐘)

這次用的是火山的「音視頻字幕生成」能力。

 

它有試用,免費 20 個小時:

圖片

 

登錄火山的模型管理,開通 “音視頻字幕生成”:

圖片

 

獲取 API Key:

圖片

 

輸入 /v,選擇 videocut:安裝,輸入 API Key,完成配置。

圖片

第3步:剪口播(10分鐘)

輸入 /v,選擇 videocut:剪口播,輸入視頻路徑。

圖片

 

AI 會自動:
1.調用 API 轉錄
2.啓動審核本地服務
3.給一個審核界面的連結

圖片

 

打開連結,就能看到審核界面:

圖片

 

我們可以在這裏檢查 AI 識別得準不準。

 

操作方式:Shift + 拖動,選中或取消選中片段。

 

四個功能按鈕

1.播放 — 和剪映一樣,自動跳過已選中的片段
2.倍速播放 — 剪映沒有的功能,說話慢的視頻可以加速聽
3.複製刪除列表 — 如果差別特別大,可以把自己的刪除結果複製給 AI 學習用,它會學習你的習慣
4.執行剪輯 — 確認無誤後,點擊自動完成剪輯

 

剪輯完成後,它就會多出來一個名稱結尾叫cut的視頻。

圖片

第4步:加字幕(3分鐘)

和之前一樣,輸入 /v,選擇 videocut:字幕

圖片

 

記得在詞典文件里加入你的專有名詞,字幕準確率會更高。

圖片

 

四步搞定,全程可視化。

 

如果你之前試過覺得麻煩,這次可以再試試。

 

羣討論

圖片

歡迎在評論區告訴我。