更新啦！我用 Claude Skills 做的剪輯 Agent!識別效果+交互大升級

作者：AI產品自由

日期：2026年1月28日下午11:10

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

剪輯 Skills 大升級：用 API 取代本地模型，識別更準、界面更直觀，15分鐘搞掂剪口播

整理版摘要

呢篇文章係由成峯分享佢開發嘅剪輯 Skills 嘅重大更新。佢之前推出咗一個用本地模型嘅 AI 剪輯工具，但收到好多用戶反饋話下載 5GB 模型太耐，同埋喺文字稿入面揾口誤好辛苦。所以今次佢做咗全面改版：用火山引擎嘅 API 取代本地模型，重新設計口誤識別系統，仲加咗一個類似剪映嘅可視化審核界面。

整體嚟講，佢嘅結論係：呢個新版本令到剪口播嘅過程快好多、準好多，而且用戶可以自己修改識別規則，仲有自更新機制，越用越懂你嘅表達習慣。成峯強調，呢個工具唔係取代剪映，而係用 AI 幫你慳時間，特別係對於要處理大量口播影片嘅創作者。

文章入面詳細講解咗四個步驟：下載 Skills、配置 API Key、剪口播、加字幕，成個流程 15 分鐘就搞掂。佢仲對比咗剪映嘅識別效果，顯示 Skills 可以捉到剪映漏咗嘅口誤，而且展示效果更好。

核心改進：用火山引擎 API 取代 5GB 本地模型，下載同運作都快好多，唔使等幾個鐘
口誤識別系統重構：逐段分析靜音、重複句、卡頓詞、語氣詞，識別規則透明化，用戶可以直接改文件
新增可視化審核界面：類似剪映剪口播，仲有倍速播放同「複製刪除列表」功能，方便 AI 學習用戶習慣
自更新機制：用戶確認審核結果後，AI 會分析刪除片段，下次剪輯更準確，越用越懂你
使用流程簡單：下載、配 API Key、剪口播、加字幕，15 分鐘完成，全程可視化操作

值得記低

連結 github.com

GitHub 倉庫：videocut-skills

下載剪輯 Skills，存放喺 .claude/skills/ 目錄

筆記

識別規則文件夾

所有識別規則放喺獨立文件夾，用戶可以直接改 md 文件新增或修改規則

整理重點

點解要更新？用戶反饋係最大動力

上一版剪輯 Skills 推出之後，成峯收到好多用戶反饋。最多人反映嘅問題有兩個：第一，要下載 5GB 嘅模型，等成幾十分鐘，好多人都放棄咗；第二，喺文檔入面一行行揾口誤，真係好攰。

今次大改就係針對呢兩個痛點

佢換咗火山引擎嘅音視頻識別模型，同時提升咗交互界面。成峯仲直接對比剪映，用同一段視頻測試，結果係呢個 AI 可以識別出剪映漏咗嘅口誤，而且展示效果更好。

整理重點

三大核心改進，全面升級

更快：API 替代本地模型

以前要下載成 5GB 嘅模型，好多人嫌麻煩。而家直接 call API，下載快，運行都快，因為 API 服務器快過你部電腦好多。

更準：口誤識別系統重構

以前嘅識別比較粗暴，而家成個系統重構咗。模型換咗豆包嘅音視頻字幕，係成峯體驗過最準嘅。AI 會逐段分析：靜音、重複句、卡頓詞、語氣詞……而且所有識別規則都放咗喺獨立文件夾，用戶可以自己改。想加新規則？新建一個 md 文件就得。

更直觀：可視化審核界面

呢個係最大嘅改進。以前 AI 喺命令行出審查稿，你要喺文字入面揾問題。而家啟動剪輯後，會自動開一個審核服務，喺瀏覽器睇到類似剪映剪口播嘅界面。仲額外加咗兩個功能：加速按鈕可以倍速聽片，同埋「複製刪除列表」可以將你確認嘅刪除片段複製俾 AI 學習，呢個就係自更新機制——越用越懂你。

1 加速按鈕：倍速聽完整個視頻，適合講話慢嘅片
2 複製刪除列表：俾 AI 學習你嘅表達習慣，下次剪輯更準確

整理重點

四步搞掂，15 分鐘完成剪輯

第1步：下載 Skills

去 GitHub 下載倉庫，放喺 .claude/skills/ 目錄，直接克隆，唔好創建子文件夾。

第2步：配置 API Key

用火山引擎嘅「音視頻字幕生成」能力，有免費 20 個鐘試用。登錄火山的模型管理開通，獲取 API Key，然後喺 Claude 輸入 /v 選擇 videocut:安裝，輸入 Key 就得。

第3步：剪口播

輸入 /v 選擇 videocut:剪口播，俾個視頻路徑。AI 會自動做三件事：call API 轉錄、啟動審核本地服務、俾條審核界面連結。打開連結，你就可以用 Shift + 拖動揀選片段。四個功能按鈕：播放、倍速播放、複製刪除列表、執行剪輯。

播放：自動跳過已選中片段，同剪映一樣
倍速播放：剪映冇嘅功能，適合慢速視頻
複製刪除列表：將你嘅刪除結果俾 AI 學習
執行剪輯：確認無誤後自動完成

第4步：加字幕

輸入 /v 選擇 videocut:字幕，記得喺詞典文件加入專有名詞，字幕準確率會更高。完成之後就會多一個名稱結尾係 cut 嘅視頻。

整理重點

注意事項同使用貼士

如果你之前試過覺得麻煩，今次可以再試試。成峯話歡迎喺評論區討論。記住要用家習慣使用，先可以發揮自更新機制嘅威力。

識別規則透明化，你可以自由修改

唔使怕 AI 唔準，因為你可以直接改規則文件。呢個係成峯成個設計嘅精髓——唔係黑盒，而係俾你參與。

越用越懂你，自更新機制係關鍵

大家好，我係成峯。

剪輯 Skills 更新咗啦。

上一版出咗之後，收到好多反饋：

最多人問嘅問題有兩個：

下載 5GB 模型要等成幾十分鐘，好多人直接放棄咗
喺文件入面逐行揾口誤，太攰啦

所以今次做咗一次大改：

換咗火山引擎嘅音視頻識別模型，提升咗交互介面。

效果點樣？直接對比剪映：

剪輯 Skills：

剪映：

同樣一段視頻，剪映漏咗嘅口誤，AI 全部識別曬出嚟，而且仲有更好嘅展示效果。

三個核心改進

根據用戶反饋，今次主要更新咗三個方面。

1.更快：API 取代本地模型

上一版要下載 5GB 嘅本地模型，好多人話下載得太慢。

今次直接改用 API 調用。

下載快：唔使等幾個鐘下模型
運行快：API 伺服器比你部電腦快好多

2.更準：口誤識別系統重構

以前嘅口誤識別比較粗疏，而家成個系統重構咗。

模型替換

豆包嘅音視頻字幕，係我用過嚟講識別最準嘅。

（多謝 @極客傑尼提供情報）

AI 語義理解

而家 AI 會逐段分析：

根據規則判斷每一段：靜音、重複句、卡頓詞、語氣詞……

用戶習慣透明化

所有嘅識別規則，都放咗喺一個獨立嘅文件夾度：

你覺得邊條規則唔啱，直接改文件就得。想加新規則，開一個新嘅 md 文件就得。

3.更直觀：可視化審核介面

呢個係最大嘅改進。

以前剪輯完成之後，AI 會喺命令列度輸出一個審查稿。你要喺文字入面揾問題，然後話俾 AI 知要改邊度。

而家啟動剪輯之後，會自動啟動一個審核服務。

打開瀏覽器，你會見到一個類似剪映剪口播嘅介面：

額外加多咗兩個功能：

功能 1：加速按鈕

可以倍速聽曬成條片。

功能 2：複製刪除列表

呢個功能係俾 AI 學習用嘅。

確認審核結果之後，撳「複製刪除列表」，將刪除咗嘅片段資訊複製出嚟，然後話俾 AI 知。AI 就會分析你嘅表達習慣，下次剪輯時就可以更準確咁識別。

呢個就係我一直強調嘅自更新機制 ——越用越明你。

使用方法

過程更加簡單咗，15分鐘搞掂。

第1步：下載 Skills（1分鐘）

幫我下載剪輯 Skills：
- 地址：https://github.com/Ceeon/videocut-skills
- 存放路徑：.claude/skills/（直接克隆到此目錄，不要創建子文件夾）

第2步：配置 API Key（3分鐘）

今次用嘅係火山嘅「音視頻字幕生成」能力。

佢有試用，免費 20 個鐘：

登入火山嘅模型管理，開通「音視頻字幕生成」：

獲取 API Key：

輸入 /v，選擇 videocut:安裝，輸入 API Key，完成配置。

第3步：剪口播（10分鐘）

輸入 /v，選擇 videocut:剪口播，輸入視頻路徑。

AI 會自動：
1.調用 API 轉錄
2.啟動審核本地服務
3.俾一個審核介面嘅連結

打開連結，就可以見到審核介面：

我哋可以喺度檢查 AI 識別得準唔準。

操作方法：Shift + 拖動，揀選或取消揀選片段。

四個功能按鈕：

1.播放 — 同剪映一樣，自動跳過已揀選嘅片段
2.倍速播放 — 剪映冇嘅功能，講嘢慢嘅片可以加速聽
3.複製刪除列表 — 如果差別好大，可以將自己嘅刪除結果複製俾 AI 學習用，佢會學習你嘅習慣
4.執行剪輯 — 確認冇問題之後，撳掣自動完成剪輯

剪輯完成之後，就會多咗一個名尾叫 cut 嘅影片。

第4步：加字幕（3分鐘）

同之前一樣，輸入 /v，選擇 videocut:字幕。

記得喺詞典文件入面加入你嘅專有名詞，字幕準確率會更高。

四步搞掂，全程可視化。

如果你之前試過覺得麻煩，今次可以再試試。

羣討論

歡迎喺評論區話俾我知。

大家好，我是成峯。

剪輯 Skills 更新了。

上一版發出去後，收到很多反饋：

最多的問題是兩個：

下載 5GB 模型要等幾十分鐘，很多人直接放棄了
文檔裏一行行找口誤，太累了

所以這次做了一次大改：

替換了火山引擎的音視頻識別模型，提升了交互界面。

效果怎麼樣？直接對比剪映：

剪輯 Skills：

剪映：

同樣一段視頻，剪映漏掉的口誤，AI全識別出來了，並且也有更好的展示效果。

三個核心改進

根據用戶反饋，這次主要更新了三個方面。

1.更快：API 替代本地模型

上一版需要下載 5GB 的本地模型，很多人反饋下載太慢。

這次直接換成 API 調用。

下載快：不用等幾個小時下模型
運行快：API 服務器比你的電腦快得多

2.更準：口誤識別系統重構

以前的口誤識別比較粗暴，現在整個系統重構了。

模型替換

豆包的音視頻字幕，是我體驗下來識別最準的。

（感謝 @極客傑尼提供情報）

AI語義理解

現在 AI 會逐段分析：

根據規則判斷每一段：靜音、重複句、卡頓詞、語氣詞……

用戶習慣透明化

所有的識別規則，都放在一個獨立的文件夾裏：

你覺得哪條規則不對，直接改文件就行。想加新規則，新建一個 md 文件就行。

3.更直觀：可視化審核界面

這是最大的改進。

以前剪輯完成後，AI 會在命令行裏輸出一個審查稿。你需要在文本里找問題，然後告訴 AI 要改哪裏。

現在啓動剪輯後，會自動啓動一個審核服務。

打開瀏覽器，你能看到一個類似剪映剪口播的界面：

額外多加了兩個功能：

功能 1：加速按鈕

可以倍速聽完整個視頻。

功能 2：複製刪除列表

這個功能是給 AI 學習用的。

確認審核結果後，點擊「複製刪除列表」，把刪除的片段信息複製出來，然後告訴 AI。AI 會分析你的表達習慣，下次剪輯時就能更準確地識別。

這就是我一直強調的自更新機制 —— 越用越懂你。

使用方法

過程更加簡單了，15 分鐘搞定。

第1步：下載 Skills（1分鐘）

幫我下載剪輯 Skills：
- 地址：https://github.com/Ceeon/videocut-skills
- 存放路徑：.claude/skills/（直接克隆到此目錄，不要創建子文件夾）

第2步：配置 API Key（3分鐘）

這次用的是火山的「音視頻字幕生成」能力。

它有試用，免費 20 個小時：

登錄火山的模型管理，開通 “音視頻字幕生成”：

獲取 API Key：

輸入 /v，選擇 videocut:安裝，輸入 API Key，完成配置。

第3步：剪口播（10分鐘）

輸入 /v，選擇 videocut:剪口播，輸入視頻路徑。

AI 會自動：
1.調用 API 轉錄
2.啓動審核本地服務
3.給一個審核界面的連結

打開連結，就能看到審核界面：

我們可以在這裏檢查 AI 識別得準不準。

操作方式：Shift + 拖動，選中或取消選中片段。

四個功能按鈕：

1.播放 — 和剪映一樣，自動跳過已選中的片段
2.倍速播放 — 剪映沒有的功能，說話慢的視頻可以加速聽
3.複製刪除列表 — 如果差別特別大，可以把自己的刪除結果複製給 AI 學習用，它會學習你的習慣
4.執行剪輯 — 確認無誤後，點擊自動完成剪輯

剪輯完成後，它就會多出來一個名稱結尾叫cut的視頻。

第4步：加字幕（3分鐘）

和之前一樣，輸入 /v，選擇 videocut:字幕。

記得在詞典文件里加入你的專有名詞，字幕準確率會更高。

四步搞定，全程可視化。

如果你之前試過覺得麻煩，這次可以再試試。

羣討論

歡迎在評論區告訴我。