英語單詞學習skill開源啦~

作者:Draco正在VibeCoding
日期:2026年4月15日 下午1:42
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

開源咗一個英語單詞學習嘅影片生成 Skill,成本低又易用

整理版摘要

呢篇文章係作者分享佢點樣用 Hermes Agent 同埋火山引擎豆包 TTS 2.0,整咗一個自動化生成英語單詞學習短片嘅 Skill。佢想解決嘅問題係:點樣快速、低成本咁整到高質素嘅單詞教學影片,而唔使逐條片手動剪接。整體結論係呢個 Skill 已經開源,直接用 GitHub 倉庫連結俾任何 Agent(Hermes、龍蝦、Claude Code 等)安裝,之後俾個單詞就識得自動生成影片,成本平均每條片只係幾毫子,其餘只係用 CPU 同 RAM。

作者特別提到基於 Remotion 框架,所以生成短片本身唔似即夢或可靈咁消耗 token,淨係文案同 TTS 先有成本。佢仲公開咗架構圖(用 Hermes Agent 內置嘅 Architecture-Diagram Skill 生成),顯示個 pipeline 係 modular,會自然生長新嘅 template。最後佢順便分享咗試用 KIMI 新模型 K2.6-code-preview 嘅感受,覺得體感好接近 GPT-5.4,而且因為講話簡潔,有時仲更順手。

  • 開源咗一個英語單詞學習影片生成 Skill,直接餵 GitHub 連結俾 Agent 就裝得,成本低至幾毫子一條片。
  • 基於 Remotion 框架,生成影片唔消耗 token,只有文案同 TTS 先要俾錢,其餘食本地資源。
  • 做法係將單詞輸入 Agent,Agent 會自動安裝 Skill 並調用火山引擎豆包 TTS 2.0 生成影片,全程自動化。
  • 同其他影片生成平台相比,呢個方案自訂性高、成本可控,而且 Skill 會自然擴充新 template。
  • 你可以即刻試用:俾個單詞畀你嘅 Agent,等佢生成第一條影片;同時可以關注 KIMI K2.6-code-preview,體驗接近 GPT-5.4 但更簡潔。
值得記低
Skill github.com

vocabulary-video-pipeline

一個用 Remotion 同火山引擎豆包 TTS 2.0 整嘅 Skill,可以自動生成英語單詞學習短片,將 GitHub 倉庫連結餵畀 Agent 即可安裝使用。

整理重點

開源動機同背景

作者今日喺飛書上用 Hermes Agent 折騰咗成日,終於決定將之前凌晨文章入面演示嘅英語單詞學習短片生成 Skill 開源。佢想解決嘅問題好實際:點樣可以快速、自動化咁生成高質素嘅單詞教學影片,而唔使逐條片手動搞。

呢個 Skill 叫 vocabulary-video-pipeline,而家已經放上 GitHub

作者話直接將 GitHub 倉庫連結餵畀你嘅 Agent,無論係 Hermes、龍蝦、Claude CodeCodex,都可以自動安裝。只要裝好火山引擎豆包 TTS 2.0 嘅密鑰同令牌,跟住俾一個單詞,Agent 就會自動生成一條完整嘅學習影片。

整理重點

技術架構同成本分析

呢個影片生成係基於 Remotion 框架嘅,所以生成影片本身唔會消耗任何 token,唔似即夢或可靈咁要逐秒計錢。成本主要係用喺兩部分:寫文案腳本嗰陣調用大模型,同埋用 TTS 把文字轉語音。

平均一條片嘅成本只係小几毫子,其他都只係食你部機嘅 CPU 同內存

作者仲公開咗架構圖,係用 Hermes Agent 新集成嘅 Architecture-Diagram Skill 整嘅。佢強調個 pipeline 會自然生長新嘅 template,唔侷限於目前示範嘅款,不過效果仲測試緊。

整理重點

點樣用?一步到位

  1. 1 複製 GitHub 倉庫連結:https://github.com/dracohu2025-cloud/draco-skills-collection/tree/main/vocabulary-video-pipeline
  2. 2 將連結餵畀你嘅 Agent(Hermes、龍蝦、Claude CodeCodexOpenCode 都得),等佢自動安裝。
  3. 3 喺 Agent 入面設定好火山引擎豆包 TTS 2.0 嘅密鑰同令牌。
  4. 4 直接輸入一個英文單詞,叫 Agent 生成影片。佢會自動幫你寫文案、轉語音、合成影片。
  5. 5 等幾分鐘,一條幾毫子成本嘅單詞學習片就出爐啦。

安裝方法勁簡單:只要餵個 GitHub 連結俾 Agent 就得

整理重點

順便一提:KIMI K2.6-code-preview 體驗

作者話 KIMI 琴日低調上線咗 K2.6-code-preview,佢今日全程用 Hermes Agent 加呢個模型去開發同優化 Skill。整體體感唔錯,上下文本長 262k 雖然成日要 compaction,但使用體驗已經好接近 GPT-5.4

K2.6 講嘢比較簡潔,而 GPT-5.4 係個碎嘴子,溝通耐咗反而覺得 K2.6 體驗更佳

作者反問讀者:你哋用咗 K2.6 未?感受如何?歡迎留言交流。

整理重點

快啲試下同畀意見

作者感謝琴日喺評論區留建議嘅朋友,話會喺後續版本繼續迭代。佢鼓勵大家快啲去 GitHub 畀個 Star,順便用自己嘅 Agent 試生成第一條片。

成品示範可以睇文章入面嘅連結,邏輯上 Skill 會自然生長新 template

今天又喺飛書上面同Hermes Agent搞咗一輪成日,將噚日凌晨篇文章入面演示嘅英文生字學習短片生成技能開源咗啦!
圖片

Github倉庫:https://github.com/dracohu2025-cloud/draco-skills-collection/tree/main/vocabulary-video-pipeline

歡迎喺Github畀個Star🌟 ~ 

點樣用?

直接將上面個Github倉庫連結餵畀你個Agent(Hermes、龍蝦、Claude Code、Codex、OpenCode都得),等佢安裝好之後(需要火山引擎豆包TTS2.0嘅密鑰同令牌),直接畀一個生字,叫佢生成短片就得

條片係用Remotion框架整嘅,所以生成短片本身唔似即夢/可靈咁要消耗token(當然,整文案腳本同叫TTS係要俾錢嘅,平均一條片大概成本係幾毫子,其他淨係食CPU同RAM)。

完成品例子如下(理論上呢個技能會自然長出新的template,唔止得下面呢啲template;效果仲喺度測試緊)


架構圖如下(用咗Hermes Agent今日啱啱集成嘅Architecture-Diagram呢個技能,幾好咁):

圖片

多謝噚日喺留言區畀建議嘅朋友,我會喺之後嘅版本繼續改進~ 




P.S.


KIMI噚日低調咗上線咗K2.6-code-preview:

圖片

為咗深入體驗同測試,今日成日都係用Hermes Agent + K2.6-code-preview搞呢個技能嘅創建同優化,目前感覺良好,除咗上下文長度262k成日要compaction之外,使用體驗已經好接近GPT-5.4(其實,因為K2.6講嘢比較簡潔,而GPT-5.4係個長氣袋,傾耐咗,有時反而覺得K2.6體驗更好...)。


你哋用咗K2.6未?感覺點?歡迎喺留言區傾嚇~~ 

圖片


今天又在飛書上跟Hermes Agent折騰了一天,把昨天凌晨文章中演示的英語單詞學習短視頻生成的skill開源啦!
圖片

Github倉庫:https://github.com/dracohu2025-cloud/draco-skills-collection/tree/main/vocabulary-video-pipeline

歡迎在Github上給Star🌟 ~ 

如何使用?

直接把上面的Github倉庫連結餵給你的Agent(Hermes、龍蝦、Claude Code、Codex、OpenCode都可以),讓它安裝好之後(需要火山引擎豆包TTS2.0的密鑰和令牌),直接給出一個單詞,讓它生成視頻即可

視頻基於Remotion框架,因此生成視頻本身無須像即夢/可靈那樣消耗token(當然,生成文案腳本和調用TTS是有費用的,平均一條視頻大概小几毛錢的成本,其他都只吃CPU和內存)。

成品示例如下(邏輯上skill會自然生長新的template,而並不限於以下的templates;效果還在測試中)


架構圖如下(用了Hermes Agent今天剛集成進來的Architecture-Diagram這個skill,看着不錯):

圖片

感謝昨天在評論區留下建議的朋友們,我會在後續的版本中繼續迭代~ 




P.S.


KIMI昨天剛低調上線了K2.6-code-preview:

圖片

為了深度體驗和測試,今天全程都是使用Hermes Agent + K2.6-code-preview完成該skill的創建和優化,目前體感良好,除了上下文長度262k經常會遇到compaction之外,使用體驗已經非常接近GPT-5.4了(其實,由於K2.6說話比較簡潔,而GPT-5.4是個碎嘴子,溝通時間長了,某些時刻反而覺得K2.6體驗更佳...)。


你們用K2.6了麼?感受如何?歡迎在評論區留言交流~~ 

圖片