電腦裏吃灰的視頻,我用 Codex 變成了學習資料!

作者:大瑜聊AI
日期:2026年6月15日 下午9:01
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Codex 將電腦中無用的視頻變成可搜索、可跳轉的學習資料,步驟清晰,普通人也能上手。

整理版摘要

呢篇文章由大瑜分享,佢想解答一個常見問題:Codex到底可以幫普通人做啲乜?佢用一個實例展示:將電腦入面擺咗好耐嘅視頻、錄音、課程回放,變成可搜索、可總結、可跳轉嘅學習資料。作者強調Codex唔係程序員專屬,普通人一樣可以用佢解決真實問題。

作者詳細講解咗成個流程,包括準備目錄、揾視頻、抽音頻、用Whisper模型轉文字、校對錯別字、生成字幕同總結,最後做一個本地播放網頁,可以點擊字幕跳轉到對應時間。佢建議用Whisper small模型,因為快,錯別字可以後續校對。

成個過程嘅關鍵係善用Codex嘅指令,將複雜步驟拆解成一個個小任務。作者最後鼓勵讀者將呢啲步驟整理成一個提示詞,下次就可以一鍵搞定。整體嚟講,呢篇文章提供咗一個實用嘅工作流,適合任何想整理本地視頻資源嘅人。

  • Codex可以幫普通人將電腦入面嘅視頻變成有結構嘅學習資料,唔需要寫程式。
  • 成個流程包括抽音頻、轉文字、校對、生成字幕同製作播放網頁,每個步驟都可以用Codex嘅指令完成。
  • Whisper small模型速度快但錯別字多,可以透過後續校對改善,唔需要用large模型拖慢速度。
  • 啟發在於Codex嘅應用範圍好廣,唔侷限於寫code,仲可以處理多媒體內容。
  • 可行動點:將呢啲步驟整理成一個提示詞,下次直接用,節省時間。
整理重點

準備工夫:建立目錄同揾視頻

首先,要建立一個案例目錄,放曬所有相關檔案。用Codex App打開指定文件夾,然後叫佢新建四個目錄。

  • videos/ — 原始視頻
  • audio/ — 抽出嘅音頻
  • output/ — 文字稿、字幕、總結
  • web/ — 播放網頁

建議勾選「完全訪問」權限

揾視頻嘅時候,直接叫Codex幫手:畀佢關鍵字,佢就會列出所有符合條件嘅檔案,包括路徑、格式、大小同修改時間。

整理重點

提取音頻同轉寫文字

Whisper模型將音頻轉成文字。Whisper有三個版本:small、middle、large。

  • small — 消耗資源少,轉換快,但錯別字多
  • middle — 唔建議用,太慢
  • large — 唔建議用,太慢

small等級消耗電腦資源少,轉換快,但錯別字多

先叫Codex檢查有冇安裝模型,冇就幫手安裝。然後直接叫佢轉寫第一版文字,唔使追求完美。

整理重點

校對錯別字同生成字幕

原始稿會有錯,要叫Codex校對。指令要清楚:只校對錯別字、標點、斷句,唔好改意思。

只校對,唔改意思

唔確定嘅詞用【疑似:】標註

校對完就可以生成字幕同總結。字幕方便睇片,總結方便全局瞭解內容。

  • 字幕:用嚟對住視頻睇,可以快速定位
  • 總結:用嚟快速掌握成篇文章要點
整理重點

製作本地播放網頁

Codex做一個本地視頻播放網頁,放喺web/目錄。要求左邊播放視頻,右邊顯示字幕列表,點擊字幕跳到對應時間,仲要有搜尋框。

點擊字幕跳到對應時間

字幕搜索框

最後作者提提你:呢啲步驟可以整理成一個提示詞,下次直接用,一鍵搞定。

好多人問大瑜,codex到底幫到普通人啲咩?

我嘅答案好簡單:就當佢係你嘅小助手。

例如今日分享嘅呢個案例:

將電腦裏面擺咗好耐嘅視頻、錄音、課程回放,變成可以搜、可以總結、可以跳轉嘅學習資料。

呢一節會做5件事:揾視頻、抽音頻、轉文字、做字幕總結、生成視頻播放網頁。

圖片

最終嘅效果如下:

圖片

以下就話俾大家知,我係點樣一步一步用codex將封塵嘅視頻轉化成一個視頻播放地址,仲提煉咗主要內容。

一、準備目錄

首先,起咗個案例目錄出嚟。後面所有檔案都放喺呢度,咁樣安排網站都方便啲。

圖片
  1. 用Codex App打開codex-camp資料夾,然後叫codex幫手開呢四個目錄。
新建下面四個目錄。 
  videos/  原始視頻
  audio/   抽出的音頻
  output/  文字稿、字幕、總結
  web/     播放網頁
圖片

呢度我建議大家揀「完全訪問」權限,咁就建立好曬。

圖片

二、揾到視頻

揾唔到視頻嗰陣,先叫Codex幫你查。

請幫我找到文件名或路徑裏包含“XX”的視頻。
只查找,不修改文件。
列出路徑、格式、大小、修改時間。
圖片

係咪幫你揾到清清楚楚、明明白白!確認咗視頻之後,複製過去videos資料夾。

三、抽出音頻,準備用Whisper small呢個模型處理。

先抽咗音頻出嚟,然後複製俾Codex:

請把 /Users/xxx/Documents/TencentMeeting/ 74663/meeting_01.mp4 文件夾裏的視頻抽出音頻。
保存到 01-audio-transcript/audio/。
不要刪除原視頻。
圖片

介紹嚇whisper呢個模型,係openai嘅本地語音轉文字模型,分做small、middle、large三個版本。

當然,small級別消耗電腦資源少,轉換快,不過錯別字多。但係冇緊要,我哋下一輪再叫模型自己改一次。

middle同large個人建議唔好用,慢到死。

複製俾Codex:檢查電腦有冇裝到個模型,冇就幫手裝。

圖片

四、生成原始文字稿

先轉出第一版文字,我哋唔使追求完美。就咁同codex對話就得㗎啦!

圖片

五、改錯別字

原始稿會有錯。呢度只係校對,唔會改意思。

複製俾Codex:

請讀取 output/原始轉寫稿.md。
只修錯別字、標點、斷句和明顯識別錯誤。
保留時間戳。
不確定的詞用【疑似:】標註。
保存為 output/校對版轉寫稿.md。
圖片

當然,如果發現錯別字多嘅話,我哋可以叫佢根據上文下理去改。最終出嚟嘅結果就會好完美。

六、生成字幕同總結

字幕用嚟睇視頻方便;總結用嚟宏觀睇成篇文章。

圖片

七、整個播放網頁

當然,我哋想整個本地播放嘅內容,撳一下字幕,就可以快速跳去對應嘅位置,方便我哋高效學習。

請做一個本地視頻播放網頁,放到 01-audio-transcript/web/。
左側播放視頻。
右側顯示字幕列表。
點擊字幕跳到對應時間。
加一個字幕搜索框。
請告訴我如何打開這個網頁。
如果需要本地服務,請給出訪問地址。

竟然搞掂咗!

圖片

tips:寫得咁詳細,係為咗將步驟示範俾大家睇,你都可以整理成一個提示詞就搞掂。

寫喺最後嘅話

今日呢篇,就係大瑜訓練營嘅一個案例。我寫得比較詳細,只係想話俾大家知:

codex唔係程序員專屬,普通人都可以用佢嚟解決真實問題。

如果你都想對codex有一個全面嘅瞭解,歡迎加入大瑜嘅訓練營。後日正式開始。

圖片
歷史文章:
Claude Code好勁,但點解我更建議普通人先學CodeX?
點解我而家好少提OpenClaw?
我做產品成日用嘅6個AI Skill,10分鐘整出一個Demo!

很多人問大瑜,codex到底能幫助普通人做什麼?

我的答案很簡單:讓他作為你的小助手。

譬如今天分享的這個案例:

把電腦裏的落灰的視頻、錄音、課程回放,變成可搜索、可總結、可跳轉的學習資料。

這一節會做 5 件事:找視頻、抽音頻、轉文字、做字幕總結、生成視頻播放網頁。

圖片

最終的效果如下:

圖片

下面就告訴大家,我是怎麼一步一步用codex 將落灰的視頻轉化為一個視頻播放地址,並提煉主要內容。

一、準備目錄

首先,先建案例目錄。後面所有文件都放這裏,也便於我們去安排網站。

圖片
  1. 用 Codex App 打開 codex-camp 文件夾,然後讓codex 給新建這四個目錄。
新建下面四個目錄。 
  videos/  原始視頻
  audio/   抽出的音頻
  output/  文字稿、字幕、總結
  web/     播放網頁
圖片

這裏我建議大家勾選“完全訪問”權限,這個時候就創建好了。

圖片

二、找到視頻

找不到視頻時,先讓 Codex 幫你查。

請幫我找到文件名或路徑裏包含“XX”的視頻。
只查找,不修改文件。
列出路徑、格式、大小、修改時間。
圖片

是不是給你找的清清楚楚,明明白白!確認視頻後,複製到 videos 文件夾。

三、抽出音頻,準備 Whisper small這個模型處理。

先提取音頻,複製給 Codex:

請把 /Users/xxx/Documents/TencentMeeting/ 74663/meeting_01.mp4 文件夾裏的視頻抽出音頻。
保存到 01-audio-transcript/audio/。
不要刪除原視頻。
圖片

介紹下whisper的這個模型,是openai的本地語音轉文字的模型,分為small、middle、large三個版本。

當然,small等級消耗電腦的資源少,轉換快,但是錯別字多。不過沒關係,我們下一輪再讓模型自己修改一次。

middle和large個人建議不要使用,賊慢。

複製給 Codex:檢查電腦是否安裝模型,沒有安裝就幫忙安裝。

圖片

四、生成原始文字稿

先轉出第一版文字,我們不追求完美。直接這樣與codex對話即可!

圖片

五、修錯別字

原始稿會有錯。這裏只校對,不改意思。

複製給 Codex:

請讀取 output/原始轉寫稿.md。
只修錯別字、標點、斷句和明顯識別錯誤。
保留時間戳。
不確定的詞用【疑似:】標註。
保存為 output/校對版轉寫稿.md。
圖片

當然,如果發現錯別字多的話 ,我麼可以讓他結合上下文去修改。最終呈現出完美的結果。

六、生成字幕和總結

字幕用來看視頻方便;總結用來全局看文章的。

圖片

七、 做播放網頁

當然,我們想做一個本地播放的內容,點擊字幕,可以快速跳轉到對應的位置,便於我們高效學習。

請做一個本地視頻播放網頁,放到 01-audio-transcript/web/。
左側播放視頻。
右側顯示字幕列表。
點擊字幕跳到對應時間。
加一個字幕搜索框。
請告訴我如何打開這個網頁。
如果需要本地服務,請給出訪問地址。

竟然成了!

圖片

tips:寫得這麼詳細,是為了把步驟演示給大家,你也可以整理成一個提示詞就能搞定。

寫在最後的話

今天這篇,也就是大瑜訓練營的一個案例。我寫的比較詳細,只是想告訴大家:

codex不是程序員專屬,普通人也可以用它來解決真實的問題。

如果你也想對codex有一個全面的瞭解,歡迎加入大瑜的訓練營。後天正式開啓。

圖片
歷史文章:
Claude Code 很強,但為什麼我更建議普通人先學 CodeX?
為什麼我現在很少提 OpenClaw 了?
我做產品常用的 6 個 AI Skill,10 分鐘做出一個 Demo!