Knowledge Base

閱讀站

首頁而家只顯示最近 50 篇文章,避免文章量愈大愈拖慢首頁載入。

共 2259 篇文章
完成

Claude Code 28 個命令合集,按分類整理好了!(保姆級教程)

Claude Code 28個命令分類整理,掌握佢哋提升開發效率

完成

Codex重大更新:goal正式上線,五大升級,體驗感拉滿

Codex 推出五大升級,Appshots 同 /goal 穩定版最實用,開發協作體驗全面提升

完成

設計 SKILL:提取網站規範 DESIGN md 和 HTML 預覽

rico-design-md:一個將網站自動轉成設計系統文檔同HTML預覽嘅SKILL,幫你結構化提取顏色、排版、組件等設計資產。

完成

OpenAI 官方這篇 Codex 攻略,把最重要的一段藏在了最後

Codex 最值得吸收嘅核心:外部記憶(vault)比模型能力更重要

完成

多 Agent 真正缺的,往往不是更多 Agent

多Agent嘅價值,唔係開多幾個模型,而係拆得清任務、溝通有協議、工作區夠隔離

完成

Codex 新功能 Appshots:把當前窗口直接發給 AI

Codex新功能Appshots:雙擊Command鍵,直接將當前Mac窗口發畀AI,大幅減少描述成本

完成

讓 OpenCode 藉助 Playwright CLI 操作當前 Chrome 頁面

最近我嘗試了一種比較輕量的瀏覽器自動化方式:不寫完整的 Playwright 腳本,也不額外配置 MCP,而是讓 OpenCode 通過終端調用 Playwright CLI,直接讀取當前已經打開的 Chrome 頁面。這個方式適合下面幾類場景:想讓 AI 分析當前網頁結構;想讓 AI 根據當前頁面生成自動化操作建議;想複用自己 Chrome 裏的登錄態,比如 B 站、後台系統、管理平台;不想每次都新開一個乾淨瀏覽器;不想上來就配置 MCP,只想先用 CLI 跑通。整體流程是:Chrome 當前頁面 ↓開啓遠程調試 ↓playwright-cli attach ↓playwright-cli snapshot ↓opencode 讀取命令輸出並分析頁面一、安裝 Playwright CLIPlaywright 是微軟維護的瀏覽器自動化工具,支持 Chromium、Firefox 和 WebKit,可以用於測試、腳本和 AI Agent 工作流。官方也提供了 CLI 和相關自動化能力。(Playwright[1])如果本機還沒有 Node.js,需要先安裝 Node.js。安裝完成後,確認命令可用:node -vnpm -v然後安裝 Playwright 相關依賴:npm i -D @playwright/testnpx playwright install如果你使用的是某個獨立的 playwright-cli 工具,確認它是否已經可用:playwright-cli --help如果命令不存在,可以先檢查當前項目或全局環境中到底安裝的是哪個 CLI。有些環境裏是:npx playwright --help有些環境裏才是:playwright-cli --help這一步的目標很簡單:確保終端裏可以執行 Playwright 相關命令,並且 opencode 也能調用這些命令。二、在 Chrome 中開啓當前瀏覽器實例的遠程調試新版 Chrome 可以直接給當前瀏覽器實例開啓遠程調試。在 Chrome 地址欄打開:chrome://inspect/#remote-debugging找到:Allow remote debugging for this browser instance勾選它。開啓後需要重啓Chrome瀏覽器。這個選項的含義是:允許外部工具請求控制當前 Chrome 瀏覽器,包括讀取頁面、Cookie、站點數據,以及導航到其他 URL。因此只建議在可信環境裏臨時開啓,用完之後可以關掉。如果開啓成功,後續工具就有機會連接你當前已經打開的 Chrome 頁面。三、測試 playwright-cli 是否能連接當前 ChromeChrome 設置好以後,在終端執行:playwright-cli attach --cdp=chrome如果你使用的是 Edge,則可能是:playwright-cli attach --cdp=edge連接成功後,可以讀取當前頁面快照:playwright-cli snapshotsnapshot 不是普通截圖,而是頁面的可訪問性結構。它通常會包含:頁面標題;按鈕;連結;輸入框;可點擊元素;元素的可訪問性名稱。這比普通截圖更適合 AI 分析,因為 AI 可以直接看到頁面結構,而不是隻看圖片。如果想保存輸出,方便讓 opencode 分析,可以執行:playwright-cli snapshot > page_snapshot.txt如果想保存截圖,可以執行:playwright-cli screenshot --filename=page.png也可以讀取當前頁面標題或 URL:playwright-cli evaluate "document.title"playwright-cli evaluate "location.href"四、讓 opencode 使用 playwright-cliopencode 是一個可以在本地終端運行的 AI coding agent。官方文檔中也提供了通過安裝腳本或 npm 安裝的方式,例如:(Z.AI[2])curl -fsSL https://opencode.ai/install | bash或者:npm install -g opencode-ai安裝完成後,在項目目錄中啓動:opencode可以直接把下面這段話發給 opencode:分析我當前已經打開的 Chrome 頁面。五、常見問題1. playwright-cli attach --cdp=chrome 失敗怎麼辦?先確認 Chrome 已經開啓:chrome://inspect/#remote-debugging並勾選:Allow remote debugging for this browser instance然後重新執行:playwright-cli attach --cdp=chrome如果仍然失敗,可以讓 opencode 不要繞路,而是先執行:playwright-cli --help確認當前安裝的 CLI 是否真的支持 attach 和 --cdp=chrome。2. 為什麼 http://127.0.0.1:9222/json/version 打不開?因為你使用的是 Chrome 新版“當前瀏覽器實例遠程調試”,它不一定等同於傳統的 --remote-debugging-port=9222 模式。如果你需要傳統 CDP 端口模式,可以重新啓動一個調試用 Chrome:"C:\Program Files\Google\Chrome\Application\chrome.exe" ^ --remote-debugging-port=9222 ^ --user-data-dir="%TEMP%\chrome-debug"然後連接:playwright-cli attach --cdp=http://127.0.0.1:9222不過這種方式會打開一個新的用戶目錄,不是你默認 Chrome 的登錄狀態。3. 為什麼不直接用默認用戶目錄啓動 9222?理論上可以,但不推薦。如果默認 Chrome 已經在運行,啓動參數可能不會生效;而且把日常使用的默認用戶目錄直接暴露給遠程調試,有安全風險。更穩妥的做法是使用 Chrome 當前實例的遠程調試能力,或者複製一份調試專用 profile。4. snapshot 和 screenshot 有什麼區別?snapshot 讀取的是頁面結構,比如按鈕、輸入框、連結和標題,適合 AI 分析和自動化操作。screenshot 是截圖,適合查看視覺效果,但不一定能準確知道按鈕和輸入框的可操作名稱。通常建議先用:playwright-cli snapshot必要時再補充:playwright-cli screenshot --filename=page.png六、推薦工作流最終比較順手的工作流是:在 Chrome 中打開目標頁面,比如 B 站、後台系統或業務頁面;進入 chrome://inspect/#remote-debugging;開啓 Allow remote debugging for this browser instance;打開 opencode;要求它只通過 playwright-cli 執行命令;先 attach;再 snapshot;根據頁面結構讓 AI 分析或繼續操作。核心命令如下:playwright-cli attach --cdp=chromeplaywright-cli snapshotplaywright-cli screenshot --filename=page.pngplaywright-cli evaluate "document.title"playwright-cli evaluate "location.href"總結這套方案的重點不是“讓 AI 打開一個新瀏覽器”,而是讓 AI 通過 Playwright CLI 接入你當前已經打開的 Chrome 頁面。它的優點是:可以複用當前瀏覽器登錄態;不需要一開始就配置 MCP;命令可複製、可審計、可復現;適合讓 opencode 分析頁面結構;後續容易轉成正式 Playwright 自動化腳本。如果只是想快速讓 AI 看頁面,CDP 直連也能做到;但如果希望過程標準、透明、可復現,playwright-cli + Chrome 遠程調試 + opencode 是一個很實用的組合。參考資料[1] Playwright: Fast and reliable end-to-end testing for modern ...: undefined[2] OpenCode - Overview - Z.AI DEVELOPER DOCUMENT: undefined

完成

開源一個 Skill,讓 AI 接管你屏幕邊那張便籤紙

AI Desk Card:讓 AI 動態控制墨水屏,取代你屏幕邊嘅便籤紙

完成

Codex 終究是要把 ClaudeCode 給埋了..

Codex 升級唔再只係代碼助手,而係一個可以住喺你電腦入面嘅 AI 員工

完成

我用UU 遠程控制電腦裏的 Codex、Claude Code 和 Mac mini

用UU遠程將手機變成AI編程遙控器,實現半監督式遠程控制Codex/Claude Code

完成

很多人問我的公眾號配圖怎麼畫的,其實是 Codex 在畫|含 Skill 分享

作者分享用Codex專用Skill自動生成公眾號配圖,將配圖變成內容工作流程嘅一部分。

完成

GPT Image 2 新手怎麼玩:別背咒語,先學會給 AI 下單

寫清需求單,唔好背咒語:GPT Image 2 新手實戰指南

完成

用一隻騎自行車的鵜鶘,看懂AI這半年

AI模型半年迭代五次,用「鵜鶘測試」睇真功夫:冇萬能模型,只有適合嘅模型

完成

codex官方推薦的10個實用技巧,用完效率翻倍

Codex 更新變身開發代理,10 個技巧提升效率

完成

別把 Claude Code 當聊天框,你可能漏掉了 30 個功能

Claude Code 40+ 功能,大部分人只係用咗個聊天框;配置比 prompt 重要一百倍

完成

9項benchmark第一、35小時不停手,Qwen3.7-Max有點東西

Qwen3.7-Max喺Agent能力上突破,9項benchmark第一、35小時長程任務表現驚人

完成

【譯】玩轉 Codex(來自 Codex 官方團隊分享)

Codex 已經從代碼助手進化為一個持久對話、整合工具、自動化執行嘅計算機工作系統,開發者可以透過語音、任務排隊、自動化同共享記憶嚟更高效完成工作。

完成

怎麼讓 Agent Skills 自進化?Agent 回答質量翻倍

通過目標驅動同多路並行測試,令 Agent Skills 實現自進化,穩定產出高質量結果

完成

我的 AI 編程的四個階段,從我也不會,到智能團隊自動化

AI 編程的四個階段:從 Vibe Coding 到智能團隊自動化,核心係設計清晰工作系統

完成

Claude Code的/usage命令,讓token消耗從玄學變工程

Claude Code 嘅 /usage 命令:token 消耗由玄學變工程

完成

Codex++:讓Codex用起來更舒服、更強大的外部增強工具

Codex++ 係一個開源嘅外部增強工具,專為 Codex 用家解決插件解鎖、會話管理、中轉接入等痛點。

完成

讀完 SpaceX 招股書才發現,火箭只是這家 AI 公司的副業

火箭公司 SpaceX 的 S-1 揭示核心業務係賣 AI 算力,Starlink 養住成個帝國

完成

小鎮 16 個人,0 融資做了 14 年郵件營銷,年入 180 萬美金

西班牙小鎮 16 人團隊,零融資 14 年,靠郵件營銷年賺 180 萬美金

完成

Claude絕對不想讓你知道這個開源免費平替 |OpenDesign 8000字保姆級教程

Open Design 係免費開源嘅 AI 設計工具,功能同 Claude Design 差唔多但更靈活,仲可以唔使俾錢用到盡。

完成

我用開源項目讓AI做了個工具,結果差點把磁盤幹廢了

小心開源項目暗藏磁盤殺手:一次差點毀掉硬盤的教訓

完成

FDE如何挖掘用戶所表達的需求背後的深層需求?

FDE要穿透客戶表面需求,挖掘背後業務流程卡點與系統重構需求,將AI項目定位為數字員工而非工具。

完成

Hermes Agent 源碼拆解:一個循環不到 10 行代碼的 Agent 框架,憑什麼自進化?

Hermes Agent 靠三層 Prompt 分層設計同簡潔循環實現自進化,值得Agent開發者深入學習

完成

AI 時代最恐怖的事:程序員沒有“練級區”了

AI 時代初級程序員嘅成長路徑正面臨斷裂危機

完成

Hermes Agent 分析師養成記 · 第五篇:一個人變成一支隊伍

Hermes Agent 透過子代理系統突破單線程天花板,將單一 Agent 變成團隊實現並行分析

完成

Coding Plan根本不用搶!OpenCode x Grok 雙廚狂喜

OpenCode 整合 Grok 訂閲,Go 套餐以 $5 月費暢用多款模型

完成

誰將被 AI 淘汰?來自 Cloudflare CEO 的裁員抉擇

Cloudflare CEO Matthew Prince 用 AI 取代「衡量者」角色,同時大幅招聘建造者同銷售者,認為 AI 唔會消滅工作,但會重塑每間企業。

完成

為什麼我們都在逃避寫 AI 的“靈魂文件”?

逃避寫 AI 靈魂文件?用「偷」同「補丁」破解心理障礙

完成

編程要消亡了?Claude Code 之父親口說「編碼已解決」

Claude Code創辦人Boris Cherny認為編碼已解決,未來開發者嘅價值在於領域知識,唔係寫code能力。

完成

OpenSpec 實戰指南

OpenSpec 係一個專為 AI 編碼助手設計嘅輕量規範驅動開發框架,透過結構化規範層解決需求丟失、迭代困難等痛點。

完成

我做了一個"動畫 + 口播"的知識演繹技能,扔個主題就能出片

用 AI 自動生成技術動畫口播視頻,一個主題幾分鐘出片

完成

三器合一:gstack + Superpowers + OpenSpec 工程化 AI 編程實戰

三器合一:OpenSpec、Superpowers、gstack 自動串聯嘅全流程AI編程

完成

黑箱

認識世界嘅黑箱方法:控制論嘅認知姿態

完成

Codex 零基礎實戰教程,夯爆了!帶你速通 15 種玩法

Codex 桌面 APP 功能全面,適合零基礎用戶,但專業開發者仍需搭配其他工具。

完成

一個寫書,一個出書:花叔橙皮書逆向skill全流程教程

創作同排版分開做,先用 huashu-bookwriter 生成 Markdown 書稿,再用 md2book 導出 PDF,係最穩陣嘅技術電子書製作流程。

完成

讀完《馬斯克原理》,我把馬斯克的工作時間,做進了我的系統裏

從馬斯克身上學到「唔係做得多,而係懂得邊界」嘅工作哲學

完成

讓AI幫我們實現肖像照自由,就這麼簡單!

用AI輕鬆實現肖像照自由:先反推提示詞,再結合本人相,效果自然唔似套公模

完成

在視頻Agent盛行的年代,oiioii還堅持搓出150+種畫風就離譜

OiiOii 嘅 150+ 畫風庫:做動畫短片唔使再愁風格唔夠用

完成

它把巴菲特和大空頭塞進了同一個項目,這個開源項目 5.9 萬星跪了

開源項目 ai-hedge-fund 展示多 Agent 協作設計範式,量化代碼與 LLM 分工係精髓

完成

為什麼 Gemini 被調侃為「美國版豆包」?

Gemini 3.5 Flash定價暴漲、實測跑唔起Code,Google AI已掉隊成「美國版豆包」

完成

Hallmark:讓 AI 寫出來的頁面不再醜得辣眼睛

Hallmark 係一個開源嘅 AI 設計技能,將設計規則打包成可複用 skill,令 AI 生成嘅頁面唔再係千篇一律嘅模板風格。

完成

看完Google I/O 2026這張T型圖,我才明白AI時代的程序員到底在拼什麼

AI時代嘅T型人才:深度為根、廣度為葉、GenAI做放大器

完成

Claude Code還是Codex?老金告你怎麼選!

用三步判斷法揀啱AI編程工具:Claude Code定Codex?關鍵係你點定義任務。

完成

Meta 裁掉的 8000 人,是被自己做的工具替代

Meta 裁員 8000 人,員工親手訓練 AI 取代自己

完成

VoiceBox:開源的本地AI語音工作室,一站式解決ElevenLabs聲音克隆 + WisprFlow語音輸入需求

VoiceBox 將 ElevenLabs 聲音克隆同 WisprFlow 語音輸入合併,成為完全本地免費嘅 AI 語音工作室

完成

來自 Codex 官方團隊的分享:如何把 Codex 用到極致

Codex唔再只係寫Code工具,透過持久對話、語音、自動化等功能,進化成全能AI助手,能夠完成從指令到審查嘅完整工作流。