谷歌 AI 總監開源「Agent Skills」:谷歌工程文化編碼沉澱為 6 階段開發全生命週期、19 項生產級 Skills 框架

作者:AI 啓蒙小夥伴
日期:2026年4月5日 上午1:20
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Google AI 總監開源 Agent Skills:將工程文化編碼成 AI Agents 可執行嘅六階段開發框架

整理版摘要

呢篇文章介紹 Google Cloud AI 總監 Addy Osmani 開源嘅 agent-skills 項目,佢係一套為 AI Coding Agents 設計嘅生產級工程技能集合。作者眼見 AI 寫程式成日走捷徑,跳過規範、測試、安全審查等關鍵步驟,所以將 Google 資深工程師嘅工作流、質量門禁同最佳實踐系統化整理,令 Agents 喺開發每個階段都跟足做。

項目採用「DEFINEPLANBUILD → VERIFY → REVIEW → SHIP」六階段生命週期,每階段有對應Skills,總共19項核心技能,仲有7個斜槓命令、3個預配置專家角色同4份檢查清單。Skills 嘅設計好特別:每項都包含步驟、驗證門禁,仲有「反合理化」表格——列出 Agents 成日用嚟偷懶嘅藉口同對應反駁,確保質量。

整體嚟講,呢個框架係想將「點樣寫好生產級軟件」呢種隱性知識,變成 Agents 睇得明、跟得到嘅結構化指引。無論你用 Claude CodeCursorWindsurf 定 GitHub Copilot,都可以直接匯入用。文章仲強調呢套嘢嚟自 Google 工程文化,例如 Hyrum's Law、測試金字塔、主幹開發等經典概念,算係將大廠實戰經驗打包成 AI 可執行嘅資產。

  • Agent Skills 核心目的:阻止 AI coding agents 走捷徑,強制跟足規範、測試、安全審查等生產級流程。
  • 六階段開發生命週期DEFINEPLANBUILD → VERIFY → REVIEW → SHIP,每個階段對應特定 Skills 目錄同命令。
  • 19項核心技能覆蓋全流程,每項包含 ProcessRationalizationsVerification,設計上強制執行質素門禁。
  • 提供多平台整合Claude CodeCursorWindsurf、GitHub Copilot 等,直接匯入 Markdown 規則便可使用。
  • 呢個框架唔係紙上談兵,而係將 Google 工程文化(如 Hyrum's LawBeyonce Rule、trunk-based development)編碼成可執行工作流。
值得記低
連結 github.com

agent-skills GitHub 倉庫

項目主頁,包含完整六階段目錄、19項SKILL.md、檢查清單及多平台整合指引。

結構示例

內容結構

內容結構 text
┌─ Frontmatter ─────────────────────────┐│ name: lowercase-hyphen-name           ││ description: Use when [trigger]       │└───────────────────────────────────────┘Overview         → Skills 作用When to Use      → 觸發條件Process          → 分步工作流Rationalizations → 藉口與反駁Red Flags        → 問題信號Verification     → 證據要求
整理重點

問題背景:點解要將工程師經驗編碼成 Agent Skills?

Addy Osmani 留意到,AI Coding Agents 預設行為係「行短路徑」——即係跳過規格、測試、安全審查呢啲令軟件可靠嘅做法。呢個固有問題,靠單次 prompt 好難解決。

「AI coding agents default to the shortest path - which often means skipping specs, tests, security reviews」——呢句直接點出項目嘅出發點。

所以佢開源咗 agent-skills,將 Google 資深工程師嘅工作流同質量門禁編碼成 Agents 可以跟嘅結構化技能,令 Agents 喺開發每個階段都一致地執行最佳實踐。

整理重點

核心架構:六階段開發生命週期

項目採用結構化六階段流程,每個階段對應特定目錄同 Skills:DEFINE(定義)、PLAN(規劃)、BUILD(構建)、VERIFY(驗證)、REVIEW(審查)、SHIP(交付)。

斜槓命令體繫有7個:/spec、/plan、/build、/test、/review、/code-simplify、/ship,每條命令都有核心原則,例如「Spec before code」「Clarity over cleverness」。

Skills 體系一共19項核心技能,分佈喺六階段。例如 Define 階段有 idea-refine 同 spec-driven-development;Build 階段有 incremental-implementation 同 context-engineering 等。

  1. 1 DEFINE:idea-refine — 結構化發散/收斂,將模糊諗法變成具體提案;spec-driven-development — 寫涵蓋目標、命令、結構、測試邊界嘅 PRD
  2. 2 PLAN:planning-and-task-breakdown — 將規格拆成細小可驗證任務,包含驗收標準同依賴排序。
  3. 3 BUILD:incremental-implementation — 薄垂直切片,實現、測試、驗證、提交,配合功能標誌同安全默認值。
  4. 4 VERIFY:test-driven-development — 紅-綠-重構,跟測試金字塔(80/15/5);debugging-and-error-recovery — 五步分類:復現、定位、簡化、修復、防護。
  5. 5 REVIEW:code-review-and-quality — 五軸審查、變更規模約100行;security-and-hardening — OWASP Top 10 防護、三層邊界系統。
  6. 6 SHIP:git-workflow-and-versioning — 主幹開發、原子提交;ci-cd-and-automation — 左移、功能標誌、質量門禁流水線。

每項 SKILL.md 都有統一格式Frontmatter(名稱、觸發描述)、OverviewWhen to Use、Process、Rationalizations(藉口同反駁)、Red Flags、Verification(證據要求)。呢種結構令 Agents 可以精準執行。

整理重點

關鍵設計特色:反合理化、驗證門禁同多重角色

呢個框架有幾個好值得留意嘅設計選擇。首先係反合理化(Anti-rationalization)——每項Skill都有個表格,列出Agent為咗跳過步驟常用嘅藉口,同埋對應嘅反駁。

Verification is non-negotiable」——每項Skills以證據要求結束,確保「Seems right」永遠唔夠,要真係有客觀證明。

第二係提供3個預配置專家角色:code-reviewer(Senior Staff Engineer視角)、test-engineer(QA Specialist)、security-auditor(Security Engineer)。你可以根據任務需要叫呢啲角色出嚟,用唔同角度審查代碼。

仲有4份參考檢查清單:testing-patterns.md、security-checklist.md、performance-checklist.md、accessibility-checklist.md,涵蓋提交前要睇嘅關鍵位。

  • 測試檢查清單包含測試結構、MockReact/API/E2E示例,仲有反模式提醒。
  • 安全檢查清單涵蓋認證、輸入驗證、HeadersCORSOWASP Top 10。
  • 性能檢查清單以Core Web Vitals為目標,提供前端/後端檢查同測量命令。
  • 無障礙檢查清單覆蓋鍵盤導航、屏幕閲讀器、ARIA、測試工具。

呢啲資源唔係純粹參考,而係可以直接嵌入 Agents 嘅規則,等佢哋自動跟足。

整理重點

多平台整合:點樣用落嘅實際工具度?

項目提供工具無關嘅 Markdown 格式,同時有針對主流 AI Coding Agents 嘅具體整合方案。Claude Code 有原生插件支援斜槓命令;Cursor 可以將 SKILL.md 放落 .cursor/rules/ 或引用 skills/ 目錄。

Windsurf 用戶可以將內容加入規則配置;GitHub Copilot 可以用 agents/ 做 personas,內容放落 .github/copilot-instructions.md。其他工具只要接受系統 prompt 或指令檔案,都食到純 Markdown 版本。

重要係:呢套框架本身唔綁死任何工具,你可以揀適合自己 workflow 嘅整合方式。

另外,項目仲話明方法論嚟自 Google 工程文化,包括 Software Engineering at GoogleGoogle's engineering practices guide,裡面嵌入咗 Hyrum's Law、Beyonce Rule、trunk-based development 呢啲經典概念。

Google Cloud AI (Gemini | Vertex) 總監 Addy Osmani 最近開源咗 Google 資深工程師嘅寶藏經驗「Agent Skills」生產級工程 Skills 集合,覆蓋 6 階段開發全生命週期19 項核心 Skills,真係寶藏 Skills。

圖片


項目定位

agent-skills 係一套面向 AI Coding Agents 嘅生產級工程技能集合。根據項目自述,佢嘅核心目的係解決一個具體問題:

"AI coding agents default to the shortest path - which often means skipping specs, tests, security reviews, and the practices that make software reliable."

項目將資深工程師構建軟件時用嘅工作流、質量門禁同最佳實踐進行編碼,令 AI Agents 能夠喺開發嘅每個階段一致咁跟從呢啲規範。

項目地址:

https://github.com/addyosmani/agent-skills[1]


核心架構:六階段開發生命週期

項目採用結構化嘅六階段流程,每個階段對應特定嘅目錄同 Skills:

DEFINE → PLAN → BUILD → VERIFY → REVIEW → SHIP
/spec    /plan   /build   /test    /review   /ship

命令體系(7 個斜槓命令)

命令用途核心原則
/spec定義要構建嘅內容Spec before code
/plan規劃構建方式Small, atomic tasks
/build增量構建One slice at a time
/test證明佢有效Tests are proof
/review合併前審查Improve code health
/code-simplify簡化代碼Clarity over cleverness
/ship交付生產Faster is safer

Skills 體系(19 項核心 Skills)

Skills 按開發階段組織,每項 Skills 都包含步驟、驗證門禁同反合理化表格

Define(定義)

  • idea-refine:結構化發散/收斂思維,將模糊諗法轉化為具體提案
  • spec-driven-development:編寫涵蓋目標、命令、結構、代碼風格、測試同邊界嘅 PRD

Plan(規劃)

  • planning-and-task-breakdown:將規格分解成細小、可驗證嘅任務,包含驗收標準同依賴排序

Build(構建)

  • incremental-implementation:薄垂直切片——實現、測試、驗證、提交;功能標誌、安全默認值、可回滾變更
  • context-engineering:喺正確時間向 Agent 提供正確信息
  • frontend-ui-engineering:組件架構、設計系統、狀態管理、響應式設計、WCAG 2.1 AA 無障礙
  • api-and-interface-design:契約優先設計、Hyrum 定律、單一版本規則、錯誤語義、邊界驗證

Verify(驗證)

  • test-driven-development:紅-綠-重構、測試金字塔(80/15/5)、測試規模、DAMP 優於 DRY、Beyonce 規則、瀏覽器測試
  • browser-testing-with-devtools:Chrome DevTools MCP 實時運行時數據
  • debugging-and-error-recovery:五步分類:復現、定位、簡化、修復、防護;停線規則、安全回退

Review(審查)

  • code-review-and-quality:五軸審查、變更規模(約 100 行)、嚴重程度標籤、審查速度規範、拆分策略
  • code-simplification:切斯特頓圍欄、500 行規則、喺保持精確行為嘅前提下降低複雜度
  • security-and-hardening:OWASP Top 10 防護、認證模式、密鑰管理、依賴審計、三層邊界系統
  • performance-optimization:測量優先方法、Core Web Vitals 目標、分析工作流、包分析、反模式檢測

Ship(交付)

  • git-workflow-and-versioning:主幹開發、原子提交、變更規模、提交作為存檔點模式
  • ci-cd-and-automation:左移、越快越安全、功能標誌、質量門禁流水線、失敗反饋循環
  • deprecation-and-migration:代碼即負債心態、強制性與建議性棄用、遷移模式、殭屍代碼清除
  • documentation-and-adrs:架構決策記錄、API 文檔、內聯文檔標準——記錄「點解」
  • shipping-and-launch:發佈前檢查清單、功能標誌生命週期、分階段推出、回滾程序、監控設置

技能嘅標準解剖結構

每個 SKILL.md 跟從統一格式:

┌─ Frontmatter ─────────────────────────┐
│ name: lowercase-hyphen-name           │
│ description: Use when [trigger]       │
└───────────────────────────────────────┘

Overview         → Skills 作用
When to Use      → 觸發條件
Process          → 分步工作流
Rationalizations → 藉口與反駁
Red Flags        → 問題信號
Verification     → 證據要求

關鍵設計選擇

  1. Process, not prose — Skills 係 Agent 跟從嘅工作流,唔係用嚟睇嘅參考資料
  2. Anti-rationalization — 每項 Skill 包含 Agent 為咗 skip 步驟常用嘅藉口表同反駁
  3. Verification is non-negotiable — 每項 Skill 以證據要求結束,「Seems right」永遠唔足夠
  4. Progressive disclosure — SKILL.md 為入口,支援性參考資料淨係喺需要嘅時候加載,保持 Token 使用最小化

Agents 角色(3 個預配置專家)

Agent角色視角
code-reviewerSenior Staff Engineer「Staff engineer 會批准呢個嗎?」標準嘅五軸代碼審查
test-engineerQA Specialist測試策略、覆蓋率分析同 Prove-It 模式
security-auditorSecurity Engineer漏洞檢測、威脅建模、OWASP 評估

參考檢查清單(4 份)

  • testing-patterns.md:測試結構、命名、Mock、React/API/E2E 示例、反模式
  • security-checklist.md:提交前檢查、認證、輸入驗證、Headers、CORS、OWASP Top 10
  • performance-checklist.md:Core Web Vitals 目標、前端/後端檢查清單、測量命令
  • accessibility-checklist.md:鍵盤導航、屏幕閲讀器、視覺設計、ARIA、測試工具

多平台支持

項目提供與工具無關嘅 Markdown 格式,同時針對主流 AI Coding Agents 提供具體集成方案:

  • Claude Code:原生插件(@addy-agent-skills),支援斜槓命令
  • Cursor:複製 SKILL.md 至 .cursor/rules/ 或者引用完整 skills/ 目錄
  • Windsurf:加 Skills 內容到規則配置
  • GitHub Copilot:使用 agents/ 作為 Copilot personas,Skills 內容放入 .github/copilot-instructions.md
  • Codex / 其他:純 Markdown,任何接受系統提示詞或者指令文件嘅 Agent 都用得到

工程文化來源

項目明確聲明佢哋嘅方法論來源:

「Skills bake in best practices from Google's engineering culture — including concepts from Software Engineering at Google and Google's engineering practices guide.」

具體嵌入嘅概念包括:

  • Hyrum's Law(API 設計)
  • Beyonce Rule & test pyramid(測試)
  • Change sizing & review speed norms(代碼審查)
  • Chesterton's Fence(簡化)
  • Trunk-based development(Git 工作流)
  • Shift Left & feature flags(CI/CD)
  • Code-as-liability mindset(棄用)

貢獻標準

項目對貢獻嘅 Skills 有明確要求:

  • Specific:可操作嘅步驟,唔係模糊建議
  • Verifiable:清晰嘅退出標準同證據要求
  • Battle-tested:基於真實工作流
  • Minimal:淨係包含引導 Agent 所需嘅必要內容

許可證

MIT License — 可以喺項目、團隊同工具入面自由使用。


總結

agent-skills 係一個系統性嘅 AI Coding Agents Skills 框架,透過將軟件工程最佳實踐編碼成結構化、可驗證嘅工作流,嘗試解決 AI 編程工具「走捷徑」嘅固有問題。佢嘅核心價值在於提供咗從諗法到生產嘅完整生命週期管理,並透過「反合理化」設計強制保證質量門禁嘅執行。

最後係我分享過嘅一啲 Skills

深度解讀 OpenAI 同 Anthropic 嘅前端設計 Skills:令所有人做出頂級設計感嘅專業級網站

深度拆解 ClawHub Skills 排名榜首「self-improving-agent」:記錄經驗、總結錯誤,形成持久化經驗,提取 Skills,不斷自我提升

一人公司 (OPC) 創業必備嘅 9 個 Agent Skills

推薦 Top10:面向辦公場景嘅 Agent Skills

推薦 Top10:面向 前端/產品/UI 嘅 Skills

官方發佈:點樣打造高效 Claude Code Skills

[中文翻譯完整版] Agent Skills 創作最佳實踐

[中文翻譯萬字完整版] Anthropic 官方 Agent Skills 構建完整指南

Google Cloud AI (Gemini | Vertex) 總監 Addy Osmani 最新開源了 Google 資深工程師寶藏經驗「Agent Skills」生產級工程 Skills 集合,覆蓋 6 階段開發全生命週期19 項核心 Skills,真是寶藏 Skills。

圖片


項目定位

agent-skills 是一套面向 AI Coding Agents 的生產級工程技能集合。根據項目自述,其核心目的是解決一個具體問題:

"AI coding agents default to the shortest path - which often means skipping specs, tests, security reviews, and the practices that make software reliable."

項目將資深工程師構建軟件時使用的工作流、質量門禁和最佳實踐進行編碼,使 AI Agents 能夠在開發的每個階段一致地遵循這些規範。

項目地址:

https://github.com/addyosmani/agent-skills[1]


核心架構:六階段開發生命週期

項目採用結構化的六階段流程,每個階段對應特定的目錄和 Skills:

DEFINE → PLAN → BUILD → VERIFY → REVIEW → SHIP
/spec    /plan   /build   /test    /review   /ship

命令體系(7 個斜槓命令)

命令用途核心原則
/spec定義要構建的內容Spec before code
/plan規劃構建方式Small, atomic tasks
/build增量構建One slice at a time
/test證明其有效Tests are proof
/review合併前審查Improve code health
/code-simplify簡化代碼Clarity over cleverness
/ship交付生產Faster is safer

Skills 體系(19 項核心 Skills)

Skills 按開發階段組織,每項 Skills 均包含步驟、驗證門禁和反合理化表格

Define(定義)

  • idea-refine:結構化發散/收斂思維,將模糊想法轉化為具體提案
  • spec-driven-development:編寫涵蓋目標、命令、結構、代碼風格、測試和邊界的 PRD

Plan(規劃)

  • planning-and-task-breakdown:將規格分解為小的、可驗證的任務,包含驗收標準和依賴排序

Build(構建)

  • incremental-implementation:薄垂直切片——實現、測試、驗證、提交;功能標誌、安全默認值、可回滾變更
  • context-engineering:在正確時間向 Agent 提供正確信息
  • frontend-ui-engineering:組件架構、設計系統、狀態管理、響應式設計、WCAG 2.1 AA 無障礙
  • api-and-interface-design:契約優先設計、Hyrum 定律、單一版本規則、錯誤語義、邊界驗證

Verify(驗證)

  • test-driven-development:紅-綠-重構、測試金字塔(80/15/5)、測試規模、DAMP 優於 DRY、Beyonce 規則、瀏覽器測試
  • browser-testing-with-devtools:Chrome DevTools MCP 實時運行時數據
  • debugging-and-error-recovery:五步分類:復現、定位、簡化、修復、防護;停線規則、安全回退

Review(審查)

  • code-review-and-quality:五軸審查、變更規模(約 100 行)、嚴重程度標籤、審查速度規範、拆分策略
  • code-simplification:切斯特頓圍欄、500 行規則、在保持精確行為的前提下降低複雜度
  • security-and-hardening:OWASP Top 10 防護、認證模式、密鑰管理、依賴審計、三層邊界系統
  • performance-optimization:測量優先方法、Core Web Vitals 目標、分析工作流、包分析、反模式檢測

Ship(交付)

  • git-workflow-and-versioning:主幹開發、原子提交、變更規模、提交作為存檔點模式
  • ci-cd-and-automation:左移、越快越安全、功能標誌、質量門禁流水線、失敗反饋循環
  • deprecation-and-migration:代碼即負債心態、強制性與建議性棄用、遷移模式、殭屍代碼清除
  • documentation-and-adrs:架構決策記錄、API 文檔、內聯文檔標準——記錄"為什麼"
  • shipping-and-launch:發佈前檢查清單、功能標誌生命週期、分階段推出、回滾程序、監控設置

技能的標準解剖結構

每個 SKILL.md 遵循統一格式:

┌─ Frontmatter ─────────────────────────┐
│ name: lowercase-hyphen-name           │
│ description: Use when [trigger]       │
└───────────────────────────────────────┘

Overview         → Skills 作用
When to Use      → 觸發條件
Process          → 分步工作流
Rationalizations → 藉口與反駁
Red Flags        → 問題信號
Verification     → 證據要求

關鍵設計選擇

  1. Process, not prose — Skills 是 Agent 遵循的工作流,而非供閲讀的參考資料
  2. Anti-rationalization — 每項 Skill 包含 Agent 為跳過步驟常用的藉口表及反駁
  3. Verification is non-negotiable — 每項 Skill 以證據要求結束,"Seems right" 永遠不足夠
  4. Progressive disclosure — SKILL.md 為入口,支持性參考資料僅在需要時加載,保持 Token 使用最小化

Agents 角色(3 個預配置專家)

Agent角色視角
code-reviewerSenior Staff Engineer"Staff engineer 會批准這個嗎?"標準的五軸代碼審查
test-engineerQA Specialist測試策略、覆蓋率分析和 Prove-It 模式
security-auditorSecurity Engineer漏洞檢測、威脅建模、OWASP 評估

參考檢查清單(4 份)

  • testing-patterns.md:測試結構、命名、Mock、React/API/E2E 示例、反模式
  • security-checklist.md:提交前檢查、認證、輸入驗證、Headers、CORS、OWASP Top 10
  • performance-checklist.md:Core Web Vitals 目標、前端/後端檢查清單、測量命令
  • accessibility-checklist.md:鍵盤導航、屏幕閲讀器、視覺設計、ARIA、測試工具

多平台支持

項目提供與工具無關的 Markdown 格式,同時針對主流 AI Coding Agents 提供具體集成方案:

  • Claude Code:原生插件(@addy-agent-skills),支持斜槓命令
  • Cursor:複製 SKILL.md 至 .cursor/rules/ 或引用完整 skills/ 目錄
  • Windsurf:添加 Skills 內容至規則配置
  • GitHub Copilot:使用 agents/ 作為 Copilot personas,Skills 內容放入 .github/copilot-instructions.md
  • Codex / 其他:純 Markdown,任何接受系統提示詞或指令文件的 Agent 均可使用

工程文化來源

項目明確聲明其方法論來源:

"Skills bake in best practices from Google's engineering culture — including concepts from Software Engineering at Google and Google's engineering practices guide."

具體嵌入的概念包括:

  • Hyrum's Law(API 設計)
  • Beyonce Rule & test pyramid(測試)
  • Change sizing & review speed norms(代碼審查)
  • Chesterton's Fence(簡化)
  • Trunk-based development(Git 工作流)
  • Shift Left & feature flags(CI/CD)
  • Code-as-liability mindset(棄用)

貢獻標準

項目對貢獻的 Skills 有明確要求:

  • Specific:可操作的步驟,非模糊建議
  • Verifiable:清晰的退出標準及證據要求
  • Battle-tested:基於真實工作流
  • Minimal:僅包含引導Agent所需的必要內容

許可證

MIT License — 可在項目、團隊和工具中自由使用。


總結

agent-skills 是一個系統性的 AI Coding Agents Skills 框架,通過將軟件工程最佳實踐編碼為結構化、可驗證的工作流,試圖解決 AI 編程工具"走捷徑"的固有問題。其核心價值在於提供了從想法到生產的完整生命週期管理,並通過"反合理化"設計強制保證質量門禁的執行。

最後是我分享過的一些 Skills

深度解讀 OpenAI 與 Anthropic 的前端設計 Skills:讓所有人做出頂級設計感的專業級網站

深度拆解 ClawHub Skills 排名榜首「self-improving-agent」:記錄經驗、總結錯誤,形成持久化經驗,提取 Skills,不斷自我提升

一人公司 (OPC) 創業必備的 9 個 Agent Skills

推薦 Top10:面向辦公場景的 Agent Skills

推薦 Top10:面向 前端/產品/UI 的 Skills

官方發佈:如何打造高效Claude Code Skills

[中文翻譯完整版] Agent Skills 創作最佳實踐

[中文翻譯萬字完整版] Anthropic 官方 Agent Skills 構建完整指南