關於 AI Agent,你最想知道的 3 個問題——為什麼我說“垂直 Agent”是個偽命題

作者:寶玉AI
日期:2026年1月18日 上午7:19
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

AI Agent 本質係循環調用工具嘅 LLM,垂直 Agent 係偽命題,真正護城河喺數據同領域知識

整理版摘要

呢篇文章係 JimLiu 基於自己一線實踐,解答讀者關於 AI Agent 嘅三個核心問題。作者認為 Agent 嘅定義已經有行業共識,大廠密集推出 Agent 係因為佢比聊天機械人更有商業價值——可以真正做嘢。佢亦提到 Skills 生態係下一個爆發方向,自己都用 Claude Code 加開源 Skills 提升效率。

對於垂直 Agent,作者明確指出:Agent 技術本身無任何秘密,純粹做垂直 Agent 好難建立護城河。真正機會在於圍繞 Agent 構建嘅獨有數據、專業 Skills、深度集成同行業 Know-how。結論係:唔好做「垂直 Agent」,要用通用 Agent 能力去解決垂直領域問題。

  • Agent 嘅核心定義係「LLM + 工具調用 + 自主決策循環」,唔同公司嘅表述本質一致。
  • Agent 比聊天機械人更有價值在於佢可以調用工具、完成複雜任務、對接外部系統,真正替代人做嘢。
  • 編程係 Agent 最先落地嘅領域,Claude Code 等工具已經可以自主理解需求、修改代碼、運行測試。
  • Skills 生態正在爆發,預設工具提示詞工作流嘅「技能包」可以大幅提升效率,JimLiu 嘅 Skills 已經開源。
  • 垂直 Agent 係偽命題,因為 Agent 技術無壁壘;真正護城河係獨有數據、專業 Skills、深度集成同行業知識。
值得記低
連結 anthropic.com

Building Effective Agents (Anthropic)

Anthropic 關於 Agent 同工作流嘅權威區分文章,定義咗業界共識。

連結 simonwillison.net

Simon Willison 對 AI Agent 嘅簡潔定義

Simon Willison 提出 Agent 係「為實現目標循環調用工具嘅大語言模型」,抓住咗本質。

連結 github.com

JimLiu 嘅開源 Skills(寶玉 Skills)

作者公開嘅多個 Claude Code Skills,包括自動配圖、生成漫畫、做 PPT、自動發文等。

整理重點

AI Agent 嘅權威定義係咩?

Agent 嘅定義同國家無關,係行業共識演進嘅結果。目前業界最認可嘅定義來自 Anthropic,佢哋喺《Building Effective Agents》入面做咗個重要區分:工作流係「人寫好劇本,AI 照着演」;Agent 係「人給個目標,AI 自己想辦法」。

工作流(Workflow)

Agent

從技術實現角度,Simon Willison 嘅定義更簡潔:一個 AI Agent,係為咗實現某個目標,循環調用工具嘅大語言模型。呢個定義抓住咗本質——唔係一次性畀答案,而係通過「思考→行動→觀察→再思考」嘅循環逐步完成任務。

思考→行動→觀察→再思考

整理重點

點解大廠密集推出 Agent?商業前景點睇?

大廠呢個時間點入場,核心原因係 Agent 目前 AI 落地最有價值嘅方向。聊天機械人只能「說」,唔可以「做」;而 Agent 可以調用工具、完成複雜任務、對接外部系統、持續後台運行,真正替代人做一部分工作。

只能「說」,唔可以「做」

  • 調用工具:搜索網頁、讀寫文件、執行代碼
  • 完成複雜任務:將大任務拆解成小步驟逐個完成
  • 與外部系統集成:對接企業內部系統、數據庫、API
  • 持續運行:唔需要人一直睇住,可以後台自主工作

已經跑通嘅場景係編程領域,Claude CodeCursorCodex 等編程 Agent 可以自主理解需求、讀取項目代碼、修改文件、運行測試、修復 bug。另一方面,Skills 生態正喺度爆發,Skills 係教會 Agent 完成特定任務嘅「技能包」,例如 JimLiu 就用 Claude Code 加 Skills 嚟自動配圖、生成漫畫、做 PPT、自動發文。

編程係 Agent 最先落地嘅領域

Skills 生態

但 Agent 仍然有挑戰:門檻較高、安全問題(惡意 Skill 可能竊取數據)、可靠性有時要人工幹預。大廠入場係為咗搶佔生態位,邊個率先建立最多用戶嘅 Agent 客戶端同豐富嘅 Skills 生態,邊個就喺下一階段佔優。

門檻較高

惡意的 Skill 可能竊取數據

整理重點

通用定垂直 Agent 更睇好?

呢個問題要轉換角度。Agent 本身難以形成垂直壁壘,因為從技術角度睇,Agent 冇任何秘密——就係一個循環調用工具嘅 LLM。而模型對所有人都一樣,可以用商業模型或者開源模型。單純做垂直領域 Agent 好難建立護城河。

Agent 本身沒有任何秘密

  1. 1 獨有嘅數據:行業數據、客戶數據、知識庫,別人冇
  2. 2 專業嘅 Skills:針對特定行業流程打造嘅工具同工作流
  3. 3 深度嘅集成:與行業內已有系統嘅對接能力
  4. 4 領域 Know-how:對行業痛點同流程嘅深刻理解

舉例:醫療領域 Agent 產品,核心競爭力唔係 Agent 層,而係背後嘅醫學知識庫、與醫院 HIS 系統對接、對診療流程嘅理解、多年積累嘅脱敏病例數據。所以結論係:唔好去做「垂直 Agent」,要用通用 Agent 能力去解決垂直領域問題。

護城河唔喺 Agent 呢層


答返幾個讀者問題。

1、AI Agent 係咪有一個權威嘅概念?中美兩國對呢個概念有冇統一嘅解釋?

AI Agent 嘅定義同國家無關,更加係行業共識嘅演進。

目前業界比較認可嘅定義來自 Anthropic。佢哋喺《Building Effective Agents》(https://www.anthropic.com/research/building-effective-agents)呢篇文章入面做咗一個好重要嘅區分:

工作流(Workflow):通過預先定義嘅代碼路徑嚟編排 LLM 同工具嘅系統。

Agent:由 LLM 動態咁指揮自己嘅流程同工具使用方式嘅系統,始終由 LLM 嚟掌控完成任務嘅方式。

簡單嚟講,工作流係「人寫好劇本,AI 跟住演」;而 Agent 係「人畀個目標,AI 自己想辦法」。

從技術實現角度嚟講,我比較認同 Simon Willison 提出嘅簡潔定義(https://simonwillison.net/2025/Sep/18/agents/):

一個 AI Agent(智能體),係為咗實現某個目標,循環調用工具嘅大語言模型。

呢個定義捉到 Agent 嘅本質——佢唔係一次過俾出答案,而係通過「思考→行動→觀察→再思考」嘅循環,逐步完成任務。目前主流嘅 Agent 實現,無論係 OpenAI 定係 Anthropic,底層都係呢個結構。

Agent 的核心循環

當然,唔同公司可能會根據產品定位俾出略有差異嘅表述,但核心思想係一致嘅:Agent = LLM + 工具調用 + 自主決策循環


2、近期國內外大廠密集推出 AI Agent,點解揀呢個時間點?你點睇 AI Agent 嘅商業化前景?

大廠喺呢個時間點密集推出 Agent,核心原因係:Agent 係目前 AI 落地最有價值嘅方向

點解 Agent 比聊天機器人更有商業價值?

聊天機器人嘅侷限性好明顯——佢只能「講」,唔可以「做」。而 Agent 能夠:

  • • 調用工具:例如搜尋網頁、讀寫檔案、執行代碼
  • • 完成複雜任務:將大任務拆解成細步驟,逐個完成
  • • 同外部系統集成:對接企業內部系統、數據庫、API
  • • 持續運行:唔需要人一直盯住,可以喺後台自主工作

呢個意味住 Agent 可以真正替代人完成一部分工作,而唔係淨係輔助回答問題。

Chatbot 與 Agent 的對比

已經行得通嘅場景:編程領域

編程係 Agent 最先落地嘅領域。好似 Claude Code、Cursor、Codex 呢啲編程 Agent,已經能夠實實在在咁幫開發者完成任務,唔係淨係生成代碼片段,而係理解需求、讀取項目代碼、修改檔案、運行測試、修復 bug,成個流程都能夠自主完成。

正在爆發嘅方向:Skills 生態

舊年年底開始,「Skills」呢個概念開始流行。簡單理解,Skills 就係教識 Agent 完成特定任務嘅「技能包」,一套預設嘅工具、提示詞同工作流嘅組合。

Agent 的 Skills 技能包

例如我個人就大量使用 Claude Code 結合各種 Skills 嚟提升效率:

  • • 幫文章自動配圖(調用圖片生成工具)
  • • 根據素材生成漫畫故事
  • • 根據素材自動生成 PPT
  • • 自動發佈文章到公眾號、博客、社交媒體
  • • 等等

呢啲任務以前每個都要花我半個鐘到幾個鐘,而家幾分鐘就搞得掂。順便講下,我呢幾個 skills 都係開源嘅:https://github.com/JimLiu/baoyu-skills

現階段嘅挑戰

但係 Agent 目前仍處於早期階段,主要挑戰有:

  1. 1. 門檻比較高:目前呢啲能力主要喺極客圈子入面流行,普通用戶上手困難
  2. 2. 安全問題:Agent 需要比較高嘅系統權限先至可以工作,呢個帶嚟咗安全風險。例如惡意嘅 Skill 可能竊取數據、攻擊系統
  3. 3. 可靠性:Agent 有時會「行錯路」,需要人工幹預

呢啲問題都喺度逐步解決。大廠密集入場,本質上係睇到 Agent 嘅巨大潛力,想搶佔生態位。邊個能夠率先建立起最多用戶嘅 Agent 客戶端同豐富嘅 Skills 生態,邊個就能夠喺下一階段佔據優勢。

就好似而家 Anthropic 就依靠 Claude Code 搶佔咗先機同用戶心智,大家諗起 Coding Agent 就會諗起 Claude Code,MCP、Skills 嘅標準都係佢哋提出嚟嘅,開發者們爭先恐後咁根據佢哋嘅標準喺度構建 Agent 生態。

3、通用類 AI Agent 同垂直類 AI Agent,你更加睇好邊個嘅商業前景?

呢個問題需要換個角度嚟理解。

Agent 本身好難形成垂直壁壘

從技術角度睇,Agent 本身冇任何秘密,就好似我前面講嘅,佢從技術角度睇就係一個循環調用工具嘅大語言模型。

而模型對所有人嚟講都係一樣嘅:一係俾錢用商業模型(OpenAI、Anthropic、豆包、阿里),一係用 DeepSeek 呢啲開源模型。呢個就好似揀操作系統,你用 Windows 定係 Linux,個個都用得。

所以,單純做一個垂直領域嘅 Agent 好難建立護城河。你今日做到,人哋聽日都做到,而且可能做得更加好。

真正嘅機會喺邊度?

打個比喻:Agent 就好似操作系統,無論係通用領域定係垂直領域,操作系統本身都差唔多。真正嘅差異化,係基於操作系統之上嘅應用。

垂直領域真正嘅機會在於:

  1. 1. 獨有嘅數據:你有其他人冇嘅行業數據、客戶數據、知識庫
  2. 2. 專業嘅 Skills:針對特定行業流程打造嘅工具同工作流
  3. 3. 深度嘅集成:同行業內已有系統嘅對接能力
  4. 4. 領域 Know-how:對行業痛點同流程嘅深刻理解

舉個例:一個醫療領域嘅 Agent 產品,核心競爭力唔係「Agent」呢層,而係背後接入嘅醫學知識庫、同醫院 HIS 系統嘅對接、對診療流程嘅理解、以及多年積累嘅脱敏病例數據。

所以我嘅結論係:唔好去做「垂直 Agent」,而係用通用 Agent 嘅能力,去解決垂直領域嘅問題。 護城河唔喺 Agent 呢層,而係喺你圍繞 Agent 構建嘅數據、工具同行業理解。

垂直領域的護城河

以上係我基於一線實踐嘅觀察同思考,僅供參考。



回答幾個讀者問題。

1、AI Agent 是否有一個權威的概念?中美兩國對這個概念是否有統一的解釋?

AI Agent 的定義和國家無關,更多是行業共識的演進。

目前業界比較認可的定義來自 Anthropic。他們在《Building Effective Agents》(https://www.anthropic.com/research/building-effective-agents)這篇文章中做了一個很重要的區分:

工作流(Workflow):通過預定義的代碼路徑來編排 LLM 與工具的系統。

Agent:由 LLM 動態地指揮自己的流程和工具使用方式的系統,始終由 LLM 來掌控完成任務的方式。

簡單來說,工作流是“人寫好劇本,AI 照着演”;而 Agent 是“人給個目標,AI 自己想辦法”。

從技術實現角度,我比較認同 Simon Willison 提出的簡潔定義(https://simonwillison.net/2025/Sep/18/agents/):

一個 AI Agent(智能體),是為了實現某個目標,循環調用工具的大語言模型。

這個定義抓住了 Agent 的本質——它不是一次性給出答案,而是通過“思考→行動→觀察→再思考”的循環,逐步完成任務。目前主流的 Agent 實現,無論是 OpenAI 的還是 Anthropic 的,底層都是這個結構。

Agent 的核心循環

當然,不同公司可能會根據產品定位給出略有差異的表述,但核心思想是一致的:Agent = LLM + 工具調用 + 自主決策循環


2、近期國內外大廠密集推出 AI Agent,為何選擇這個時間點?您如何看待 AI Agent 的商業化前景?

大廠在這個時間點密集推出 Agent,核心原因是:Agent 是目前 AI 落地最有價值的方向

為什麼 Agent 比聊天機器人更有商業價值?

聊天機器人的侷限性很明顯——它只能“說”,不能“做”。而 Agent 能夠:

  • • 調用工具:比如搜索網頁、讀寫文件、執行代碼
  • • 完成複雜任務:把大任務拆解成小步驟,逐個完成
  • • 與外部系統集成:對接企業內部系統、數據庫、API
  • • 持續運行:不需要人一直盯着,可以在後台自主工作

這意味着 Agent 可以真正替代人完成一部分工作,而不只是輔助回答問題。

Chatbot 與 Agent 的對比

已經跑通的場景:編程領域

編程是 Agent 最先落地的領域。像 Claude Code、Cursor、Codex 這樣的編程 Agent,已經能夠實實在在地幫開發者完成任務,不只是生成代碼片段,而是理解需求、讀取項目代碼、修改文件、運行測試、修復 bug,整個流程都能自主完成。

正在爆發的方向:Skills 生態

去年底開始,“Skills”這個概念開始流行。簡單理解,Skills 就是教會 Agent 完成特定任務的“技能包”,一套預設的工具、提示詞和工作流的組合。

Agent 的 Skills 技能包

比如我個人就大量使用 Claude Code 結合各種 Skills 來提升效率:

  • • 給文章自動配圖(調用圖片生成工具)
  • • 根據素材生成漫畫故事
  • • 根據素材自動生成 PPT
  • • 自動發佈文章到公眾號、博客、社交媒體
  • • 等等

這些任務以前每個都要花我半小時到幾小時,現在幾分鐘就能完成。順便說一下,我這幾個 skills 都是開源的:https://github.com/JimLiu/baoyu-skills

現階段的挑戰

但 Agent 目前仍處於早期階段,主要挑戰有:

  1. 1. 門檻較高:目前這些能力主要在極客圈子裏流行,普通用戶上手困難
  2. 2. 安全問題:Agent 需要較高的系統權限才能工作,這帶來了安全風險。比如惡意的 Skill 可能竊取數據、攻擊系統
  3. 3. 可靠性:Agent 有時會“跑偏”,需要人工干預

這些問題都在被逐步解決。大廠密集入場,本質上是看到了 Agent 的巨大潛力,想要搶佔生態位。誰能率先建立起最多用戶的 Agent 客戶端和豐富的 Skills 生態,誰就能在下一階段佔據優勢。

就像現在 Anthropic 就依賴 Claude Code 搶佔了先機和用戶心智,大家想到 Coding Agent 先想到 Claude Code,MCP、Skills 的標準也是他們提出來的,開發者們爭先恐後的基於他們的標準在構建 Agent 生態。

3、通用類 AI Agent 和垂直類 AI Agent,您更看好哪個的商業前景?

這個問題需要換個角度來理解。

Agent 本身難以形成垂直壁壘

從技術角度看,Agent 本身沒有任何秘密,就像我前面說的,它從技術角度看就是一個循環調用工具的大語言模型。

而模型對所有人來說都是一樣的:要麼花錢用商業模型(OpenAI、Anthropic、豆包、阿里),要麼用 DeepSeek 這樣的開源模型。這就像選操作系統,你用 Windows 還是 Linux,大家都能用。

所以,單純做一個垂直領域的 Agent 很難建立護城河。你今天能做,別人明天也能做,而且可能做得更好。

真正的機會在哪裏?

打個比方:Agent 就像操作系統,無論是通用領域還是垂直領域,操作系統本身都差不多。真正的差異化,是基於操作系統之上的應用。

垂直領域真正的機會在於:

  1. 1. 獨有的數據:你有別人沒有的行業數據、客戶數據、知識庫
  2. 2. 專業的 Skills:針對特定行業流程打造的工具和工作流
  3. 3. 深度的集成:與行業內已有系統的對接能力
  4. 4. 領域 Know-how:對行業痛點和流程的深刻理解

舉個例子:一個醫療領域的 Agent 產品,核心競爭力不是“Agent”這層,而是背後接入的醫學知識庫、與醫院 HIS 系統的對接、對診療流程的理解、以及多年積累的脱敏病例數據。

所以我的結論是:不要去做“垂直 Agent”,而是用通用 Agent 的能力,去解決垂直領域的問題。 護城河不在 Agent 這層,在你圍繞 Agent 構建的數據、工具和行業理解。

垂直領域的護城河

以上是我基於一線實踐的觀察和思考,僅供參考。