後OpenClaw時代!國產Agent模型憑「高配低價」叫板Opus 4.6
整理版優先睇
SkyClaw-v1.0 以低價提供接近頂級 Agent 能力,切中後 OpenClaw 時代市場痛點
呢篇文章由編輯部撰寫,介紹咗崑崙萬維旗下天工 AI 最新發布嘅 SkyClaw-v1.0 智能體模型。文章背景係 OpenClaw 熱潮後,Agent 概念普及,但市場上性能強嘅模型成本高,用得平嘅又唔夠強,而且好多封閉生態。作者想解決嘅問題係:有無一款 Agent 模型可以同時做到高性能、低門檻同高性價比?整體結論係 SkyClaw-v1.0 做到咗,佢喺基準測試上超越 DeepSeek V4 Flash 等模型,性能逼近 Claude Opus 4.6,但定價只有主流模型一半甚至更低,而且易用性極高,支援多個平台即開即用。
文章從三個維度拆解呢款產品:Agent 能力方面,SkyClaw-v1.0 喺 PinchBench、Claw-Eval 等測試中表現突出,實際應用如生成網頁遊戲同製作 PPT+視頻都流暢穩定;使用門檻方面,用戶可以喺 Skywork 平台一鍵使用,或者通過 apifree.ai 免費調用 API,Nanobot 已率先適配;性價比方面,定價顯著低於 Minimax 2.7、Qwen 3.6 等主流模型。呢三張牌直指市場核心矛盾,提供一個均衡嘅選擇。
實測環節通過 Claude Code 接入 SkyClaw-v1.0,測試咗貪吃蛇遊戲開發同「地球四大洋海底生態視頻+PPT」複合任務,模型都能快速理解需求、執行多步驟、遇到錯誤自行修正。技術拆解揭示訓練流程分三階段:高質量 OpenClaw 模…
- SkyClaw-v1.0 喺 Agent 基準測試上超越 DeepSeek V4 Flash 等模型,性能直逼 Claude Opus 4.6 等頂級閉源模型。
- 定價只有主流模型一半甚至更低,大幅降低中小開發者同企業使用 Agent 嘅成本門檻。
- 易用性高:支援 Skywork 平台、apifree.ai API 同 Nanobot 框架,無需重新搭建工作流即可調用。
- 技術訓練採用「環境構建→大規模監督微調→強化學習」三階段流程,確保真實場景可用性同泛化能力。
- 實測顯示模型喺遊戲生成同複雜多步驟任務(如跨格式內容創作)都表現出色,具備真正生產力工具價值。
天工平台
SkyClaw-v1.0 限時免費體驗位置
SkyClaw-v1.0 項目地址
官方項目頁面包含模型介紹、文檔同基準測試結果
apifree.ai API 地址
透過 apifree.ai 註冊賬號即可免費調用 SkyClaw-v1.0 API
後 OpenClaw 時代嘅 Agent 戰局
今年最出圈嘅 AI 應用一定係 OpenClaw,佢將智能體概念從開發者圈子推向大眾,令普通用戶第一次感受到 Agent 做得到啲咩。但熱潮過後,行業焦點就落到「邊個嘅 Agent 做得更好、更容易上手、更負擔得起」呢啲關鍵變量上。
國內已經有玩家率先落子。崑崙萬維旗下嘅天工 AI 今日發布 SkyClaw-v1.0 智能體模型,專為 OpenClaw、Claude Code、Hermes、Nanobot 等主流框架深度優化,同時仲推出輕量化版本 SkyClaw-v1.0-lite,瞄準高頻調用同成本敏感場景。
SkyClaw-v1.0 嘅訓練任務來源於用戶實際操作場景,而唔係實驗室數據
三張牌:能力、門檻、性價比
SkyClaw-v1.0 從三個維度打出組合拳,直指當前 Agent 模型市場嘅核心矛盾。
- Agent 能力要強:喺主流基準 PinchBench、Claw-Eval 同內部開發嘅 Skywork-Claw-Bench 上,表現均優於 Minimax 2.7、DeepSeek V4 Flash 同 Qwen 3.6 系列;喺 OpenClaw 任務上性能逼近 DeepSeek V4 Pro、Claude Opus 4.6 同 Qwen 3.6 Plus。
- 使用門檻要低:用戶可以喺 Skywork 平台一鍵選擇模型,或者透過 apifree.ai 註冊賬號免費調用 API;Nanobot 已率先完成適配,後續仲會上線 OpenRouter。
- 性價比要高:定價顯著低於 Minimax 2.7 同 Qwen 3.6 系列,只有佢哋一半甚至更低。
性能強的用不起,用得起的不夠強,好用的生態封閉
呢三張牌同時從能力、成本同易用性畀出一個相對均衡嘅解,正正係市場最稀缺嘅選項。
一手實測:快與準並重
我哋透過 Claude Code 調用 SkyClaw-v1.0 進行測試,接入過程非常絲滑,配置好 API Key 就即刻用得。
- 貪吃蛇遊戲:僅用 33 秒完成單文件網頁版開發,包含完整遊戲邏輯同計分系統;追加進階需求「隨機獎勵,食到蛇身邊長三格」都好快實現。
- 打包成 Windows EXE:要求將遊戲改為多巴胺色系,模型自主定義 12 種高飽和色彩 CSS 變量,採用 Electron 方案完成打包;遇到報錯識讀懂日誌,換打包器繞過環境限制。
- 複合任務:製作分別介紹四大洋海底生態嘅 10 秒視頻,然後嵌入 PPT 並自動生成解說詞。模型生成四段風格統一嘅視頻,PPT 排版完整,解說詞與畫面匹配度高。
從理解需求、調用工具、遇錯自修到完整跑通多步驟任務
技術拆解:三階段訓練出頂級 Agent
SkyClaw-v1.0 嘅亮眼成績離不開一套系統化訓練流程,涵蓋環境構建、中期訓練與監督微調、強化學習三個階段。
- 1 搭建高質量訓練環境:建立高複雜度嘅模擬 OpenClaw 環境,內置豐富工具同技能;分析真實用戶行為,合成貼近需求嘅複雜任務。
- 2 大規模中期訓練與監督微調:合成海量高質量數據,建立嚴格過濾機制,考核答案正確性之餘仲回溯評估完整解題軌跡;進行大量數據配比實驗找出最優組合。
- 3 強化學習提升泛化能力:利用環境端到端探索與反饋進行強化學習,確保模型喺不同框架同陌生任務下保持穩定。
環境構建解決「用什麼數據來練」,中期訓練和 SFT 解決「如何練出基礎能力」
呢套技術路徑圍繞「真實智能體場景下嘅可用性」呢個目標,實現數據、訓練與優化嘅貫通。
Agent 落地嘅新選擇
OpenClaw 熱度會消退,但 Agent 作為 AI 發展嘅重要方向唔會變。上週谷歌 I/O 大會上智能體成為主角,Gemini Spark 直接對標 OpenClaw,釋放出巨頭加速消費級落地嘅信號。
但現實係,頂級 Agent 能力幾乎被海外御三家壟斷,高昂成本令中小開發者卻步。Agent 嘅瓶頸唔喺技術天花板,而喺落地門檻。SkyClaw-v1.0 嘅發布切中呢個痛點:以接近 Claude Opus 4.6 嘅性能,定價只有一半。
以前因預算有限只能用輕量模型「湊合跑」嘅開發者,而家可以用同樣成本調用到接近頂級水平

今年最爆紅嘅 AI 應用係咩?OpenClaw 一定係走唔甩嘅答案。
回望返二三月嗰陣,「養蝦」一度成為社交貨幣。但佢嘅意義遠遠唔止係一個爆款應用:OpenClaw 真正將智能體概念由開發者圈層推向大眾視野,令普通用戶第一次親身感受到 Agent 到底做到啲乜。
當更加多人開始理解 Agent 嘅價值之後,行業嘅焦點自然就進入咗下一階段:邊間嘅 Agent 做得更好、上手更容易同埋更負擔得起。呢啲先係決定 Agent 生態走向嘅關鍵變數。
邊個能夠喺呢個節點完成轉型,就可以喺「後 OpenClaw 時代」搶佔先機。事實上,國內已經有玩家率先落子。
就喺今日,崑崙萬維旗下嘅天工 AI(Skywork)全新發布咗 SkyClaw-v1.0 智能體模型,成為佢哋長期深耕雲端助理嘅另一個里程碑,亦都開始由助手形態向智能體基座模型嘅架構升級。
作為一款專為 OpenClaw、Claude Code、Hermes、Nanobot 等主流智能體框架深度優化嘅基座模型,SkyClaw-v1.0 模型喺底層能力上實現咗質嘅提升,工具調用精度更準、多輪任務執行更穩、長鏈路推理更優,可以更好地適應真實場景中複雜、動態嘅智能體工作流。
與此同時,Skywork 仲同步上線咗 SkyClaw-v1.0-lite。呢個輕量化版本瞄準咗高頻調用同成本敏感場景,喺保持核心智能體能力嘅同時,大幅優化咗推理速度同資源開銷,為開發者提供咗一個更靈活嘅部署選擇。
兩款模型喺 X 上搶先亮相之後,熱度持續上升。

Nanobot 官方出文,「好開心能夠同 Skywork 聯手推出 SkyClaw-v1.0!期待見到各位開發者用佢創造出無限可能。」

唔少海外活躍 AI 博主對佢評價好高,「SkyClaw-v1.0 嘅訓練任務來源於用戶嘅實際操作場景,而唔係通用嘅實驗室數據。佢喺基準測試上超越咗 DeepSeek V4 Flash 等模型,穩定性經過咗多次驗證。呢個先係打造真正喺實際場景中好用模型嘅方式。」

「基準測試之爭完結咗。SkyClaw-v1.0 登場,乾淨利落地贏曬所有。」

目前,SkyClaw-v1.0 兩款模型限時免費開放體驗,並已經喺 5 月 22 日接入咗 Skywork 平台。

天工地址:tiangong.cn
SkyClaw-v1.0 項目地址:https://skyworkai.github.io/skyclaw/
apifree.ai API 地址:https://www.apifree.ai/model/skywork-ai/skyclaw-v1?tab=api
打出呢三張牌
好難唔揀佢
從產品層面睇,SkyClaw-v1.0 的確拎出咗有說服力嘅嘢,具體可以拆成三個維度嚟睇:Agent 能力、使用門檻同性價比。
首先,Agent 能力要強。
根據 Skywork 嘅官方結果,喺主流智能體基準以及內部開發嘅 Claw 任務評估入面,包括 PinchBench、Claw-Eval Pass^3 同 Skywork-Claw-Bench(基於 OpenClaw 構建嘅內部智能體評估套件),SkyClaw-v1.0 同 SkyClaw-v1.0-lite 嘅表現都優於 Minimax 2.7、DeepSeek V4 Flash 同 Qwen 3.6 35B A3B/27B 模型。
另外,喺 OpenClaw 相關任務上,SkyClaw-v1.0 嘅性能逼近更大規模嘅開閉源模型,包括 DeepSeek V4 Pro、Claude Opus 4.6 同 Qwen 3.6 Plus。

跑分亮眼之外,SkyClaw-v1.0 喺實際應用場景中表現驚豔。
喺交互式網頁同遊戲生成方面,佢能夠輸出功能齊全嘅網頁應用,從物理模擬到完整嘅遊戲。結果唔單止渲染正確、動畫流暢,用戶交互處理得都恰到好處。

賓果消消樂
喺深度研究與數據可視化方面,SkyClaw-v1.0 展現咗超越單純代碼生成嘅綜合能力:佢能夠自主研究現實世界課題,從多個來源收集並交叉驗證數據,最終將分析結果整合為交互式、達到出版級質量嘅儀錶板同報告。
可以話,SkyClaw-v1.0 唔單止喺評測榜單上跑出咗好成績,仲喺真實場景中證明咗自己做為生產力工具嘅實際價值。
其次,門檻要低。
對於用戶嚟講,上手 SkyClaw-v1.0 幾乎冇額外嘅學習成本,按需要選擇使用渠道。喺 Skywork 平台,一鍵選擇模型就可以用。另外,通過 AI 模型聚合服務平台 apifree.ai 註冊賬號並創建 APIKey,就可以免費調用。
生態適配亦都好完善。Nanobot 已經率先完成對 SkyClaw-v1.0 嘅適配,之後仲會上線 OpenRouter。隨住更多平台嘅接入,開發者將能夠喺自己熟識嘅工具鏈中直接調用模型,唔使重新搭建一套工作流。

喺 nanobot 入面,只需填寫 API 密鑰就可以使用 SkyClaw-v1.0。
最後,性價比要高。
SkyClaw-v1.0 嘅定價明顯低過目前主流 Agent 模型。同 Minimax 2.7 同 Qwen 3.6 系列模型相比,定價只係佢哋嘅一半甚至更低。

SkyClaw-v1.0 打出嘅呢幾張牌,直指當前 Agent 模型市場嘅核心矛盾:性能強嘅用唔起,用得起嘅唔夠強,好用嘅生態封閉。佢同時從能力、成本同易用性三個層面俾出咗一個相對均衡嘅解,呢個正係當前市場最稀缺嘅選項。
一手實測
拿捏住咗「快與準」
接下來,我哋通過 Claude Code 嚟調用今次嘅 SkyClaw-v1.0,上手進行咗一啲測試。接入過程非常順暢,配置好 API Key 就可以直接跑。
先做一個小遊戲:貪吃蛇。

SkyClaw-v1.0 只用咗 33 秒就完成咗單文件網頁版嘅基礎開發,唔單止包含完整嘅遊戲邏輯、計分系統,而且運行流暢。

再加進階需求:「喺遊戲中增加隨機獎勵,食到之後蛇身邊長三格」

依然非常快速,系統喺普通食物嘅基礎上增加咗一個有 25% 概率掉落嘅金色星星獎勵。
接下來,叫 SkyClaw-v1.0 將呢個遊戲打包成 Windows 桌面可以獨立運行嘅 EXE 應用,並附加要求:「色系改成多巴胺色」。呢個階段嘅測試能夠好好反映 Agent 喺面對涉及環境依賴嘅複雜工程以及除錯時嘅真實能力。
喺 UI 需求上,自主定義咗包含 12 種高飽和色彩嘅 CSS 變量,落實咗「多巴胺色系」嘅設計。
喺打包環節,採用咗 Electron 方案,完成咗工程腳手架搭建及依賴安裝。
喺異常處理方面,遇到報錯唔會陷入死循環,睇得明報錯日誌,並嘗試改變配置(從一個打包器換到另一個)嚟繞過環境限制。
再換一個真實辦公場景,今次需求唔係單一格式嘅,咁就考驗到模型可唔可以同時輸出文檔、PPT 同影片,以及執行任務過程入面嘅全局規劃同跨格式協調能力。
今次,我哋直接喺 Skywork 入面調用 SkyClaw-v1.0,俾佢一個有難度嘅複合任務。
叫佢「製作分別介紹地球四大洋嘅海底生態影片(每個 10 秒),影片生成後將佢作為中間素材,構建一份全球海洋科普專題 PPT。要求將呢 4 段影片嵌入到對應嘅 PPT 頁面中,並喺影片旁邊配上基於影片內容自動生成嘅專業解說詞。」
喺成個執行鏈路中,模型需要先生成四段風格統一嘅影片素材,再將影片作為輸入反饋到 PPT 製作中,最後根據影片內容自動撰寫解說詞。前後環環相扣,任何一步執行唔到位都可能令最終結果用唔到。

從結果睇,包括影片生成質量、PPT 排版完整度以及解說詞同影片畫面嘅匹配程度,SkyClaw-v1.0 都表現得面面俱到。
放上一段生成嘅「太平洋海底珊瑚生態」影片,大家感受嚇效果:
完整 PPT 效果如下:

兩個案例試落嚟,我哋發現,由理解需求、調用工具、遇錯自修以及完整跑通多步驟任務呢啲能力睇,SkyClaw-v1.0 以遠低於行業嘅價格,交付咗接近頂流嘅 Agent 體驗。
技術拆解
三步練出一個頂級 Agent
SkyClaw-v1.0 之所以能夠喺評測同實戰中交出亮眼成績,離唔開一套系統化嘅訓練流程。成個過程涵蓋環境構建、中期訓練與監督微調、強化學習三個階段,層層遞進,構成一條完整嘅能力鏈路。
首先是搭建高質量嘅訓練環境。
團隊構建咗一個高複雜度嘅模擬 OpenClaw 環境,入面內置咗豐富嘅高質量工具同技能,俾模型探索調用。
唔單止咁,團隊仲深入分析咗真實用戶喺類似 OpenClaw 環境下嘅實際任務行為,並結合線上高頻技能嘅使用數據同反饋,梳理出工具之間嘅關係圖譜。基於呢張圖譜,合成大量貼近真實用戶需求嘅複雜任務,確保模型由訓練階段就接觸到夠真實同複雜嘅場景。
有咗環境基礎,下一步係大規模嘅中期訓練與監督微調。
依託上面經過充分驗證嘅訓練環境,團隊合成咗海量高質量訓練數據。而為咗把關數據質量,團隊建立咗嚴格嘅過濾同評估機制,喺考核最終答案正確性嘅同時,仲會回溯評估模型完成任務嘅完整軌跡,確保解題過程本身都係合理高效嘅。
另外,團隊進行咗大量數據配比實驗,揾到智能體任務訓練數據嘅最優組合。
最後,團隊通過強化學習進一步打磨模型嘅泛化能力。
由於自建嘅 OpenClaw 環境天然支持端到端嘅探索同反饋,模型可以喺其中進行充分嘅強化學習訓練。呢個階段嘅核心目標,除咗確保模型喺特定任務上表現出色,佢喺唔同智能體框架同陌生任務場景下都要保持穩定嘅泛化能力。
整體睇,SkyClaw-v1.0 採用嘅呢套技術路徑,冇依賴單點突破,而係圍繞「真實智能體場景下嘅可用性」呢個目標,實現咗數據、訓練同優化嘅貫通。
環境構建解決「用咩數據嚟練」,中期訓練同 SFT 解決「點樣練出基礎能力」,強化學習解決「點樣進一步提升性能上限同泛化性」。
寫喺最後
好似之前所有 AI 熱點咁,OpenClaw 經歷咗正常嘅波動起伏。雖然熱度會退,但趨勢唔會。Agent 作為當前 AI 發展最重要嘅方向之一,佢嘅地位喺短時間內唔會改變。
上個禮拜嘅 Google I/O 大會係好好嘅例證,智能體成為貫穿全場嘅主角,Gemini Spark 嘅亮相更加係直接對標 OpenClaw。呢個釋放出一個清晰嘅信號:巨頭們正喺度加速 Agent 技術嘅消費級落地。
喺咁嘅行業背景下,「一個真正好用又用得過嘅 Agent」勢必會成為市場嘅搶手貨。但現實係,頂級 Agent 能力幾乎被海外御三家(Anthropic、OpenAI 同 Google)嘅少數閉源模型壟斷,高昂嘅調用成本令大量中小開發者同企業卻步。
換句話講,Agent 嘅瓶頸唔喺技術天花板,而喺落地門檻。SkyClaw-v1.0 嘅發布,正中呢個痛點。
佢以接近 Claude Opus 4.6 等閉源頂流嘅 Agent 性能,定價卻只有主流模型嘅一半。結果就係,一個之前因為預算有限只能用輕量模型「求其跑嚇」嘅開發者,依家可以用同樣嘅成本調用到接近頂級水平嘅 Agent 能力。
回望返,今次新發布係崑崙萬維喺 AI 領域長期佈局嘅又一個階段性成果。自 2022 年確立「All in AGI 與 AIGC」戰略之後,崑崙萬維基於自主研發嘅全球領先大模型基座,已經構建起短劇同 AI 短劇平台、AI 音樂、AI 遊戲、AI SuperAgent、AI 社交五大核心產品矩陣。
其中喺 Agent 領域,崑崙萬維喺今年一、二月先後發布咗 Skywork Super Agents Video v1.0、天工 Skywork 桌面版及 SkyClaw 雲端智能體。桌面版實現全本地化運行,唔使上傳數據就可以處理多格式內容;SkyClaw 集成 70 幾項技能,支持跨設備多端監控。
SkyClaw-v1.0 能夠做到高性能同低成本兼顧,同崑崙萬維喺模型、應用同生態層面嘅長期積累密不可分。
當 Agent 賽道由狂歡期進入冷靜期,最後能夠留喺牌桌上嘅,一定係基本功做得最紮實嗰一個。SkyClaw-v1.0 交出嘅呢份答卷,正係崑崙萬維對呢個判斷最有力嘅回應。
© THE END
轉載請聯繫本公眾號獲得授權
投稿或尋求報道:liyazhou@jiqizhixin.com

今年最出圈的 AI 應用是什麼?OpenClaw 一定是繞不開的答案。
回過頭看二三月份,「養蝦」一度成為流行的社交貨幣。但它的意義遠不止是一款爆款應用:OpenClaw 真正將智能體概念從開發者圈層推向了大眾視野,讓普通用戶第一次直觀感受到 Agent 到底能做什麼。
當更多人開始理解 Agent 的價值之後,行業的焦點也自然進入到了下一階段:誰家的 Agent 做得更好、上手起來更容易以及更能負擔得起。這些才是決定 Agent 生態走向的關鍵變量。
誰能在這一節點完成轉型,就能在「後 OpenClaw 時代」搶佔先機。事實上,國內已經有玩家率先落子。
就在今日,崑崙萬維旗下的天工 AI(Skywork)全新發布了 SkyClaw-v1.0 智能體模型,成為其長期深耕雲端助理的又一里程碑,也開始了從助手形態向智能體基座模型的架構升級。
作為一款專為 OpenClaw、Claude Code、Hermes、Nanobot 等主流智能體框架深度優化的基座模型,SkyClaw-v1.0 模型在底層能力上實現了質的提升,工具調用精度更準、多輪任務執行更穩、長鏈路推理更優,能夠更好地適配真實場景中複雜、動態的智能體工作流。
與此同時,Skywork 還同步上線了 SkyClaw-v1.0-lite。這一輕量化版本瞄準了高頻調用和成本敏感場景,在保持核心智能體能力的同時,大幅優化了推理速度與資源開銷,為開發者提供了一個更靈活的部署選擇。
兩款模型在 X 上搶先亮相以來,熱度持續走高。

Nanobot 官方發文,「很高興能與 Skywork 攜手推出 SkyClaw-v1.0!期待看到各位開發者用它創造出無限可能。」

不少海外活躍 AI 博主對它評價頗高,「SkyClaw-v1.0 的訓練任務來源於用戶的實際操作場景,而不是通用的實驗室數據。它在基準測試上超越了 DeepSeek V4 Flash 等模型,穩定性經過了多次驗證。這才是打造真正能在實際場景中好用模型的方式。」

「基準測試之爭結束了。SkyClaw-v1.0 登場,乾淨利落地贏下了所有。」

目前,SkyClaw-v1.0 兩款模型限時免費開放體驗,並已在 5 月 22 日接入到了 Skywork 平台。

天工地址:tiangong.cn
SkyClaw-v1.0 項目地址:https://skyworkai.github.io/skyclaw/
apifree.ai API 地址:https://www.apifree.ai/model/skywork-ai/skyclaw-v1?tab=api
打出這三張牌
很難不選擇它
從產品層面來看,SkyClaw-v1.0 確實拿出了有說服力的東西,具體可以拆成三個維度來看:Agent 能力、使用門檻和性價比。
首先,Agent 能力要強。
根據 Skywork 的官方結果,在主流智能體基準以及內部開發的 Claw 任務評估中,包括 PinchBench、Claw-Eval Pass^3 和 Skywork-Claw-Bench(基於 OpenClaw 構建的內部智能體評估套件),SkyClaw-v1.0 和 SkyClaw-v1.0-lite 的表現均優於 Minimax 2.7、DeepSeek V4 Flash 和 Qwen 3.6 35B A3B/27B 模型。
另外,在 OpenClaw 相關任務上,SkyClaw-v1.0 的性能逼近更大規模的開閉源模型,包括 DeepSeek V4 Pro、Claude Opus 4.6 和 Qwen 3.6 Plus。

跑分亮眼之外,SkyClaw-v1.0 在實際應用場景中表現驚豔。
在交互式網頁與遊戲生成方面,它能夠輸出功能齊全的網頁應用,從物理模擬到完整的遊戲。結果不僅渲染正確、動畫流暢,用戶交互處理得也恰到好處。

賓果消消樂
在深度研究與數據可視化方面,SkyClaw-v1.0 展現出了超越單純代碼生成的綜合能力:它能夠自主研究現實世界課題,從多個來源收集並交叉驗證數據,最終將分析結果整合為交互式、達到出版級質量的儀表盤和報告。
可以說,SkyClaw-v1.0 不只是在評測榜單上跑出了好成績,也在真實場景中證明了自己作為生產力工具的實際價值。
其次,門檻要低。
對於用戶來說,上手 SkyClaw-v1.0 幾乎沒有額外的學習成本,按需選擇使用渠道。在 Skywork 平台,一鍵選擇模型即可使用。另外,通過 AI 模型聚合服務平台 apifree.ai 註冊賬號並創建 APIKey,就能免費調用。
生態適配也很完善。Nanobot 已經率先完成對 SkyClaw-v1.0 的適配,後續還將上線 OpenRouter。隨着更多平台的接入,開發者將能夠在自己熟悉的工具鏈中直接調用模型,無需重新搭建一套工作流。

在 nanobot 中,只需填入 API 密鑰即可使用 SkyClaw-v1.0。
最後,性價比要高。
SkyClaw-v1.0 的定價顯著低於當前主流 Agent 模型。與 Minimax 2.7 和 Qwen 3.6 系列模型相比,定價僅為它們的一半甚至更低。

SkyClaw-v1.0 打出的這幾張牌,直指當前 Agent 模型市場的核心矛盾:性能強的用不起,用得起的不夠強,好用的生態封閉。它同時從能力、成本和易用性三個層面給出了一個相對均衡的解,這恰恰是當前市場最稀缺的選項。
一手實測
拿捏住了「快與準」
接下來,我們通過 Claude Code 來調用此次的 SkyClaw-v1.0,上手進行了一些測試。接入過程非常絲滑,配置好 API Key 就能直接跑。
先來做一個小遊戲:貪吃蛇。

SkyClaw-v1.0 僅用時 33s 就完成了單文件網頁版的基礎開發,不僅包含了完整的遊戲邏輯、計分系統,並且運行流暢。

再追加進階需求:「在遊戲中增加隨機獎勵,吃到蛇身邊長三格」

依然非常快速,系統在普通食物的基礎上增加了一個有 25% 概率掉落的金色星星獎勵。
接下來,讓 SkyClaw-v1.0 把這個遊戲打包成 Windows 桌面可獨立運行的 EXE 應用,並附帶要求:「色系改成多巴胺色」。這一階段的測試能夠很好地反映 Agent 在面對涉及環境依賴的複雜工程以及排錯時的真實能力。
在 UI 需求上,自主定義了包含 12 種高飽和色彩的 CSS 變量,落實了「多巴胺色系」的設計。
在打包環節,採用了 Electron 方案,完成了工程腳手架搭建及依賴安裝。
在異常處理方面,遇到報錯不陷入死循環,能讀懂報錯日誌,並嘗試改變配置(從一個打包器換到另一個)來繞過環境限制。
接下來換一個真實辦公場景,這時需求不是單一格式的,這就考驗到了模型能不能同時輸出文檔、PPT 和視頻,以及執行任務過程中的全局規劃與跨格式協調能力。
這一次,我們直接在 Skywork 中調用 SkyClaw-v1.0,給它一個有難度的複合任務。
讓它「製作分別介紹地球四大洋的海底生態視頻(每個 10 秒),視頻生成後將其作為中間素材,構建一份全球海洋科普專題 PPT。要求將這 4 段視頻嵌入到對應的 PPT 頁面中,並在視頻旁配上基於視頻內容自動生成的專業解說詞。」
在整個執行鏈路中,模型需要先生成四段風格統一的視頻素材,再把視頻作為輸入反哺到 PPT 製作中,最後根據視頻內容自動撰寫解說詞。前後環環相扣,任何一步執行不到位可能都會導致最終結果不可用。

從結果來看,包括視頻生成質量、PPT 排版完成度以及解說詞與視頻畫面的匹配程度,SkyClaw-v1.0 都表現得面面俱到。
放上一段生成的「太平洋海底珊瑚生態」視頻,大家感受一下效果:
完整 PPT 效果如下:

兩個案例測下來,我們發現,從理解需求、調用工具、遇錯自修以及完整跑通多步驟任務等能力來看,SkyClaw-v1.0 以遠低於行業的價格,交付出了接近頂流的 Agent 體驗。
技術拆解
三步練出一個頂級 Agent
SkyClaw-v1.0 之所以能在評測與實戰中交出亮眼成績,離不開一套系統化的訓練流程。整個過程涵蓋環境構建、中期訓練與監督微調、強化學習三個階段,層層遞進,構成了一條完整的能力鏈路。
首先是搭建高質量的訓練環境。
團隊構建了一個高複雜度的模擬 OpenClaw 環境,其中內置了豐富的高質量工具和技能,以供模型探索調用。
不僅如此,團隊還深入分析了真實用戶在類 OpenClaw 環境下的實際任務行為,並結合線上高頻技能的使用數據和反饋,梳理出工具之間的關係圖譜。基於這張圖譜,合成大量貼近真實用戶需求的複雜任務,確保模型從訓練階段就接觸到足夠真實與複雜的場景。
有了環境基礎,接下來是大規模的中期訓練與監督微調。
依託上面經過充分驗證的訓練環境,團隊合成了海量高質量訓練數據。而為了把控數據質量,團隊建立了嚴格的過濾和評估機制,在考核最終答案正確性的同時,還會回溯評估模型完成任務的完整軌跡,確保解題過程本身也是合理高效的。
另外,團隊進行了大量數據配比實驗,找到智能體任務訓練數據的最優組合。
最後,團隊通過強化學習進一步打磨模型的泛化能力。
由於自建的 OpenClaw 環境天然支持端到端的探索與反饋,模型能夠在其中進行充分的強化學習訓練。這一階段的核心目標,除了確保模型在特定任務上表現出色,其在不同智能體框架和陌生任務場景下也要保持穩定的泛化能力。
整體來看,SkyClaw-v1.0 採用的這套技術路徑,沒有依賴單點突破,而是圍繞「真實智能體場景下的可用性」這一目標,實現了數據、訓練與優化的貫通。
環境構建解決「用什麼數據來練」,中期訓練和 SFT 解決「如何練出基礎能力」,強化學習解決「如何進一步提升性能上限和泛化性」。
寫在最後
如同此前所有 AI 熱點一樣,OpenClaw 經歷了正常的波動起伏。雖然熱度會消退,但趨勢不會。Agent 作為當前 AI 發展最重要的方向之一,其地位在短時間內不會改變。
上週的谷歌 I/O 大會是很好的例證,智能體成為貫穿全場的主角,Gemini Spark 的亮相更是直接對標 OpenClaw。這釋放出了一個清晰的信號:巨頭們正在加速 Agent 技術的消費級落地。
在這樣的行業背景下,「一個真正好用且用得起的 Agent」勢必將成為市場的香餑餑。但現實是,頂級 Agent 能力幾乎被海外御三家(Anthropic、OpenAI 和谷歌)的少數閉源模型壟斷,高昂的調用成本導致大量中小開發者和企業望而卻步。
換句話說,Agent 的瓶頸不在技術天花板,在於落地門檻。SkyClaw-v1.0 的發佈,切中了這一痛點。
它以接近 Claude Opus 4.6 等閉源頂流的 Agent 性能,定價卻只有主流模型的一半。結果就是,一個此前因預算有限只能用輕量模型「湊合跑」的開發者,現在可以用同樣的成本調用到接近頂級水平的 Agent 能力。
回過頭看,此次新發布是崑崙萬維在 AI 領域長期佈局的又一階段性成果。自 2022 年確立「All in AGI 與 AIGC」戰略以來,崑崙萬維基於自主研發的全球領先大模型基座,已構建起短劇和 A I 短劇平台、AI 音樂、AI 遊戲、AI SuperAgent、AI 社交五大核心產品矩陣。
其中在 Agent 領域,崑崙萬維在今年一、二月先後發佈了 Skywork Super Agents Video v1.0、天工 Skywork 桌面版及 SkyClaw 雲端智能體。桌面版實現全本地化運行,無需上傳數據即可處理多格式內容;SkyClaw 集成 70 餘項技能,支持跨設備多端監控。
SkyClaw-v1.0 能夠做到高性能與低成本兼顧,與崑崙萬維在模型、應用和生態層面的長期積累密不可分。
當 Agent 賽道從狂歡期進入冷靜期,最後能留在牌桌上的,一定是把基本功做得最紮實的那一個。SkyClaw-v1.0 交出的這份答卷,正是崑崙萬維對這一判斷最有力的回應。
© THE END
轉載請聯繫本公眾號獲得授權
投稿或尋求報道:liyazhou@jiqizhixin.com