誰說谷歌Antigravity不好用?我用Skill-Creator構建百萬字知識庫Skill

作者:草莓派
日期:2026年2月14日 上午5:00
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Skill-Creator配合Antigravity IDE,成功構建一個能處理百萬字文檔嘅本地知識庫Skill,全程由AI自動完成

整理版摘要

呢篇文章嘅作者係一位開發者,佢分享咗點樣用Antigravity IDEAnthropic官方嘅Skill-Creator嚟建立一個可以處理百萬字文檔嘅本地知識庫Skill。佢嘅目標係要整一個能夠處理txt、pdf、docx格式嘅知識庫,用DeepSeek API做向量化同問答,並且確保可以安全處理超大文件,避免一次性載入內存。

作者揀咗AntigravityManager模式,輸入初始指令後,AI自動生成技能框架,並喺過程中遇到ChromaDB衝突時自行改用自研嘅TinyVectorStore,展現出強大嘅問題解決能力。最終嘅SKILL.md包含ingest_file同ask_kb兩個動作,指定要用分批方式處理文件。作者用近50萬字嘅長篇小說做測試,將中文字符換算成tokens後接近100萬tokens,成功入庫之後,問咗一個原作冇但衍生作品有嘅問題,系統順利檢索到正確答案,證明佢唔係單純背書。

作者總結咗幾點經驗AntigravityClaude Opus 4.6額度少,用幾次就冇;Gemini 3 Pro表現不如Flash,後者反應更快更聰明;要建立「流」意識分批處理大數據,唔好一口氣讀曬;數據庫分片可提升效率,將不同書籍分開存儲;同埋Vibe Coding時注意版本控制。總體而言,呢個方法證明AI可以自主完成大部分技術工作,大幅度降低構建專業知識庫嘅門檻,值得一試。

  • 結論:用Antigravity IDE配合Skill-Creator可以自動化構建處理百萬字文檔嘅本地知識庫,AI能自主解決大部分技術障礙。
  • 方法:使用Manager模式輸入指令,讓AI按計劃執行;遇到依賴問題時,AI可以自行改寫向量庫(如將ChromaDB換成自研TinyVectorStore)。
  • 差異Antigravity中的Gemini 3 Pro(High)表現不如Gemini 3 Flash,後者更聰明反應更快;Claude Opus 4.6雖然好用但額度少。
  • 啟發:處理大規模數據必須建立「流」意識,所有環節都要分段分批處理;數據庫分片(Sharding)可以有效擴展查詢效能。
  • 可行動點:進行Vibe Coding時要做好版本控制;硬件環境受限時可以自建輕量級向量索引,避免依賴第三方庫。
值得記低
連結 github.com

Claude Skills官方倉庫

下載Anthropic官方嘅skills倉庫,包含skill-creator,係建立技能嘅起點。

整理重點

準備工作同初始設定

開始之前,作者先確保有正常運行嘅Antigravity IDE、硅基流動嘅API Key,同埋準備好長文本測試文檔。

作者揀咗Manager模式,因為佢更擅長規劃同執行任務,後續有問題可以叫agent自行調整。

首先下載Anthropic官方嘅Claude Skills倉庫,再將skill-creator放入工作區嘅.agent目錄下。具體步驟如下:

  • 下載Claude Skills:https://github.com/anthropics/skills
  • 喺指定工作區新建.agent目錄
  • Claude嘅skills文件夾copy到.agent目錄下
  • 喺對話框輸入初始指令
整理重點

構建長文本知識庫Skill嘅過程

作者喺Antigravity對話框輸入指令,要求skill-creator創建一個名為long-doc-kb嘅新技能,目標係處理百萬字文檔。指令中指定咗核心工具同功能要求。

AI喺執行過程中遇到ChromaDBDLL衝突,自行改用Python同NumPy自建TinyVectorStore,展現咗自主解決問題嘅能力。

經過幾輪優化,最終嘅SKILL.md包含ingest_file同ask_kb兩個動作,用DeepSeek API進行向量化同問答。

整理重點

測試入庫同檢索

作者用近50萬字嘅長篇小說做測試,將中文字符換算成tokens後接近100萬tokens。成功將文件切段存入TinyVectorStore,完成入庫。

為咗避免背書式回答,作者問咗一個原作冇但衍生作品有嘅問題,成功驗證RAG檢索嘅效果。

整體測試結果理想,證明呢個Skill可以處理大規模文檔嘅知識查詢,而且唔會單純背書。

整理重點

經驗總結

作者總結咗幾點重要經驗

處理百萬Token時必須建立起「流」嘅意識,分段分批處理係關鍵。

  • AntigravityClaude Opus 4.6額度太少,用幾次就冇;Gemini 3 Pro(High)表現不如Gemini 3 Flash。
  • 整個過程讓agent自行執行命令,遇到問題自行解決,幾乎唔需要人工幹預。
  • 如果硬件環境受限或依賴環境受阻,可以勇敢地自己寫向量索引。
  • 數據量大時,數據庫分片(Sharding)係高效嘅擴展方案,可以實現查詢時局部喚醒。

一、準備功夫

  1. 可以正常運行嘅Antigravity IDE

  2. 硅基流動嘅 API Key

  3. 準備好長文本嘅測試文檔


二、構建長文本知識庫 Skill 嘅過程

  1. 先下載 Claude Skills,地址:https://github.com/anthropics/skills

圖片

呢個係 Anthropic 官方推出嘅skills 倉庫,其中 skill-creator 可以指導你創建新嘅 Skill。跟住用 skill-creator 嚟生成長文本知識庫 skill

Antigravity 支援全局 Skills 同工作區 Skills

圖片

我哋將 Claude Skills 放喺工作區下面,喺指定嘅工作區入面新建 .agent 目錄,再將 Claude 嘅 skills 文件夾 copy 到 .agent 目錄底下。

  1. 喺 Antigravity 嘅對話框入面,輸入初始指令(建議用 Manager 模式,因為佢更擅長規劃同執行任務),之後有問題就畀 agent 自己調整

「請使用 skill-creator 為我創建一個名為 long-doc-kb 嘅新技能。

技能目標: 構建一個可以處理百萬字文檔(txt/pdf/docx)嘅本地知識庫。

核心工具:

1. 使用 kb_engine.py 腳本(我等陣會提供)作為執行核心。

2. 使用 DeepSeek API 進行向量化(Embedding)同最終問答。

功能要求:

1. 提供 ingest_file 動作,用嚟將文件切段同存入本地 ChromaDB。

2. 提供 ask_kb 動作,用嚟從庫入面搜索同回答問題。

3. 必須喺 SKILL.md 入面寫明:禁止一次過讀取整個超大文檔,必須分批處理。」

ChromaDB 因為環境入面 DLL 衝突,最後換咗做 python 同 numpy 庫自主研發嘅 TinyVectorStore 輕量級數據庫——呢啲都係 Agent 喺執行嘅過程中發現問題自行解決嘅。

圖片

Note:Claude Opus 4.6(Thinking)喺 Antigravity 裏面已經可以用得,但Claude Opus 4.5 已經用唔到。

圖片

兩分鐘之後,初始框架搭建好咗,跟住 agent 會自行優化

圖片
  1. 喺 Antigravity Terminal裏面手動安裝依賴包,或者直接俾 Agent 嚟安裝

pip install chromadb openai python-docx PyPDF2

  1. agent 已經將 kb_engine.py 嘅佔位腳本寫好,叫佢直接實現腳本

  2. 幾輪優化之後,可以直接用嘅 SKILL.md 如下:

圖片
  1. ingest 入庫測試

揾一篇近 50 萬字嘅長篇小說,將中文字元換算成 tokens 之後,總共嘅 tokens 接近 100 萬 tokens

圖片
  1. RAG 檢索測試

為咗避免背書式回答問題,問佢一個原作入面冇但係衍生作品入面有嘅問題

圖片

三、幾點總結

  1. Antigravity 裏面嘅 Claude Opus 4.6 額度太少,用幾次就冇曬

  2. Antigravity 裏面嘅 Gemini 3 Pro(High)冇 Gemini 3 flash 咁好用,後者用起上嚟更聰明同反應快,Pro 似乎降智比較多

  3. 成個過程中,叫 agent 自行執行命令,遇到問題就自己解決問題——佢會自己解決所有問題,幾乎唔需要人工幹預

  4. 如果硬件環境受限或者依賴環境受阻,請勇敢啲自己寫向量索引

  5. 喺處理百萬 Token 嗰陣,必須建立「流」嘅意識。由文件讀取到處理,再到 API 調用,凡是涉及大規模數據嘅環節,都必須可控咁進行「分段分批」

  6. 數據量大嗰陣,數據庫分片 Sharding 係高效嘅擴展方案。將唔同書籍、唔同時段嘅知識存做獨立文件,可以實現「查詢時局部喚醒」

  7. Vibe Coding 嗰陣請注意版本控制


一、準備工作

  1. 可以正常運行的Antigravity IDE

  2. 硅基流動的API Key

  3. 準備好長文本的測試文檔


二、構建長文本知識庫Skill的過程

  1. 先下載Claude Skills,地址:https://github.com/anthropics/skills

圖片

這是Anthropic 官方推出的skills 倉庫,其中skill-creator能指導你創建新的技Skill。接下來用skill-creator來生成長文本知識庫skill

Antigravity支持全局Skills和工作區Skills

圖片

我們將Claude Skills放在工作區下,在指定的工作區中新建.agent目錄,再將Claude的skills文件夾copy到.agent目錄下。

  1. 在 Antigravity 的對話框中,輸入初始指令(建議使用 Manager 模式,因為它更擅長規劃和執行任務),後續有問題讓agent自行調整

“請使用 skill-creator 為我創建一個名為 long-doc-kb 的新技能。

技能目標: 構建一個能處理百萬字文檔(txt/pdf/docx)的本地知識庫。

核心工具:

1. 使用 kb_engine.py 腳本(我稍後會提供)作為執行核心。

2. 使用 DeepSeek API 進行向量化(Embedding)和最終問答。

功能要求:

1. 提供 ingest_file 動作,用於將文件切段並存入本地 ChromaDB。

2. 提供 ask_kb 動作,用於從庫中搜索並回答問題。

3. 必須在 SKILL.md 中寫明:禁止一次性讀取整個超大文檔,必須分批處理。”

ChromaDB因為環境中DLL衝突最後換成了python和numpy庫自主研發的TinyVectorStore輕量級數據庫----這些都是Agent在執行的過程中發現了問題自行解決的。

圖片

Note: Claude Opus 4.6(Thinking)在Antigravity裏已經可以用了,但Claude Opus 4.5無法再用。

圖片

兩分鐘後,初始框架搭建好了,後續agent會自行優化

圖片
  1. 在Antigravity Terminal裏手動安裝依賴包或直接讓Agent來安裝

pip install chromadb openai python-docx PyPDF2

  1. agent已經將kb_engine.py的佔位腳本寫好,讓它直接實現腳本

  2. 幾輪優化後,可以直接使用的SKILL.md如下:

圖片
  1. ingest入庫測試

找一篇近50萬字的長篇小說,將中文字符換算成tokens之後,總的tokens接近100萬tokens

圖片
  1. RAG檢索測試

為了避免背書式回答問題,問它一個原作中沒有但衍生作品中有的問題

圖片

三、幾點總結

  1. Antigravity中的Claude Opus4.6額度太少,用幾次就沒了

  2. Antigravity中的Gemini 3 Pro(High)沒有Gemini 3 flash好用,後者用起來更聰明並且反應快,Pro似乎降智比較多

  3. 整個過程中,讓agent自行執行執行命令,遇到問題自行解決問題---它會自己解決所有問題,幾乎不需要人工干預

  4. 如果硬件環境受限或依賴環境受阻,請勇敢地自己寫向量索引

  5. 在處理百萬 Token 時,必須建立起“流”的意識。從文件讀取到處理,再到 API 調用,凡是涉及大規模數據的環節,都必須可控地進行“分段分批”

  6. 數據量大時,數據庫分片Sharding 是高效的擴展方案。將不同書籍、不同時段的知識存為獨立文件,可以實現“查詢時局部喚醒”

  7. Vibe Coding時請注意版本控制