像優化agent優化自己，向世界輸入更好的prompt

作者：阿星AI工作室

日期：2026年5月31日下午7:07

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

像優化agent咁優化自己，向世界輸入更好的prompt

整理版摘要

呢篇文章係阿星喺超越之路社區線下嘅脱口秀腳本。佢分享自己由公司離職之後，點樣用AI模型訓練嘅概念嚟反思個人成長同職業發展。阿星原本係打工仔，後來因為20分鐘整咗個釦子賺到5000蚊，加上公司競崗換人，一氣之下離職創業。佢發現技能一定要依附喺自己嘅商業主體，唔可以淨係做系統入面嘅零件。

佢將自己比喻成一個AI模型：預訓練階段慎選學習資料，監督學習階段唔反駁老師，偏好對齊階段透過自媒體累積影響力，最後蒸餾成獨立嘅個體。佢認為世界好似一個大模型，你要主動輸出清晰嘅prompt，先可以生成具體機會。唔好等世界俾答案，而係要俾世界一個好嘅prompt。

整體結論係：與其抱怨，不如將自己當成agent去優化——調prompt、補上下文、換工具、修系統提示詞。透過深度思考同持續行動，人可以不斷迭代，生成自己想要嘅人生。

將自己當成AI模型訓練：預訓練、監督學習、偏好對齊、蒸餾，每一階段都影響最終輸出。
技能要依附喺自己嘅商業主體，唔好只做系統嘅零件，否則會被取代。
世界唔會主動理解你，你要俾清晰嘅prompt先可以生成機會；機會好似latent space，需要顯影。
辛苦做半年不如深度思考5分鐘調整策略並強烈執行，呢個係關鍵迭代。
人都有工程增強層：循環、編排、護欄、評估、可觀測性，可以幫自己穩定進步。

整理重點

由生成式創業到自我訓練

阿星一開頭離職創業，完全係生成式。人哋話一年賺幾百萬以下用個體工商户就得，佢就照做，呢個prompt到而家仲生效。佢話呢種做法就好似大模型訓練嘅預訓練階段——盡量唔學垃圾。

監督學習階段，佢唔會反駁任何老師，因為知道呢啲輸入會影響之後嘅自己。

偏好對齊就係透過自媒體輸出，累積影響力。蒸餾嘅契機係佢用20分鐘整咗個釦子賺到5000蚊，但公司竟然用冇做過佢崗位嘅人取代佢，佢先醒覺技能要依附喺自己嘅商業主體。

整理重點

俾世界注入你嘅Prompt

阿星做公眾號初期完全冷啓動，三個讚都係自己點。佢聽講硅基流動嘅袁進輝老師有親和力，就直接加咗微信，寫咗篇文，結果冷啓動成功。

機會好似Stable Diffusion嘅latent space，唔係冇，只係未顯影。你要先俾世界一個清楚嘅prompt。

佢總結三種prompt版本：卑微版（求機會）、增長版（投餵推薦系統）、玄學版（朋友圈係命運嘅提示詞）。深度思考先係實現更好prompt嘅方法，例如佢從IP第一性原理出發，發起百日千條計劃刷臉，呢個決策佢半年都冇諗到。

辛苦做半年不如深度思考5分鐘調整策略並強烈執行。

整理重點

工具、LLM、上下文嘅自我優化

阿星話自己作為一個agent，本質上同大模型結構相似。佢點樣喺工具、LLM、上下文呢三方面優化自己？

工具只買好嘅，如果慳工具錢，自己就會變成工具。而且工具學得慢就唔使學。

LLM就係繼續訓練自己成為更好嘅模型。上下文方面，任務說明、歷史對話、文件、工具結果等都要豐富。遇到白嫖就扣額度，遇到畀錢就超標輸出加情緒價值。

文檔係售賣方式，整模板同SOP令時間產生複利。
萬物都係工具，要揾適合嘅合作同成長方式。
人嘅上下文包括歷史對話、文件、工具結果，要不斷優化。

整理重點

人嘅工程增強層

阿星指出，LLM、工具、上下文只係基礎，真正令agent穩定好用嘅係工程增強層：循環、編排、護欄、評估、可觀測性。人呢？都係一樣。

循環：目標、行動、反饋、修正，再嚟一輪，先係agent喺度跑。每個循環要加迭代點。

1 編排：知道自己幾時自己做、幾時揾人、幾時調用工具。
2 護欄：冇護欄嘅人執行力越強越易崩。
3 評估：市場俾唔俾錢、甲方復唔復購，呢啲係進化訊號。
4 可觀測性：要知道自己卡喺邊層，冇traces嘅人生覆盤全靠玄學。

所以成長就係不斷調自己嘅prompt、補上下文、換工具、修系統提示詞。阿星話自己唔係模型，開局gpt3.5拙劣輸出，但佢當模型訓練；唔係agent，但按agent工程增強自己。最後佢話：以前以為係發內容，後來先知係俾世界發請求。

哈囉，大家好，

我係阿星！

呢個係我尋日喺超越之路社區線下嘅脱口秀稿。

入面有啲諗法，分享畀大家👇

fimmo同我講係脱口秀，

我諗住輕鬆下就得啦。

然後佢出咗個預告，

我一睇，每人要畀錢入場，我即刻唔輕鬆啦。

點樣先講到值99蚊嘅笑話，

搞笑得嚟又令大家學到嘢。

識我嘅人都知，

我每次出來分享都係ppt由70頁起跳，可以講到下面啲人頭暈。

1、唔帶腦，連物理RAG都甩埋

今次本來都想講啲比較深嘅嘢

但係我而家真係學唔落去，正如餘華話：我而家咩都唔想學！

codex：呢個係你個腦

我：唔需要唔需要，因為我用緊AI寫code ！

fimmo同我講冇提詞器，

嚇我一跳，知識庫玩完啦。

所以我print咗個物理RAG，

將外部知識預先放到現場，隨時檢索。

當然而家背熟咗。

當然，現場都有啲人係人肉RAG。

2、生成式創業

我攞現場嘅朋友嚟講下啦。係我嘅人肉RAG。

我最開始由公司出來嘅時候完全係生成式嘅。

有人同我話一年賺幾百萬以下用個體工商户主體就得。

我就註冊咗，算係我離職創業嘅第一個prompt。

我諗住是但啦。結果到而家仲用緊呢個主體。（當然而家唔止咁少）

所以我嗰時嘅prompt生效咗，

AI圈最嚴厲嘅父親雲中江樹嘅話嚟講就係pulangt生效咗。（標準發音）

所以，完全係生成式創業。如果對應大模型嘅訓練過程，我自己就係一種訓練。

預訓練：一啲資料、好貴嘅課。我盡量唔令自己學太多垃圾。

監督學習：我係一個好好嘅監督學習學生，我唔會駁任何老師。因為我知道我遲早會將自己蒸餾成另一個版本。我要做一個獨立嘅小模型。大家見我咁高頻嘅內容輸出就應該知，我早期嘅AI係跟一個質素比較好嘅老師學嘅。所以模型訓練前期係非常高質素嘅輸入。

偏好對齊：所以我由一開始做自媒體到而家，傳播喺我度係一個好重度嘅偏好對齊。我知道我呢個腦做產品唔好話打唔過大廠，所以用內容輕驅動啦。

蒸餾：我本來打算繼續喺公司打工，但有一日我用20分鐘整咗個鈕扣賺咗5000蚊，同埋之後攞到啲出去分享嘅機會開始累積影響力。

我開心到彈起，點知公司嗰邊叫競崗揾咗個冇做過我崗位嘅人代替我，激到我直接辭職。我先發現，技能真係要依附喺一個商業主體度，我必須要有所有權而唔係一個系統裏面某個零件嘅使用權。

所以我就開始背叛大模型啦。咪睇我之前係個千問，但我而家唔係r1、我係 r1 Distill🐶

3、做唔到agent人，註定做tool

跟住我就陷入辭職後嘅恐慌。

畢竟你喺出面耐咗，職場就會對你開好友驗證。加唔加得返去睇HR心情。

諗通之後我就豁出去啦。

做唔掂就去送外賣，自己做唔到agent就去美團做一個tool。

跟住我發現，我哋成日睇唔起一啲好tool嘅工作，但係又喺其他系統扮演緊tool。

所以我就豁出去啦，無論如何我都會圍繞住我自己呢個agent。

4、向世界注入你嘅Prompt

我做咗公眾號，但係我唔識冷啟動。

我公眾號出咗三個讚都係自己㩒嘅。

我就諗辦法令其他人幫我轉發。跟住有一日我喺一個group入面聽南喬話硅基流動袁進輝老師特別有親和力。我就直接加咗佢，睇佢朋友圈全部係deepseek api嘅廣告，我以為要聰明先會畀佢轉發，點知一睇有啲文章作者我唔識。我都寫咗一篇，即學即賣，跟住嗰篇文章就幫我開咗冷啟動

我先意識到，機會有啲似 Stable Diffusion 裏面嘅 latent space，唔係冇，只係未顯影。你要先向世界畀一個夠清楚嘅 prompt，佢先可能由一堆模糊可能性裏面，幫你生成一個具體機會。唔係嘅話生成個四隻手嘅美女嚇死你。

我就意識到，如果想令呢個社會嘅人認識我，就要搞多啲潛在空間。

批量幫自己生成一啲潛在嘅機遇。

所以就不斷曝光，prompt呢個世界。prompt嘅變量主要係一啲機構。

我通常都係對合作方跪式服務㗎哈哈，好似有啲老師同模型講嘢嘅時候會加個請字。

我嘅prompt通常係咁嘅🤣：

對活動方：求嚇你，畀我上啦！

對自媒體讀者：大家好，我係阿星，今日……

對工程師：你淨係睇點樣實現就得，實現唔到就唔好再講啦。

不斷向呢個世界畀你嘅prompt。因為世界唔會主動理解你。

世界就係一個大模型，你攤喺牀度可以觸發到啲咩output啊？

都係你鬱咗世界先鬱，呢個世界嘅事就係我哋生成嘅。

你唔prompt，佢就當你係路人甲；

你prompt得越清楚，佢越可能幫你生成一個機會。

卑微版：

求嚇你，畀我上啦。例如要求一啲機會。

增長版：

我將自己餵畀世界嘅推薦系統。例如做自媒體。

玄學但真實版：

你以為你係發朋友圈，其實你係幫命運寫提示詞。例如朋友圈有人介紹機會畀你。

唔好埋怨世界唔畀你答案，可能係你prompt寫得太短(◕_◕)💭

而要實現更好嘅prompt輸入嘅方法就係深度思考。

例如我之前淨係做圖文，然後我由IP第一性原理出發，發現出名=面熟。所以我發起咗百日千條計劃，令自己每日出10條短視頻洗面。就係呢個決定，我半年都冇諗到。

所以真係，辛苦做嘢半年，好多時都唔及深度思考5分鐘調整策略並強力執行。

5、答案生成中

跟住呢個世界就幫我生成咗一啲答案

活動方幫我生成嘅答案係：我參加咗40幾場分享

自媒體畀我嘅答案係：最基本嘅流量大概10萬粉絲左右

企培同開發畀我嘅答案係，終於可以去嗰啲一年賺幾十億嘅公司做培訓：

AI辦公提效培訓、AI賦能運營培訓、電商培訓，全部都有做。

6、工具、LLM、上下文

所以我自己開始總結。

我作為一個agent，其實人嘅本質就係agent近似嘅結構。

我點樣由工具、LLM、上下文上優化我自己。

工具

淨係買好嘅工具，自從用咗好工具我先發現自己以前用嘅都係垃圾。

如果你要慳工具錢，咁你自己就會變成工具。

學太多啦，

我發現呢啲工具真係只要學得慢就唔使學。

LLM

依然係循環返之前嘅套路

將自己訓練成一個更好嘅模型。

上下文方面

任務說明 + 歷史對話 + 文件 + 工具結果……嚟豐富上下文

為咗有更好嘅任務說明，我需要講得更清楚

當然，呢個過程都遇過想白嫖嘅。

唔畀錢就唔出token，我：您好，而家同kimi交流嘅人比較多。再問就係你嘅額度已重置。

遇到一嚟就幾千蚊打過嚟嘅，我直接超標輸出，直情20倍，唔夠係嘛，我哋仲可以提供情緒價值。

歷史對話、文件、工具結果、文檔……都係我嘅上下文。

文檔就係我嘅售賣方式，令時間產生複利。

我整咗好多template嘅東西複製貼上，優化SOP，令「歷史對話」更好地服務下一輪輸入……

工具結果，萬物都係我哋嘅工具，到底乜嘢合作形式、成長方式更適合我哋，就係進行tool嘅迭代。

7、人仲有工程增強層

如果話 LLM、工具、上下文 / 記憶，係一個 agent 嘅基礎三件套，

咁再上一層，就唔係「換個更聰明嘅腦」咁簡單。

真正令 agent 變得穩定好用嘅，係工程增強層：

循環、編排、護欄、評估、可觀測性。

人其實都一樣。

循環：

你唔可以淨係行動一次就等命運開獎。

目標、行動、反饋、修正，再嚟一輪，呢個先叫 agent 喺度跑。

就係高精力嘅循環，透過反覆挑戰耐力極限可以增加循環次數。只不過每個循環上面應該增加更多嘅迭代點，嚟增加循環實驗嘅意義。呢個就係點解辛苦做嘢半年不如深度思考5分鐘進行關鍵迭代。

編排：

你要知道幾時自己搞，幾時揾人，幾時調用工具，

幾時唔好硬上。好多人唔係能力差，係任務編排太亂。

我哋編排一次唔得就不斷優化編排，直到條link跑通

護欄：

冇護欄嘅人，執行力越強，越容易將自己調用到崩潰。

評估：

市場畀唔畀錢，甲方復唔復購，呢啲唔係情緒反饋，而係進化。

唔好淨係睇自己感覺良好，要睇外部測試集。

可觀測性：

你要知道自己到底卡喺邊層：係prompt冇寫清楚，係上下文唔夠，定係工具揀錯。

冇traces嘅人生，覆盤全靠玄學。

幻覺：

將未發生嘅成功，當成已經被證實嘅事實。

覺得自己就快起飛，原來只係咖啡飲多咗。😂

所以我唔係將自己變成機器。

我突然發現，原來所謂成長，

就係不斷調自己嘅prompt、補自己嘅上下文、換自己嘅工具、修自己嘅系統提示詞。我唔係模型，

開局gpt3.5劣質輸出，但我將自己當模型訓練，

我唔係agent，但我按agent工程增強自己，

我唔可以直接定製產出物，但我可以優化Prompt。

我唔可以控制外界，但係可以生成自己嘅人生。

以前我以為我係發內容。

後來我先知，我係向世界發請求。🐶

返屋企路上，我拍咗段vlog，分享畀大家👇

ok，我係阿星，

更多AI應用，我哋下集再見！

哈嘍，大家好，

我是阿星！

這是我昨天在超越之路社區線下的脱口秀腳本。

包含了一些思考。分享給大家👇

fimmo跟我說是脱口秀，

我想的是來嘻嘻一下就行了。

然後他發個預告，

我一看上面每個人要掏門票進來我直接就不嘻嘻了。

怎麼講夠價值99的笑話，

搞笑又讓大家能學點東西回去。

瞭解我的人都知道，

我每次出來分享都是ppt70頁起步能把其他能把下面人講到頭暈。

1、腦子不帶，物理RAG也掉了

這次本來也想講點卷的

但是我現在真的學不進去，就餘華說的：我現在什麼都不想學！

codex：這是你的腦子

我：不需要不需要，因為我在用AI寫代碼！

fimmo給我說沒有提詞器，

嚇我一跳，知識庫完了弄了。

所以我打印了個物理rag，

我把外部知識提前放到現場，隨時檢索。

當然了現在背會了。

當然了，現場也有一些人是人肉rag。

2、生成式創業

我就拿現場一些朋友來說吧。是我的人肉rag。

我最開始從公司出來的時候完全就是生成式的。

別人跟我說一年賺個幾百萬以下用個體工商户主體就行了。

我就註冊了，算是我離職創業的第一個prompt。

我想着將就一下。結果現在還在用這個主體。（當然了現在不止這些了）

所以我當時的prompt生效了，

ai圈最嚴厲的父親雲中江樹的話說就是pulangt生效了。（標準發音）

所以，完全是生成式創業。如果對應大模型的訓練過程，我自己就是一種訓練。

預訓練：一些資料、很貴的課。我儘量不讓自己學太多垃圾。

監督學習：我是一個很好的監督學習學生，我不會反駁任何老師。因為我知道我早晚要把我自己蒸餾成另一個版本。我要做一個單獨的小模型。大家看我這麼高頻內容輸出你就應該知道，我早期的AI是跟着一個比較好資質的老師學的。所以我的模型訓練前期是非常高質量的輸入。

偏好對齊：所以我的一開始從自媒體到現在，傳播在我這裏就是一個很重度的偏好對齊。我知道我這腦子做產品別說打不過大廠，所以從內容輕驅動吧。

蒸餾：我本來是打算繼續在公司打工的，但有一天我用20分鐘捏了個釦子賺了5000塊錢，以及後來拿到一些出去分享的機會開始積累影響力。

我美滋滋的，結果公司那邊讓競崗找了個沒幹過我崗位的人代替我，給我氣的直接離職了。我才發現，技能真的是要依附於一個商業主體的，我必須有所有權而不是一個系統裏某個零件的使用權。

所以我就開始背叛大模型了。別看我之前是個千問，但我現在不是r1、我是 r1 Distill🐶

3、當不了agent人，註定當tool

然後我就陷入離職後的恐慌。

畢竟你在外面呆久了，職場就會對你開啓好友驗證。能不能加回去全看HR心情。

想明白之後我就破罐破摔了。

幹不好就去送外賣，自己當不了agent就去美團當一個tool。

然後我發現，我們總是看不上一些很tool的工作，但是又在另外一些系統扮演着tool。

所以我就破罐破摔吧，我怎麼着我都要圍繞我自己這個agent。

4、給世界注入你的Prompt

我做了公眾號，但是我不會冷啓動。

我公眾號發出去三個贊都是自己點的。

我就想辦法讓別人給我轉發。然後我有一天在一個羣裏聽南喬說硅基流動袁進輝老師特別有親和力。我就直接加上了，我看他朋友圈全都是deepseek api的廣告，我以為大聰明才配備他轉發，結果一看有的文章作者我不認識。我也寫了一個，現學現賣，然後那個文章就給我開啓了冷啓動

我才意識到，機會有點像 Stable Diffusion 裏的 latent space，它不是沒有，只是還沒被顯影。你得先給世界一個足夠清楚的 prompt，它才可能從一堆模糊可能性裏，給你生成一個具體機會。不然給你生成四個手的美女嚇死你啊。

我就意識到，如果想讓這個社會人認識我。我就要搞更多的潛在空間。

批量給自己生成一些潛在的機遇。

所以我就繼續走曝光，prompt這個世界。prompt的變量的話主要就是一些機構。

我一般都是跟合作方跪式服務的啊哈哈哈，就像有的老師跟模型說話的時候會加一個請。

我的prompt一般是這樣的🤣：

對活動方：球球你了，讓我上吧！

對自媒體讀者：大家好，我是阿星，今天……

對工程師：你只用看怎麼實現就行了，實現不了別再說了。

不斷給這個世界你的 prompt。因為世界不會主動理解你。

世界就是個大模型，你躺牀上能觸發啥輸出啊？

都是你動了世界才動，這個世界的事情就是我們生成的。

你不 prompt，它就默認你是路人甲；

你 prompt 得越清楚，它越可能給你生成一個機會。

卑微版：

球球你了，讓我上吧。比如要求一些機會。

增長版：

我把自己投餵給世界的推薦系統。比如做自媒體。

玄學但真實版：

你以為你在發朋友圈，其實你在給命運寫提示詞。比如朋友圈有人給你介紹一些機會。

不要抱怨世界不給你答案，可能是你 prompt 寫得太短(◕_◕)💭

而實現更好的prompt輸入的辦法就是深度思考。

比如我之前只是做圖文，然後我從IP第一性原理出發，發現出名=臉熟。所以我發起了百日千條計劃，來讓自己每天發10條短視頻刷臉。就是這麼一個決策，我半年內都沒想到。

所以真的，辛苦工作半年，很多時候都不如深度思考5分鐘調整策略並強烈執行。

5、答案生成中

然後這個世界就給我生成了一些答案

活動方給我生成的答案是：我參加了40多場分享

自媒體給我的答案是：最基本的流量大概10萬粉絲左右吧

企培和開發給我的答案是，終於可以去那種一年賺幾十個億的公司培訓一下：

ai辦公提效培訓、ai賦能運營培訓、電商培訓，都在幹。

6、工具、LLM、上下文

所以我自己就開始總結。

我作為一個agent，實際上人的本質就是agent近似的結構。

我怎麼從工具、LLM、上下文上優化我自己。

工具

只買好工具，自從用了好工具我才發現自己以前用的都是垃圾。

如果你要省工具錢，那你自己就會變成工具。

學太多了，

我發現這些工具真的就是隻要學的慢就不用學。

LLM

依然是循環前面的套路

把自己訓練成一個更好的模型。

上下文上

任務說明 + 歷史對話 + 文件 + 工具結果……來豐富上下文

為了有更好的任務說明，我需要說的更清楚

當然了，這個過程也遇到過想白嫖的。

不充錢不吐token，我：您好，現在和kimi交流的人有點多。再問就是你的額度已重置。

遇到一上來就遇到給我打幾千的，我直接就是超標輸出，直接20x，不夠是吧，咱們還可以提供情緒價值。

歷史對話、文件、工具結果、文檔……都是我的上下文。

文檔就是我的售賣方式，讓時間產生複利。

我弄了很多模板的東西複製粘貼，優化sop，讓“歷史對話”更好地服務下一輪輸入……

工具結果，萬物都是我們的工具，到底什麼樣的合作形式、成長方式更適合我們，就是在進行tool的迭代。

7、人還有工程增強層

如果說 LLM、工具、上下文 / 記憶，是一個 agent 的基礎三件套，

那再往上，就不是“換個更聰明的腦子”這麼簡單了。

真正讓 agent 變得穩定好用的，是工程增強層：

循環、編排、護欄、評估、可觀測性。

人其實也一樣。

循環：

你不能只行動一次就等命運開獎。

目標、行動、反饋、修正，再來一輪，這才叫 agent 在跑。

就是高精力的循環，通過反覆挑戰耐力極限能加循環次數。只不過每個循環上應該增加更多的迭代點，來增加循環實驗的意義。這就是為什麼辛苦幹活半年不如深度思考5分鐘進行關鍵迭代。

編排：

你要知道什麼時候自己幹，什麼時候找人，什麼時候調用工具，

什麼時候別硬上。很多人不是能力差，是任務編排太亂。

我們編排一次不行就繼續優化編排，直到鏈路跑通

護欄：

沒有護欄的人，執行力越強，越容易把自己調用崩。

評估：

市場給不給錢，甲方復不復購，這些都不是情緒反饋，而是進化。

不要只看自己感覺良好，要看外部測試集。

可觀測性：

你要知道自己到底卡在哪一層：是 prompt 沒寫清楚，是上下文不夠，還是工具選錯了。

沒有 traces 的人生，覆盤全靠玄學。

幻覺：

把還沒發生的成功，當成已經被驗證的事實。

覺得自己馬上要起飛了，結果只是咖啡喝多了。😂

所以我不是在把自己變成機器。

我是突然發現，原來所謂成長，

就是不斷調自己的 prompt、補自己的上下文、換自己的工具、修自己的系統提示詞。我不是模型，

開局gpt3.5拙劣輸出，但我把自己當模型訓練，

我不是agent，但是我按agent工程增強自己，

我不能直接定製產出物，但是我可以優化Prompt。

我不能控制外界，但是可以生成自己的人生。

以前我以為我是在發內容。

後來我才知道，我是在給世界發請求。🐶

回家路上，我拍了一段vlog，分享給大家👇

ok，我是阿星，

更多AI應用，我們下期再見！