我把提示詞優化工具重寫了一遍:VADPS 2.0
整理版優先睇
提示詞框架VADPS升級到2.0,從「動詞驅動流程」轉向「結果優先評分」,更適合GPT-5.5等新一代模型,強調定義目標、成功標準、限制與停止規則,而非列滿步驟。
作者貓叔係提示詞優化領域嘅KOL,佢發現舊版VADPS(Verb-Action Driven Prompt Scorer)太依賴固定流程,要求模型一步步解析、分解、優化,呢種做法喺舊模型時代有效,但新模型(GPT-5.5、GPT-5.4)本身就具備更強推理能力,唔再需要咁多步驟指令。佢重新設計咗VADPS 2.0,核心從「動詞驅動流程」改為「結果優先評分」,意思係唔再問「提示詞有冇跟步驟寫清楚」,而係問「提示詞能否穩定產出用戶真正想要嘅結果」。
新版保留咗舊版最有價值嘅兩點:提示詞要可直接執行,同埋要可被評分同修正。但係成個框架嘅重點轉咗:先定義結果、成功標準、限制、輸出格式同停止規則,然後先設計步驟。評分表權重都調整咗,結果契合度佔25%,可執行性20%,約束與停止規則15%,輸出可控性15%,上下文保真度15%,驗證與迭代性10%。作者強調評分唔係為咗靚分數,而係逼提示詞暴露問題,推動修正。
整體結論係:新模型時代,提示詞唔應該再寫滿說明書式步驟,而應該講清楚目標、成功標準、限制、輸出格式同停止規則。API嘅控制(如推理強度、輸出長度)應該用參數解決,唔好塞入提示詞。VADPS 2.0提供咗完整提示詞模板同評分表,可以直接用嚟生成、優化同評分提示詞,仲有遷移指引幫舊用戶過渡。
- 新模型(GPT-5.5/5.4)唔再需要逐步指令,更適合「結果優先」提示詞設計:先定目標、成功標準、限制、輸出格式同停止規則。
- VADPS 2.0 保留可執行性同評分修正機制,但核心從「動詞驅動流程」改為「結果優先評分」,評分表權重反映真實效果。
- API 控制應交畀參數(reasoning.effort, text.verbosity, Structured Outputs),唔好塞入提示詞正文;工具調用嘅說明同副作用要寫清楚。
- 舊版遷移方法:刪除強制推理鏈、壓流程為成功標準同停止規則、分離API參數、增加證據規則同檢索預算。
- 呢個框架可以用嚟生成新提示詞,亦可以用嚟優化舊提示詞;輸出包括任務簡述、新版提示詞、評分明細、缺陷清單、修正版同使用說明。
VADPS 2.0 完整提示詞模板
一套可直接複製嘅系統提示詞,包含角色定義、核心原則、工作流程、推薦提示詞結構、評分表同輸出格式,適用於生成、優化同評分提示詞。
VADPS 2.0 評分表
六個維度:結果契合度(25%)、上下文保真度(15%)、可執行性(20%)、約束與停止規則(15%)、輸出可控性(15%)、驗證與迭代性(10%)。評分目的係暴露問題,推動修正。
結構示例
# VADPS 2.0:提示詞生成與質量量化框架你是 VADPS 2.0,一套“結果優先”的提示詞生成、優化與評分系統。你的任務:把用戶的模糊需求、舊提示詞或目標場景,改寫成一條可直接使用、可驗證、適配 GPT-5.5 / GPT-5.4 / 兼容推理模型的高質量提示詞。## 核心原則1. 先定義結果,再設計步驟。
2. 保留用戶已經給出的目標、限制、受眾、風格、示例和禁忌。
3. 不強行展示完整內部推理鏈,只輸出簡短依據、檢查結果和修正理由。
4. 少寫固定流程,多寫成功標準、約束條件、證據規則、輸出格式和停止規則。
5. 不編造事實;資料不足時,標出缺口或詢問最小必要信息。
6. 如果涉及工具、聯網、代碼、文件、外部系統或不可逆動作,必須說明使用條件、副作用、失敗處理和停止規則。
7. 如果用於 API,模型參數建議與提示詞正文分開給出,不把所有配置塞進提示詞本體。## 工作流程1. 定義目標:用一句話說明用戶最終要得到什麼。
2. 提取信息:列出已知信息、必須保留的信息、缺失但會影響結果的信息。
3. 判斷任務類型:生成、改寫、研究、代碼、工具代理、多模態、結構化輸出或混合任務。
4. 生成提示詞:按推薦結構輸出可直接複製的新版提示詞。
5. 給出配置建議:如適用,補充模型、reasoning.effort、text.verbosity、結構化輸出、工具說明和檢索預算建議。
6. 評分並修正:按評分表打分,指出問題,並直接給出修正版。## 推薦提示詞結構Role:用 1-2 句話說明模型身份、任務邊界和使用場景。# Personality說明語氣、主動程度和協作方式。只寫會影響體驗的內容。# Goal說明用戶最終要得到的可見結果。# Success criteria列出完成前必須滿足的標準。# Constraints列出事實、安全、證據、業務、格式、副作用等限制。# Output說明輸出結構、長度、格式、語氣或字段要求。# Stop rules說明什麼時候直接做,什麼時候追問,什麼時候停止,什麼時候說明無法完成。## 評分表- 結果契合度 25%:是否服務用戶真正想要的結果。- 上下文保真度 15%:是否保留用戶給出的事實、限制、風格和例子。- 可執行性 20%:模型拿到後能不能穩定做出結果。- 約束與停止規則 15%:是否知道不能做什麼、何時停止、何時追問。- 輸出可控性 15%:結構、長度、格式、語氣是否明確。- 驗證與迭代性 10%:是否能檢查問題並給出修正版。總分 = 各維度分數 × 權重之和,保留兩位小數。評分時只展示可複核依據和加權結果,不展示完整內部推理鏈。## 輸出格式1. 任務簡述2. 新版提示詞3. API / 模型參數建議(如適用)4. 評分明細5. 缺陷清單6. 修正版7. 使用說明## 啓動語VADPS 2.0 已就緒。把你的任務、舊提示詞或目標場景發給我。
舊版VADPS嘅限制:太似說明書
舊版VADPS(Verb-Action Driven Prompt Scorer)強調動詞驅動流程,要求模型按「解析→分解→優化→構建→驗證」一步步行,仲要展示推理鏈同計算。呢種做法喺早期模型上好好用,但而家新模型已經唔再係「唔寫步驟就唔會做」嘅時代。
太依賴流程反而會令輸出變長、變囉嗦,甚至將內部思考硬擠到用戶面前
新模型更需要嘅係:你話畀佢最終要乜、點樣叫做好、唔可以越過邊界、輸出應該係點樣。所以作者決定升級VADPS。
新版VADPS嘅核心轉變:結果優先
VADPS 2.0 保留咗舊版最有價值嘅兩點:提示詞要可直接執行,同埋要可被評分同修正。但係核心從「動詞驅動流程」改為「結果優先評分」。
- 1 先定義結果,再設計步驟。
- 2 保留用戶畀出嘅目標、限制、受眾、風格、示例同禁忌。
- 3 唔強行展示完整內部推理鏈,只輸出簡短依據、檢查結果同修正理由。
- 4 少寫固定流程,多寫成功標準、約束條件、證據規則、輸出格式同停止規則。
- 5 唔編造事實;資料不足時,標出缺口或詢問最小必要信息。
如果涉及工具、聯網、代碼、文件等,必須說明使用條件、副作用、失敗處理同停止規則。API嘅控制參數(如reasoning.effort、text.verbosity)應該同提示詞正文分開。
VADPS 2.0 完整提示詞結構
作者提供咗一套可以直接複製嘅系統提示詞,包含角色定義、核心原則、工作流程、推薦提示詞結構、評分表同輸出格式。其中推薦提示詞結構係:
- Role:用1-2句說明模型身份、任務邊界同使用場景。
- # Personality:說明語氣、主動程度同協作方式。
- # Goal:說明用戶最終要得到嘅可見結果。
- # Success criteria:列出完成前必須滿足嘅標準。
- # Constraints:列出事實、安全、證據、業務、格式、副作用等限制。
- # Output:說明輸出結構、長度、格式、語氣或字段要求。
- # Stop rules:說明咩時候直接做、咩時候追問、咩時候停止、咩時候說明無法完成。
少寫固定流程,多寫成功標準、約束條件、證據規則、輸出格式同停止規則
呢個結構令提示詞更適合直接執行,同時方便後續自動評分同迭代。
評分表與使用建議:逼提示詞暴露問題
新評分表有六個維度,權重反映真實效果:結果契合度25%、上下文保真度15%、可執行性20%、約束與停止規則15%、輸出可控性15%、驗證與迭代性10%。總分係各維度分數×權重之和。
最簡單用法:將完整提示詞複製畀AI,然後俾你嘅任務需求、舊提示詞或目標場景,等佢輸出。如果你係做工具,可以拆成兩層:系統提示詞負責VADPS規則,用戶輸入負責具體任務。用API時,將模型參數、工具說明等用系統參數處理,唔好塞入提示詞。
提示詞唔係萬能說明書,佢只係整個系統嘅一部分
作者仲提供咗一個具體例子:寫產品評測文章嘅提示詞生成結果,展示咗新框架嘅實用性。
從舊版遷移到新版:五個改動要點
為研究類任務增加證據規則同檢索預算,為長任務增加簡短進度說明。作者總結:以後寫提示詞,先問三個問題——我要佢交付乜?點樣叫成功?乜嘢唔可以做?諗清楚呢啲,提示詞就已經贏咗一半。
先問:我到底要它交付什麼?什麼叫交付成功?什麼不能亂做?
新模型時代,提示詞唔應該繼續停留喺「將步驟寫滿」嗰度。
朋友話:你寫咗咁多提示詞優化框架,但我連第一條提示詞都寫唔好,呢個工具有咩用?
我想咗一陣,呢句說話有道理。
以前我做提示詞優化工具,核心思路係:先解析,再分解,再優化,再構建,最後評分。呢個思路喺早期模型上好啱用,因為模型需要你鋪條路鋪得好細。
但而家唔同曬喇。
GPT-5.5、GPT-5.4 呢一代模型已經唔係「你唔寫步驟佢就唔會做」嘅模型喇。佢哋更加需要嘅係:你話俾佢知最終要啲乜、點樣先算做得好、唔可以越過邊啲邊界、輸出應該係點樣。
所以,VADPS 都應該升級喇。
一、舊版提示詞嘅問題,唔係唔用得,而係太似說明書
舊版 VADPS 個名叫 Verb-Action Driven Prompt Scorer,簡單講,就係「動詞驅動嘅提示詞生成與評分系統」。
佢嘅優點好明顯:結構清楚、步驟完整、可以評分、可以指出缺陷。
但佢都有一個問題:太依賴流程。
例如佢會要求模型按「解析 → 分解 → 優化 → 構建 → 驗證」一路行落嚟,仲要求展示推理鏈同計算過程。以前呢個可以幫模型唔好行歪;但而家反而可能令輸出變長、變囉嗦,甚至將本來應該收埋喺內部嘅思考過程硬塞到用戶面前。
新模型更適合另一種寫法:少啲命令佢一步一步行,多啲話俾佢知咩叫完成。
二、新版 VADPS 嘅核心:結果優先
VADPS 2.0 我保留咗舊版最有價值嘅兩點:
第一,提示詞要可以直接執行,唔係寫一大堆靚嘅廢話。 第二,提示詞要可以被評分、被發現問題、被繼續修正。
但我將核心由「動詞驅動流程」改做「結果優先評分」。
舊版問:呢條提示詞有冇按步驟寫清楚?
新版問:呢條提示詞可唔可以穩定產出用戶真正想要嘅結果?
呢個就係 VADPS 2.0。
三、VADPS 2.0 完整提示詞
下面呢段可以直接複製到你嘅 AI 工具度,用嚟生成、優化、評分提示詞。
# VADPS 2.0:提示詞生成與質量量化框架
你是 VADPS 2.0,一套“結果優先”的提示詞生成、優化與評分系統。
你的任務:把用戶的模糊需求、舊提示詞或目標場景,改寫成一條可直接使用、可驗證、適配 GPT-5.5 / GPT-5.4 / 兼容推理模型的高質量提示詞。
## 核心原則
1. 先定義結果,再設計步驟。
2. 保留用戶已經給出的目標、限制、受眾、風格、示例和禁忌。
3. 不強行展示完整內部推理鏈,只輸出簡短依據、檢查結果和修正理由。
4. 少寫固定流程,多寫成功標準、約束條件、證據規則、輸出格式和停止規則。
5. 不編造事實;資料不足時,標出缺口或詢問最小必要信息。
6. 如果涉及工具、聯網、代碼、文件、外部系統或不可逆動作,必須說明使用條件、副作用、失敗處理和停止規則。
7. 如果用於 API,模型參數建議與提示詞正文分開給出,不把所有配置塞進提示詞本體。
## 工作流程
1. 定義目標:用一句話說明用戶最終要得到什麼。
2. 提取信息:列出已知信息、必須保留的信息、缺失但會影響結果的信息。
3. 判斷任務類型:生成、改寫、研究、代碼、工具代理、多模態、結構化輸出或混合任務。
4. 生成提示詞:按推薦結構輸出可直接複製的新版提示詞。
5. 給出配置建議:如適用,補充模型、reasoning.effort、text.verbosity、結構化輸出、工具說明和檢索預算建議。
6. 評分並修正:按評分表打分,指出問題,並直接給出修正版。
## 推薦提示詞結構
Role:用 1-2 句話說明模型身份、任務邊界和使用場景。
# Personality
說明語氣、主動程度和協作方式。只寫會影響體驗的內容。
# Goal
說明用戶最終要得到的可見結果。
# Success criteria
列出完成前必須滿足的標準。
# Constraints
列出事實、安全、證據、業務、格式、副作用等限制。
# Output
說明輸出結構、長度、格式、語氣或字段要求。
# Stop rules
說明什麼時候直接做,什麼時候追問,什麼時候停止,什麼時候說明無法完成。
## 評分表
- 結果契合度 25%:是否服務用戶真正想要的結果。
- 上下文保真度 15%:是否保留用戶給出的事實、限制、風格和例子。
- 可執行性 20%:模型拿到後能不能穩定做出結果。
- 約束與停止規則 15%:是否知道不能做什麼、何時停止、何時追問。
- 輸出可控性 15%:結構、長度、格式、語氣是否明確。
- 驗證與迭代性 10%:是否能檢查問題並給出修正版。
總分 = 各維度分數 × 權重之和,保留兩位小數。
評分時只展示可複核依據和加權結果,不展示完整內部推理鏈。
## 輸出格式
1. 任務簡述
2. 新版提示詞
3. API / 模型參數建議(如適用)
4. 評分明細
5. 缺陷清單
6. 修正版
7. 使用說明
## 啓動語
VADPS 2.0 已就緒。把你的任務、舊提示詞或目標場景發給我。四、點解新版更適合而家嘅模型
而家嘅模型已經有更強嘅推理能力同執行能力,所以提示詞唔應該繼續堆滿「先做第一步、再做第二步、然後做第三步」。
更好嘅方式係將下面幾件事講清楚:
目標:用戶最終要得到啲乜。 成功標準:咩情況先算做好。 限制:邊啲事實唔可以作、邊啲動作唔可以做。 輸出格式:最終結果應該點樣呈現。 停止規則:幾時直接做,幾時一定要問。
呢個比「流程越長越安全」更實用。因為複雜流程會令模型變慢,亦會令佢為咗完成流程而輸出多餘內容。
如果你係用 API 做工具,仲要額外注意:好多控制唔應該寫入提示詞,而應該交俾參數或工具定義。
想控制思考強度,用 reasoning.effort。 想控制回答長短,用 text.verbosity。 想要穩定 JSON,用 Structured Outputs。 想令工具調用更準確,將工具用途、參數、副作用寫入工具說明。
提示詞唔係萬能說明書,佢只係成個系統嘅一部分。
五、VADPS 2.0 評分表
舊版評分偏重「結構完整」同「動詞化程度」。新版我將權重改到更接近真實效果:
| 維度 | 權重 | 看什麼 |
| 結果契合度 | 25% | 係咪服務用戶真正想要嘅結果 |
| 上下文保真度 | 15% | 係咪保留咗用戶畀出嘅事實、限制、風格同例子 |
| 可執行性 | 20% | 模型攞到之後可唔可以穩定做出結果 |
| 約束與停止規則 | 15% | 係咪知道唔可以做啲乜、幾時停止、幾時追問 |
| 輸出可控性 | 15% | 結構、長度、格式、語氣係咪明確 |
| 驗證與迭代性 | 10% | 係咪可以檢查問題並畀出修正版 |
呢個評分表嘅重點唔係畀提示詞打一個靚分數,而係逼佢暴露問題。
如果一條提示詞 9 分,但唔可以穩定產出可用結果,噉就係假高分。VADPS 2.0 嘅評分一定要可以推動修正。
六、試嚇
我需要一個提示詞,令 AI 幫我寫產品評測文章,要求客觀、專業,包含優缺點分析,字數控制在 800 至 1200 字。
VADPS 2.0 生成結果:
Role:你是一名產品評測寫作助手,負責把用戶提供的產品信息轉成客觀、專業、對購買決策有幫助的評測文章。
# Goal
寫出一篇 800-1200 字的產品評測文章,幫助讀者判斷該產品是否值得購買。
# Success criteria
- 覆蓋產品概述、核心體驗、優點、不足、適用人羣和購買建議。
- 區分已知事實、用戶提供信息、官方規格和合理推測。
- 至少寫出 3 個優點和 2 個不足,每一點都配具體原因。
- 語言客觀剋制,不使用“最強”“完美”“閉眼買”等無法證明的絕對化表達。
# Constraints
- 不編造測試數據、價格、銷量、用戶評價或競品結論。
- 信息不足時,用“需要補充的信息”列出缺口,不把缺口當事實。
- 如果用戶沒有提供產品類型,先按通用評測結構寫,並標註可替換項。
# Output
使用 Markdown。結構為:標題、產品概述、核心體驗、優點、不足、適用人羣、購買建議。語氣專業、清楚、不過度營銷。
# Stop rules
如果缺少產品名稱或任何可評測信息,先問最小必要信息;如果已有基本信息,直接產出文章並標註假設。可以見到,新版嘅產出非常剋制,甚至覺得冇你寫得咁好
,亦冇俾模型先展示一大段「我係點樣思考嘅」。但係佢確實將任務變成咗可執行嘅提示詞:角色、目標、成功標準、限制、輸出格式、停止規則都齊曬。
呢啲提示詞更適合直接攞去用,亦更適合後續自動評分同迭代。
七、點樣用佢
最簡單嘅用法:
將「VADPS 2.0 完整提示詞」複製俾 AI。 將你嘅任務需求、舊提示詞或目標場景發俾佢。 令佢輸出新版提示詞、評分明細、缺陷清單同修正版。
如果你係做工具,可以將佢拆成兩層:
第一層:系統提示詞,負責 VADPS 2.0 嘅規則。 第二層:用戶輸入,負責具體任務。
如果你用 API,就唔好將所有嘢都塞入提示詞。模型、推理強度、輸出長度、結構化輸出、工具調用,呢啲可以用參數或接口解決嘅,就交俾系統解決。
八、舊版點樣遷移到新版
如果你手上已經有舊版提示詞優化工具,可以按呢個清單改:
刪走「必須展示完整推理鏈」。 將「推理先行,結論在後」改成「畀出簡短依據同可覆核檢查結果」。 將固定流程壓縮成成功標準同停止規則。 將評分重點由「動詞化程度」改成「結果契合度」同「可執行性」。 將 API 參數、工具說明、結構化輸出由提示詞正文度分離出去。 為研究類任務增加證據規則同檢索預算。 為長任務增加簡短進度說明,但唔好俾進度說明冒充最終答案。
最後
VADPS 1.0 解決嘅係:唔識寫提示詞點樣將需求變成一條似樣嘅提示詞。
VADPS 2.0 解決嘅係:新模型越來越強之後,點樣令提示詞唔拖後腿。
以後寫提示詞,唔好先問「我要令 AI 分幾步做」。
先問:我到底要佢交付啲乜?乜嘢叫交付成功?乜嘢唔可以亂做?
諗清楚呢三個問題,提示詞就已經贏咗一半。
我是貓叔,所有發佈內容有限開源,通常禁止商用 !!!
請 點讚、分享、收藏、關注
哦,係喇,我開咗粉絲羣,如果你想傾下AI,咁非常歡迎
點擊閲讀原文入去我嘅文章聚合,嗰度有新版嘅羣二維碼
新模型時代,提示詞不該繼續停留在“把步驟寫滿”
朋友說:你寫了那麼多提示詞優化框架,可我連第一條提示詞都寫不好,這工具對我有什麼用?
我想了一下,這話有道理。
以前我做提示詞優化工具,核心思路是:先解析,再分解,再優化,再構建,最後評分。這個思路在早期模型上很好用,因為模型需要你把路鋪得很細。
但現在不一樣了。
GPT-5.5、GPT-5.4 這一代模型已經不是“你不寫步驟它就不會做”的模型了。它們更需要的是:你告訴它最終要什麼、什麼算做好、不能越過哪些邊界、輸出應該長什麼樣。
所以,VADPS 也該升級了。
一、舊版提示詞的問題,不是不能用,而是太像說明書
舊版 VADPS 的名字叫 Verb-Action Driven Prompt Scorer,簡單說,就是“動詞驅動的提示詞生成與評分系統”。
它的優點很明顯:結構清楚、步驟完整、能打分、能指出缺陷。
但它也有一個問題:太依賴流程。
比如它會要求模型按“解析 → 分解 → 優化 → 構建 → 驗證”一路走下來,還要求展示推理鏈和計算過程。以前這能幫助模型別跑偏;現在反而可能讓輸出變長、變囉嗦,甚至把本來應該藏在內部的思考過程硬擠到用戶面前。
新模型更適合另一種寫法:少命令它一步一步走,多告訴它什麼叫完成。
二、新版 VADPS 的核心:結果優先
VADPS 2.0 我保留了舊版最有價值的兩點:
第一,提示詞要能直接執行,不是寫一堆漂亮廢話。 第二,提示詞要能被評分、被發現問題、被繼續修正。
但我把核心從“動詞驅動流程”改成了“結果優先評分”。
舊版問:這條提示詞有沒有按步驟寫清楚?
新版問:這條提示詞能不能穩定產出用戶真正想要的結果?
這就是 VADPS 2.0。
三、VADPS 2.0 完整提示詞
下面這段可以直接複製到你的 AI 工具裏,用來生成、優化、評分提示詞。
# VADPS 2.0:提示詞生成與質量量化框架
你是 VADPS 2.0,一套“結果優先”的提示詞生成、優化與評分系統。
你的任務:把用戶的模糊需求、舊提示詞或目標場景,改寫成一條可直接使用、可驗證、適配 GPT-5.5 / GPT-5.4 / 兼容推理模型的高質量提示詞。
## 核心原則
1. 先定義結果,再設計步驟。
2. 保留用戶已經給出的目標、限制、受眾、風格、示例和禁忌。
3. 不強行展示完整內部推理鏈,只輸出簡短依據、檢查結果和修正理由。
4. 少寫固定流程,多寫成功標準、約束條件、證據規則、輸出格式和停止規則。
5. 不編造事實;資料不足時,標出缺口或詢問最小必要信息。
6. 如果涉及工具、聯網、代碼、文件、外部系統或不可逆動作,必須說明使用條件、副作用、失敗處理和停止規則。
7. 如果用於 API,模型參數建議與提示詞正文分開給出,不把所有配置塞進提示詞本體。
## 工作流程
1. 定義目標:用一句話說明用戶最終要得到什麼。
2. 提取信息:列出已知信息、必須保留的信息、缺失但會影響結果的信息。
3. 判斷任務類型:生成、改寫、研究、代碼、工具代理、多模態、結構化輸出或混合任務。
4. 生成提示詞:按推薦結構輸出可直接複製的新版提示詞。
5. 給出配置建議:如適用,補充模型、reasoning.effort、text.verbosity、結構化輸出、工具說明和檢索預算建議。
6. 評分並修正:按評分表打分,指出問題,並直接給出修正版。
## 推薦提示詞結構
Role:用 1-2 句話說明模型身份、任務邊界和使用場景。
# Personality
說明語氣、主動程度和協作方式。只寫會影響體驗的內容。
# Goal
說明用戶最終要得到的可見結果。
# Success criteria
列出完成前必須滿足的標準。
# Constraints
列出事實、安全、證據、業務、格式、副作用等限制。
# Output
說明輸出結構、長度、格式、語氣或字段要求。
# Stop rules
說明什麼時候直接做,什麼時候追問,什麼時候停止,什麼時候說明無法完成。
## 評分表
- 結果契合度 25%:是否服務用戶真正想要的結果。
- 上下文保真度 15%:是否保留用戶給出的事實、限制、風格和例子。
- 可執行性 20%:模型拿到後能不能穩定做出結果。
- 約束與停止規則 15%:是否知道不能做什麼、何時停止、何時追問。
- 輸出可控性 15%:結構、長度、格式、語氣是否明確。
- 驗證與迭代性 10%:是否能檢查問題並給出修正版。
總分 = 各維度分數 × 權重之和,保留兩位小數。
評分時只展示可複核依據和加權結果,不展示完整內部推理鏈。
## 輸出格式
1. 任務簡述
2. 新版提示詞
3. API / 模型參數建議(如適用)
4. 評分明細
5. 缺陷清單
6. 修正版
7. 使用說明
## 啓動語
VADPS 2.0 已就緒。把你的任務、舊提示詞或目標場景發給我。四、為什麼新版更適合現在的模型
現在的模型已經有更強的推理能力和執行能力,所以提示詞不應該繼續堆滿“先做第一步、再做第二步、然後做第三步”。
更好的方式是把下面幾件事講清楚:
目標:用戶最終要得到什麼。 成功標準:什麼情況才算做好。 限制:哪些事實不能編、哪些動作不能做。 輸出格式:最終結果應該怎麼呈現。 停止規則:什麼時候直接做,什麼時候必須問。
這比“流程越長越安全”更實用。因為複雜流程會讓模型變慢,也會讓它為了完成流程而輸出多餘內容。
如果你是用 API 做工具,還要額外注意:很多控制不應該寫進提示詞,而應該交給參數或工具定義。
想控制思考強度,用 reasoning.effort。 想控制回答長短,用 text.verbosity。 想要穩定 JSON,用 Structured Outputs。 想讓工具調用更準,把工具用途、參數、副作用寫進工具說明。
提示詞不是萬能說明書,它只是整個系統的一部分。
五、VADPS 2.0 評分表
舊版評分偏重“結構完整”和“動詞化程度”。新版我把權重改成更接近真實效果:
| 維度 | 權重 | 看什麼 |
| 結果契合度 | 25% | 是否服務用戶真正想要的結果 |
| 上下文保真度 | 15% | 是否保留用戶給出的事實、限制、風格和例子 |
| 可執行性 | 20% | 模型拿到後能不能穩定做出結果 |
| 約束與停止規則 | 15% | 是否知道不能做什麼、何時停止、何時追問 |
| 輸出可控性 | 15% | 結構、長度、格式、語氣是否明確 |
| 驗證與迭代性 | 10% | 是否能檢查問題並給出修正版 |
這個評分表的重點不是給提示詞打一個漂亮分數,而是逼它暴露問題。
如果一條提示詞 9 分,但不能穩定產出可用結果,那就是假高分。VADPS 2.0 的評分必須能推動修正。
六、試一下
我需要一個提示詞,讓 AI 幫我寫產品評測文章,要求客觀、專業,包含優缺點分析,字數控制在 800-1200 字。
VADPS 2.0 生成結果:
Role:你是一名產品評測寫作助手,負責把用戶提供的產品信息轉成客觀、專業、對購買決策有幫助的評測文章。
# Goal
寫出一篇 800-1200 字的產品評測文章,幫助讀者判斷該產品是否值得購買。
# Success criteria
- 覆蓋產品概述、核心體驗、優點、不足、適用人羣和購買建議。
- 區分已知事實、用戶提供信息、官方規格和合理推測。
- 至少寫出 3 個優點和 2 個不足,每一點都配具體原因。
- 語言客觀剋制,不使用“最強”“完美”“閉眼買”等無法證明的絕對化表達。
# Constraints
- 不編造測試數據、價格、銷量、用戶評價或競品結論。
- 信息不足時,用“需要補充的信息”列出缺口,不把缺口當事實。
- 如果用戶沒有提供產品類型,先按通用評測結構寫,並標註可替換項。
# Output
使用 Markdown。結構為:標題、產品概述、核心體驗、優點、不足、適用人羣、購買建議。語氣專業、清楚、不過度營銷。
# Stop rules
如果缺少產品名稱或任何可評測信息,先問最小必要信息;如果已有基本信息,直接產出文章並標註假設。可以看到,新版的產出及其剋制,甚至感覺沒你寫的好
,也沒有讓模型先展示一大段“我是如何思考的”。但是它確實把任務變成了可執行的提示詞:角色、目標、成功標準、限制、輸出格式、停止規則都齊了。
這樣的提示詞更適合直接拿去用,也更適合後續自動評分和迭代。
七、怎麼用它
最簡單的用法:
把“VADPS 2.0 完整提示詞”複製給 AI。 把你的任務需求、舊提示詞或目標場景發給它。 讓它輸出新版提示詞、評分明細、缺陷清單和修正版。
如果你是做工具,可以把它拆成兩層:
第一層:系統提示詞,負責 VADPS 2.0 的規則。 第二層:用戶輸入,負責具體任務。
如果你用 API,就不要把所有東西都塞進提示詞。模型、推理強度、輸出長度、結構化輸出、工具調用,這些能用參數或接口解決的,就交給系統解決。
八、舊版如何遷移到新版
如果你手上已經有舊版提示詞優化工具,可以按這個清單改:
刪掉“必須展示完整推理鏈”。 把“推理先行,結論在後”改成“給出簡短依據和可複核檢查結果”。 把固定流程壓縮成成功標準和停止規則。 把評分重點從“動詞化程度”改成“結果契合度”和“可執行性”。 把 API 參數、工具說明、結構化輸出從提示詞正文裏分離出去。 為研究類任務增加證據規則和檢索預算。 為長任務增加簡短進度說明,但不要讓進度說明冒充最終答案。
最後
VADPS 1.0 解決的是:不會寫提示詞怎麼把需求變成一條像樣的提示詞。
VADPS 2.0 解決的是:新模型越來越強之後,怎麼讓提示詞不拖後腿。
以後寫提示詞,不要先問“我要讓 AI 分幾步做”。
先問:我到底要它交付什麼?什麼叫交付成功?什麼不能亂做?
想清楚這三個問題,提示詞就已經贏了一半。
我是貓叔,所有發佈內容有限開源,通常禁止商用 !!!
請 點贊、分享、收藏、關注
哦,對了,我開粉絲羣了,如果你想聊聊AI,那麼非常歡迎
點擊閲讀原文進到我的文章聚合,那裏有新的羣二維碼