openclaw & hermes 創始人盛讚的 Minimax,到底表現如何?
整理版優先睇
Minimax M2.7 性價比極高,夠穩定又聽話,係日常編程同自動化任務嘅抵用之選
呢篇文章係一位主力用 Claude 嘅開發者,因為成日唔夠 Token,所以想揾平替模型。佢見到 OpenClaw 同 Hermes 創始人喺海外都讚 Minimax,於是測試咗最新嘅 M2.7 模型成個月,用咗幾百次 Skill 調用同幾十個項目。
作者先交代咗 M2.7 喺市場上嘅定位:比唔上 Opus 4.7 嘅天花板,但價格只係佢嘅 1/15;比 DeepSeek V4 Pro 平約 3 倍,弱喺強推理但日常任務好使好用。佢每日有大量細碎嘅 Token 消耗任務,例如 RSS 總結、播客翻譯、PDF 轉 PPT、復刻網頁原型呢類定義清晰、鏈路唔長嘅工作,而 M2.7 正好勝任。
整體結論係:M2.7 係佢用過最平又最穩嘅國產模型。佢透過多個實際案例證明咗模型嘅穩定性——定時任務日日自動執行、PDF 識玩 OCR 重建而非偷雞截圖、長程任務跑足半個鐘唔斷氣。佢認為呢個模型「想清楚先做」,唔會投機取巧,值得擺做主力候選。
- M2.7 係最平又最穩嘅國產模型,性價比遠超其他旗艦。
- 作者將 M2.7 接入 OpenClaw,用 Skill 實現自動化 RSS、播客同選題採集。
- 同 DeepSeek V4 Pro 相比,M2.7 做 PDF 轉 PPT 識 OCR 重建內容,唔係單純貼圖。
- M2.7 可以穩定跑半小時以上長程任務,幾十輪工具調用唔中斷。
- 建議用 M2.7 做 VibeCoding 全棧開發,成本低效果好。
info-skill (RSS 聚合)
訂閲博客同資訊源,定時總結推送至飛書
info-skill (播客自動處理)
掃 YouTube 頻道,拉字幕翻譯,提取摘要金句
pm-image2proto
截圖復刻網頁原型,自動生成 Next.js 項目
motionsites.ai
提供多款靚嘅前端樣式,畀 Agent 參考執行
M2.7 整體定位:平價旗艦,專食日常細活
M2.7 嘅位置好微妙。Opus 4.7 係天花板,但價格係 M2.7 嘅 15 倍;DeepSeek V4 Pro 貴 3 倍,強項係推理同深度調試;GLM-5.1 主打長程穩定,但貴 20%。M2.7 企喺最平嘅旗艦檔位,再落去嘅小模型只做到玩具項目。
作者每日有大量 Token 消耗大、但定義清晰嘅細碎任務
好似每日 RSS 總結、播客翻譯、PDF 轉 PPT、復刻網頁原型呢啲,鏈路唔長但對工具穩定性要求高。呢個正正係 M2.7 嘅舒適區。
定時任務:RSS、播客、選題一條龍自動化
作者將 M2.7 接入 OpenClaw,實現咗幾個定時執行嘅任務。每日自動推送資訊畀佢,唔使再手動掃。
- 1 RSS 總結:用 rss-aggregator Skill 訂閲博客,每日跑三次,按主題歸類推送
- 2 播客自動處理:掃 100 幾個 YouTube 頻道,拉字幕翻譯,提取金句,存入飛書知識庫
- 3 選題素材採集:每日掃 X、即刻、小紅書嘅關鍵詞,抓爆款內容,順手生成選題
成個流程一條龍,作者起身直接睇精華版,唔使花個幾鐘聽原聲
呢啲任務以前係想做但懶得做,而家有 Agent 默默行,每日打開飛書就有一疊乾貨。
PDF 轉 PPT:唔係截圖,係真正重建
作者將一份掃描型財報 PDF 同時丟畀 DeepSeek V4 Pro 同 M2.7 做轉換,結果高下立見。
呢個差距在於任務理解:用戶要嘅係一份能編輯嘅 PPT,唔係長得似嘅文件
M2.7 會諗清楚用戶拿到 PPT 後要做咩,呢種特質喺後面幾個案度反覆出現。
長程任務:半小時唔斷氣,仲識自己除錯
作者用 pm-image2proto Skill 測試長程穩定性:截圖、分析佈局、初始化 Next.js 項目、逐組件復刻、調樣式、本地部署,全部自動。
任務行咗接近一個鐘,幾十輪工具調用,完全冇中斷
- M2.7 自己對比原頁面同本地渲染差異,調整佈局參數
- 有個組件嘅響應式斷點未處理好,佢自己排查修復,全程冇問人
- 最後生成嘅項目結構清晰,仲附帶一份設計文檔
以前國產模型跑到一半就要手動接力,而家 M2.7 可以一口氣跑完
呢個案例令作者有信心用 M2.7 做 VibeCoding 全棧開發,性價比極高。
旗艦模型一個月更新一次,選擇有好多:Minimax2.7、DeepSeek V4 、GLM-5.1 、Kimi K2.6 、Claude Opus 4.7、codex 5.5,
好多朋友話唔知點揀。
我主力用嘅 Claude,但係都會遇到 token 唔夠嘅情況。
呢個時候就需要揾啲平替,我見到 Minimax 喺海外嘅評價好高。
Hermes 創始人話,佢係性價比最正嘅模型。

OpenClaw 創始人 Peter 早喺今年 1 月佢就喺 X 同播客裏面話 Minimax 係「當下最好嘅開源模型」,編程任務上可以用 5% 嘅成本接近 CodeX 嘅效果。

我就抱住好奇嘅心態,嚟試嚇 Minimax 最新嘅 M2.7 到底點?
呢一個月,幾百次 Skill 調用,幾十個項目,多項橫向對比,
我可以先落結論:Minimax M2.7係模型令我使嘅錢最少、嘢做得最穩嘅國產模型。
M2.7 嘅位置好微妙。
Opus 4.7 唔使質疑,係天花板,但係價格大概係 M2.7 嘅 15 倍,複雜架構、跨文件重構呢種嘢佢最穩。
DeepSeek V4 Pro 價格係 M2.7 嘅 3 倍左右,強推理、深度調試係佢嘅強項。

GLM-5.1 呢一版主打長程任務穩定性,但係價格比 M2.7 貴大約 20% 左右。
M2.7 自己就企喺最平嘅旗艦檔位上面。
再落去仲有一堆 0.5 倍價格嘅小模型,但係只可以做玩具項目。
我每日嘅工作有好多瑣碎嘅嘢,例如:
每日定時幫我搜尋網絡上嘅播客、RSS 資訊,幫我轉成日報 將一份 PDF 轉成 PPT 幫文章配幾張 HTML 嘅邏輯圖 復刻一個網頁原型 畫幾個流程圖
呢啲嘢嘅共同點係:Token 消耗多、任務定義清晰、鏈路唔長、對工具調用穩定性要求高。
呢個啱啱係 M2.7 嘅舒適區,佢嘅真實表現點樣?
可以睇嚇下面呢幾個我呢個星期真實跑過嘅 case。
我將 M2.7 接入咗去我嘅 openclaw,就可以喺飛書裏面主動收到 openclaw 俾我嘅訊息。
我整咗幾個定時執行嘅任務,每日有幾次佢會俾我發我關注嘅博主嘅資訊,將我關注嘅 YouTube 嘅視頻轉成音頻,同埋我關注嘅一啲話題,推送一啲選題方案俾我。
1 每日早上 RSS 總結
我用嘅係rss-aggregator(github.com/zephyrwang6/info-skill)呢個 Skill,將訂閲嘅博客同資訊源博主地址餵俾佢,定時每日跑三次,按主題歸類,提煉出當日值得睇嘅幾條,自動推去飛書。

2 播客自動處理
我關注嘅 100 幾個 YouTube 頻道只要有更新,M2.7 就會幫我揀一個精華總結成文字畀我。
它先用youtube-feed掃最近 48 小時嘅新視頻,再用youtube-transcript-cn將字幕拉落嚟翻成中文,最後用podcast-workflow行一次摘要、金句提取,全部塞入飛書知識庫。成個流程一條龍,我起身直接睇精華版,唔使花 1 個鐘聽原聲。
Skill 地址:github.com/zephyrwang6/info-skill

3 選題素材採集。
每日掃一次 X、即刻、小紅書嘅關鍵詞,將同我領域相關嘅爆款內容抓返嚟歸檔,順手生成選題候選。
我早上起身,去睇一眼,有邊啲值得研究嘅就深入去睇。
Skill 地址:github.com/zephyrwang6/info-skill

呢啲任務以前都係「想做但懶得做」,而家 Agent 喺嗰度默默咁行,每日早上打開飛書就有一疊乾貨等我睇。
Minimax 可以精準咁調用工具搜索海內外資訊,俾到我總結分析。
任務好簡單,將一份圖片型掃描財報 PDF,轉成可編輯嘅 PPTX。
我同時丟咗俾 DeepSeek V4 Pro 同 M2.7,兩個都用咗 Minimax 官方 Office Skills(github.com/MiniMax-AI/skills)
DS V4 Pro 嘅做法都幾「聰明」㗎。佢發現係圖片型 PDF,冇辦法直接讀文字,於是揀咗最慳事嘅路徑,將每頁 PDF 截圖,作為一張圖片塞入 PPT。出嚟嘅 .pptx 開到,睇落又好似係咁回事。

但係㩒入去一睇,每頁就係一張圖。唔可以改字、唔可以調整樣式、唔可以重用模板。
M2.7 先識別出呢個係圖片型 PDF,主動調用 OCR 將文字抽返出嚟。然後分析咗每頁嘅版式,將內容按結構化方式重建成原生 PPT 形狀。

成品同我哋手搓嘅 PPT 幾乎冇分別,字改得、表編輯得、模板套得到。

呢個差距有意思嘅地方在於任務理解。
DS V4 Pro 截圖貼 PPT 呢個方案技術上完全行得通。但係佢冇理解我要嘅唔係「一份長得像 PPT 嘅文件」,而係「一份可以編輯嘅 PPT」。
M2.7 喺動手之前先諗咗一下,呢個用戶拎到 PPT 之後想做咩?
呢種「想清楚再動手」嘅特質,喺我後面幾個 case 裏面反覆出現。
呢個係我敢用 Minimax M2.7 開發產品嘅最大原因,佢設計嘅頁面真係幾靚㗎,可以睇嚇下面呢個效果:


成個頁面嘅字體係精心設計過嘅,頁面仲有動效。
如果你想令模型產出嘅前端效果更加靚,可以用呢個網站(motionsites.ai)提供嘅各種美觀嘅前端樣式,俾 Agent 參考執行。
呢個係我最睇重嘅一項,我嘅工作有太多嘢要畫原型。
我之前寫過一個 Skill 叫pm-image2proto(github.com/zephyrwang6/pm-skills)截一張參考網頁嘅圖掟入去,佢分析佈局、初始化 Next.js 項目、配 Tailwind、逐個組件復刻、調樣式、本地部署,全自動。
呢種任務嘅特點係半個鐘起步、幾十輪工具調用、上下文壓力極大。
下面係 M2.7 復刻嘅本地化工程文件,幾十個代碼文件,好全面。

中途遇到咗幾次樣式對唔上嘅情況,佢自己對比咗原頁面同本地渲染嘅差異,調整咗佈局參數。有一個組件嘅響應式斷點冇處理好,佢都自己排查修返好,全程冇問過我。
大概行咗半個幾鐘,任務完成。本地項目部署好咗,瀏覽器打開直接睇到效果。出嚟嘅嘢超出預期。項目結構清晰,組件拆分合理。

仲附帶咗一份設計文檔,記錄咗頁面嘅佈局邏輯、組件層級、交互說明。拎嚟做產品原型完全夠用,甚至可以直接喺呢個基礎上繼續開發。

全程冇中斷。
接近一個鐘嘅長程任務,幾十輪工具調用,由訪問網頁到寫代碼到調試部署,一口氣行曬。呢個喺之前用國產模型嘅時候係唔敢諗嘅。以前同樣嘅 Skill,行到一半基本就要手動接力。
我之前做嘅呢啲 Skill,唔再只可以綁死喺海外模型上面啦。
順便講嚇 url2proto 呢個 Skill 嘅另一個用法:vibe coding。
唔一定非要復刻現有頁面,亦都可以將一個參考頁面嘅連結掟入去,話俾佢知「參考呢個風格,幫我搭一個 XXX 產品嘅框架」,佢會喺復刻嘅基礎上按需求改造,快速出一個可以運行嘅工程文件。
呢個案例令我有信心用 M2.7 嚟實現 vibecoding,做全棧開發。
M2.7 嘅 Token Plan 嘅價格同海外模型比起來平好多。

喺價格方面,M2.7 只有 GLM-5.1 嘅 80%,穩定性同等,係更划算嘅選擇。
MiniMax 嘅 Token Plan 仲支援圖片、音頻、視頻生成嘅額度都計埋入去,而且唔佔用編程額度。
我前幾日用一個 Agent 全自動整咗條產品介紹影片:寫文案、合成語音、配圖、配樂。
以前呢個係一整條工作流程,而家一個 OpenClaw 會話行得通。
而家理解咗點解 openclaw 同 Hermes 創始人話 Minimax 係最好用嘅開源模型。
如果你同我一樣,每日靠 Agent 行大量真實任務、對每一蚊嘅產出敏感、唔想再為某個模型嘅「小聰明」埋單,M2.7 值得排到主力候選第一位。
佢平,但係唔會求其。佢唔係頂配,但夠用、穩定、聽話。
旗艦模型一個月更新一次,選擇有很多:Minimax2.7、DeepSeek V4 ,GLM-5.1 ,Kimi K2.6 ,Claude Opus 4.7、codex 5.5,
很多朋友反饋不知道怎麼選。
我主力用的 Claude,但還是會遇到 token 不夠的情況。
這時候就需要找一些平替,我看到 Minimax 在海外的評價很高。
Hermes 創始人說,它是性價比最棒的模型。

OpenClaw 創始人 Peter 早在今年 1 月他就在 X 上和播客裏說 Minimax 是"當下最好的開源模型",編程任務上能用 5% 的成本接近 CodeX 的效果。

我就抱着好奇的心態,來測一測 Minimax 最新的 M2.7 到底如何?
這一個月,幾百次 Skill 調用,幾十個項目,多項橫向對比,
我可以先下結論:Minimax M2.7是模型讓我花的錢最少、活幹得最穩的國產模型。
M2.7 的位置很微妙。
Opus 4.7 不用質疑,是天花板,但價格大概是 M2.7 的 15 倍,複雜架構、跨文件重構這種活它最穩。
DeepSeek V4 Pro 價格是 M2.7 的 3 倍左右,強推理、深度調試是它的強項。

GLM-5.1 這一版主打長程任務穩定性,但價格比 M2.7 貴個 20% 左右。
M2.7 自己就站在最便宜的旗艦檔位上。
再往下還有一堆 0.5 倍價格的小模型,但只能幹玩具項目。
我每天的工作有很多細碎的活,比如:
每日定時給我搜索網絡上的播客、RSS 信息給我轉成日報 把一份 PDF 轉成 PPT 給文章配幾張HTML 的邏輯圖 復刻一個網頁原型 畫幾個流程圖
這些活的共同點是:Token 消耗多、任務定義清晰、鏈路不長、對工具調用穩定性要求高。
這恰好是 M2.7 的舒適區,它的真實表現如何?
可以看看下面這幾個我這周真實跑過的case。
我把 M2.7 接入到了我的 openclaw,就可以在飛書裏面主動收到 openclaw 發給我的消息。
我做了幾個定時執行的任務,每天有幾次他會給我發我關注的博主的信息,我關注的 YouTube 的視頻轉成音頻,我關注的一些話題,給我推送一些選題方案。
1 每天早上 RSS 總結
我用的是rss-aggregator(github.com/zephyrwang6/info-skill)這個 Skill,把訂閲的博客和資訊源博主地址餵給它,定時每天跑三次,按主題歸類,提煉出當天值得看的幾條,自動推到飛書。

2 播客自動處理
我關注的 100 多個 YouTube 頻道只要有更新,M2.7 就會給我挑選一個精品總結成文字發給我。
它先用youtube-feed掃最近 48 小時的新視頻,再用youtube-transcript-cn把字幕拉下來翻成中文,最後走podcast-workflow跑一遍摘要、金句提取,全部塞進飛書知識庫。整個流程一條龍,我醒來直接看精華版,不用花 1 小時聽原聲。
Skill 地址:github.com/zephyrwang6/info-skill

3 選題素材採集。
每天掃一遍 X、即刻、小紅書的關鍵詞,把跟我領域相關的爆款內容抓回來歸檔,順手生成選題候選。
我早上醒來,去掃一眼,有哪些值得研究的就深入去看。
Skill 地址:github.com/zephyrwang6/info-skill

這些任務以前都是"想做但懶得做",現在 Agent 在那兒默默跑,每天早上打開飛書就有一沓乾貨等着我。
Minimax 可以精準的調用工具搜索海內外信息,給到我總結分析。
任務很簡單,把一份圖片型掃描財報 PDF,轉成可編輯的 PPTX。
我同時丟給了 DeepSeek V4 Pro 和 M2.7,兩個都用到的 Minimax 官方 Office Skills(github.com/MiniMax-AI/skills)
DS V4 Pro 的做法挺"聰明"的。它發現是圖片型 PDF,沒辦法直接讀文字,於是選了最省事的路徑,把每頁 PDF 截圖,作為一張圖片塞進 PPT。出來的 .pptx 能打開,看起來也像那麼回事。

但點進去一看,每頁就是一張圖。不能改字、不能調樣式、不能複用模板。
M2.7 先識別出這是圖片型 PDF,主動調 OCR 把文字扣出來。然後分析了每頁的版式,把內容按結構化方式重建成原生 PPT 形狀。

成品和我們手搓的 PPT 幾乎無差,字能改、表能編輯、模板能套。

這個差距有意思的地方在於任務理解。
DS V4 Pro 截圖貼 PPT 這個方案技術上完全跑通。但它沒理解我要的不是"一份長得像 PPT 的文件",是"一份能編輯的 PPT"。
M2.7 在動手前先想了一下,這個用戶拿到 PPT 之後要幹嘛?
這種"想清楚再動手"的特質,在我後面幾個 case 裏反覆出現。
這是我敢用 Minimax M2.7 開發產品的最大原因,它設計的頁面真的還挺不錯的,可以看看下面這個效果:


整個頁面的字體是精心設計過的,頁面也有動效。
如果你想讓模型產出的前端效果更好看,可以使用這個網站(motionsites.ai)提供的各種美觀的前端樣式,給到 Agent 參考執行。
這是我最看重的一項,我的工作有太多原型畫。
我之前寫過一個 Skill 叫pm-image2proto(github.com/zephyrwang6/pm-skills)截一張參考網頁的圖丟進去,它分析佈局、初始化 Next.js 項目、配 Tailwind、逐組件復刻、調樣式、本地部署,全自動。
這種任務的特點是半小時起步、幾十輪工具調用、上下文壓力極大。
下面是 M2.7 復刻的本地化工程文件,幾十個代碼文件,很全面。

中間遇到了幾次樣式對不上的情況,它自己對比了原頁面和本地渲染的差異,調整了佈局參數。有一個組件的響應式斷點沒處理好,它也自己排查修掉了,全程沒問我。
大概跑了半個多小時,任務完成。本地項目部署好了,瀏覽器打開直接能看到效果。出來的東西超出預期。項目結構清晰,組件拆分合理。

還附帶了一份設計文檔,記錄了頁面的佈局邏輯、組件層級、交互說明。拿來做產品原型完全夠用,甚至可以直接在這個基礎上繼續開發。

全程沒中斷。
接近一個小時的長程任務,幾十輪工具調用,從訪問網頁到寫代碼到調試部署,一口氣跑完了。這在之前用國產模型的時候是不敢想的。以前同樣的 Skill,跑到一半基本就得手動接力。
我之前做的這些 Skill,不再只能綁死在海外模型上了。
順便說一下 url2proto 這個 Skill 的另一個用法:vibe coding 。
不一定非要復刻現有頁面,也可以把一個參考頁面的連結丟進去,告訴它"參考這個風格,幫我搭一個 XXX 產品的框架",它會在復刻的基礎上按需求改造,快速出一個可運行的工程文件。
這個案例讓我有信心用 M2.7 來實現 vibecoding,做全棧開發。
M2.7 的Token Plan 的價格和海外模型比起來便宜挺多的。

在價格方面,M2.7 只有 GLM-5.1 的 80%,穩定性同等,是更划算的選擇。
MiniMax 的 Token Plan 還支持圖片、音頻、視頻生成的額度也算進去,且不佔編程額度。
我前幾天用一個 Agent 全自動做了條產品介紹視頻:寫文案、合成語音、配圖、配樂。
以前這是一整條工作流,現在一個 OpenClaw 會話跑通。
現在理解了為什麼 openclaw 和 Hermes 創始人說 Minimax 是最好用的開源模型。
如果你跟我一樣,每天靠 Agent 跑大量真實任務、對每一塊錢的產出敏感、不想再為某個模型的"小聰明"買單,M2.7 值得排到主力候選第一位。
它便宜,但不糊弄。它不是頂配,但夠用、穩定、聽話。