openclaw & hermes 創始人盛讚的 Minimax,到底表現如何?

作者:空格的鍵盤
日期:2026年4月30日 下午2:34
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Minimax M2.7 性價比極高,夠穩定又聽話,係日常編程同自動化任務嘅抵用之選

整理版摘要

呢篇文章係一位主力用 Claude 嘅開發者,因為成日唔夠 Token,所以想揾平替模型。佢見到 OpenClawHermes 創始人喺海外都讚 Minimax,於是測試咗最新嘅 M2.7 模型成個月,用咗幾百次 Skill 調用同幾十個項目。

作者先交代咗 M2.7 喺市場上嘅定位:比唔上 Opus 4.7 嘅天花板,但價格只係佢嘅 1/15;比 DeepSeek V4 Pro 平約 3 倍,弱喺強推理但日常任務好使好用。佢每日有大量細碎嘅 Token 消耗任務,例如 RSS 總結、播客翻譯、PDF 轉 PPT、復刻網頁原型呢類定義清晰、鏈路唔長嘅工作,而 M2.7 正好勝任。

整體結論係M2.7 係佢用過最平又最穩嘅國產模型。佢透過多個實際案例證明咗模型嘅穩定性——定時任務日日自動執行、PDF 識玩 OCR 重建而非偷雞截圖、長程任務跑足半個鐘唔斷氣。佢認為呢個模型「想清楚先做」,唔會投機取巧,值得擺做主力候選。

  • M2.7 係最平又最穩嘅國產模型,性價比遠超其他旗艦。
  • 作者將 M2.7 接入 OpenClaw,用 Skill 實現自動化 RSS、播客同選題採集。
  • DeepSeek V4 Pro 相比,M2.7PDF 轉 PPT 識 OCR 重建內容,唔係單純貼圖。
  • M2.7 可以穩定跑半小時以上長程任務,幾十輪工具調用唔中斷。
  • 建議用 M2.7VibeCoding 全棧開發,成本低效果好。
值得記低
Skill github.com

info-skill (RSS 聚合)

訂閲博客同資訊源,定時總結推送至飛書

Skill github.com

info-skill (播客自動處理)

掃 YouTube 頻道,拉字幕翻譯,提取摘要金句

Skill github.com

pm-image2proto

截圖復刻網頁原型,自動生成 Next.js 項目

連結 motionsites.ai

motionsites.ai

提供多款靚嘅前端樣式,畀 Agent 參考執行

整理重點

M2.7 整體定位:平價旗艦,專食日常細活

M2.7 嘅位置好微妙。Opus 4.7 係天花板,但價格係 M2.7 嘅 15 倍;DeepSeek V4 Pro 貴 3 倍,強項係推理同深度調試;GLM-5.1 主打長程穩定,但貴 20%。M2.7 企喺最平嘅旗艦檔位,再落去嘅小模型只做到玩具項目。

作者每日有大量 Token 消耗大、但定義清晰嘅細碎任務

好似每日 RSS 總結、播客翻譯、PDFPPT、復刻網頁原型呢啲,鏈路唔長但對工具穩定性要求高。呢個正正係 M2.7 嘅舒適區。

整理重點

定時任務:RSS、播客、選題一條龍自動化

作者將 M2.7 接入 OpenClaw,實現咗幾個定時執行嘅任務。每日自動推送資訊畀佢,唔使再手動掃。

  1. 1 RSS 總結:用 rss-aggregator Skill 訂閲博客,每日跑三次,按主題歸類推送
  2. 2 播客自動處理:掃 100 幾個 YouTube 頻道,拉字幕翻譯,提取金句,存入飛書知識庫
  3. 3 選題素材採集:每日掃 X、即刻、小紅書嘅關鍵詞,抓爆款內容,順手生成選題

成個流程一條龍,作者起身直接睇精華版,唔使花個幾鐘聽原聲

呢啲任務以前係想做但懶得做,而家有 Agent 默默行,每日打開飛書就有一疊乾貨。

整理重點

PDF 轉 PPT:唔係截圖,係真正重建

作者將一份掃描型財報 PDF 同時丟畀 DeepSeek V4 ProM2.7 做轉換,結果高下立見。

呢個差距在於任務理解:用戶要嘅係一份能編輯嘅 PPT,唔係長得似嘅文件

M2.7 會諗清楚用戶拿到 PPT 後要做咩,呢種特質喺後面幾個案度反覆出現。

整理重點

長程任務:半小時唔斷氣,仲識自己除錯

作者用 pm-image2proto Skill 測試長程穩定性:截圖、分析佈局、初始化 Next.js 項目、逐組件復刻、調樣式、本地部署,全部自動。

任務行咗接近一個鐘,幾十輪工具調用,完全冇中斷

  • M2.7 自己對比原頁面同本地渲染差異,調整佈局參數
  • 有個組件嘅響應式斷點未處理好,佢自己排查修復,全程冇問人
  • 最後生成嘅項目結構清晰,仲附帶一份設計文檔

以前國產模型跑到一半就要手動接力,而家 M2.7 可以一口氣跑完

呢個案例令作者有信心用 M2.7VibeCoding 全棧開發,性價比極高。

國產編程模型呢幾個月卷得好離譜。

旗艦模型一個月更新一次,選擇有好多:Minimax2.7、DeepSeek V4 、GLM-5.1 、Kimi K2.6 、Claude Opus 4.7、codex 5.5,

好多朋友話唔知點揀。

我主力用嘅 Claude,但係都會遇到 token 唔夠嘅情況。

呢個時候就需要揾啲平替,我見到 Minimax 喺海外嘅評價好高。

Hermes 創始人話,佢係性價比最正嘅模型。

飛書文檔 - 圖片

OpenClaw 創始人 Peter 早喺今年 1 月佢就喺 X 同播客裏面話 Minimax 係「當下最好嘅開源模型」,編程任務上可以用 5% 嘅成本接近 CodeX 嘅效果。

飛書文檔 - 圖片

我就抱住好奇嘅心態,嚟試嚇 Minimax 最新嘅 M2.7 到底點?

呢一個月,幾百次 Skill 調用,幾十個項目,多項橫向對比,

我可以先落結論:Minimax M2.7係模型令我使嘅錢最少、嘢做得最穩嘅國產模型。

01 M2.7 整體評價

M2.7 嘅位置好微妙。

Opus 4.7 唔使質疑,係天花板,但係價格大概係 M2.7 嘅 15 倍,複雜架構、跨文件重構呢種嘢佢最穩。

DeepSeek V4 Pro 價格係 M2.7 嘅 3 倍左右,強推理、深度調試係佢嘅強項。

飛書文檔 - 圖片

GLM-5.1 呢一版主打長程任務穩定性,但係價格比 M2.7 貴大約 20% 左右。

M2.7 自己就企喺最平嘅旗艦檔位上面。

再落去仲有一堆 0.5 倍價格嘅小模型,但係只可以做玩具項目。

我每日嘅工作有好多瑣碎嘅嘢,例如:

  • 每日定時幫我搜尋網絡上嘅播客、RSS 資訊,幫我轉成日報
  • 將一份 PDF 轉成 PPT
  • 幫文章配幾張 HTML 嘅邏輯圖
  • 復刻一個網頁原型
  • 畫幾個流程圖

呢啲嘢嘅共同點係:Token 消耗多、任務定義清晰、鏈路唔長、對工具調用穩定性要求高

呢個啱啱係 M2.7 嘅舒適區,佢嘅真實表現點樣?

可以睇嚇下面呢幾個我呢個星期真實跑過嘅 case。

02 用 M2.7 執行定時任務

我將 M2.7 接入咗去我嘅 openclaw,就可以喺飛書裏面主動收到 openclaw 俾我嘅訊息。

我整咗幾個定時執行嘅任務,每日有幾次佢會俾我發我關注嘅博主嘅資訊,將我關注嘅 YouTube 嘅視頻轉成音頻,同埋我關注嘅一啲話題,推送一啲選題方案俾我。

1 每日早上 RSS 總結

我用嘅係rss-aggregator(github.com/zephyrwang6/info-skill)呢個 Skill,將訂閲嘅博客同資訊源博主地址餵俾佢,定時每日跑三次,按主題歸類,提煉出當日值得睇嘅幾條,自動推去飛書。

飛書文檔 - 圖片

2 播客自動處理

我關注嘅 100 幾個 YouTube 頻道只要有更新,M2.7 就會幫我揀一個精華總結成文字畀我。

它先用youtube-feed掃最近 48 小時嘅新視頻,再用youtube-transcript-cn將字幕拉落嚟翻成中文,最後用podcast-workflow行一次摘要、金句提取,全部塞入飛書知識庫。成個流程一條龍,我起身直接睇精華版,唔使花 1 個鐘聽原聲。

Skill 地址:github.com/zephyrwang6/info-skill

飛書文檔 - 圖片

3 選題素材採集。

每日掃一次 X、即刻、小紅書嘅關鍵詞,將同我領域相關嘅爆款內容抓返嚟歸檔,順手生成選題候選。

我早上起身,去睇一眼,有邊啲值得研究嘅就深入去睇。

Skill 地址:github.com/zephyrwang6/info-skill

飛書文檔 - 圖片

呢啲任務以前都係「想做但懶得做」,而家 Agent 喺嗰度默默咁行,每日早上打開飛書就有一疊乾貨等我睇。

Minimax 可以精準咁調用工具搜索海內外資訊,俾到我總結分析。

03 PDF 轉可編輯嘅 PPT

任務好簡單,將一份圖片型掃描財報 PDF,轉成可編輯嘅 PPTX。

我同時丟咗俾 DeepSeek V4 Pro 同 M2.7,兩個都用咗 Minimax 官方 Office Skills(github.com/MiniMax-AI/skills

DS V4 Pro 嘅做法都幾「聰明」㗎。佢發現係圖片型 PDF,冇辦法直接讀文字,於是揀咗最慳事嘅路徑,將每頁 PDF 截圖,作為一張圖片塞入 PPT。出嚟嘅 .pptx 開到,睇落又好似係咁回事。

飛書文檔 - 圖片

但係㩒入去一睇,每頁就係一張圖。唔可以改字、唔可以調整樣式、唔可以重用模板。

M2.7 先識別出呢個係圖片型 PDF,主動調用 OCR 將文字抽返出嚟。然後分析咗每頁嘅版式,將內容按結構化方式重建成原生 PPT 形狀。

飛書文檔 - 圖片

成品同我哋手搓嘅 PPT 幾乎冇分別,字改得、表編輯得、模板套得到。

飛書文檔 - 圖片

呢個差距有意思嘅地方在於任務理解

DS V4 Pro 截圖貼 PPT 呢個方案技術上完全行得通。但係佢冇理解我要嘅唔係「一份長得像 PPT 嘅文件」,而係「一份可以編輯嘅 PPT」。

M2.7 喺動手之前先諗咗一下,呢個用戶拎到 PPT 之後想做咩?

呢種「想清楚再動手」嘅特質,喺我後面幾個 case 裏面反覆出現。

04 前端審美在線

呢個係我敢用 Minimax M2.7 開發產品嘅最大原因,佢設計嘅頁面真係幾靚㗎,可以睇嚇下面呢個效果:

飛書文檔 - 圖片
飛書文檔 - 圖片

成個頁面嘅字體係精心設計過嘅,頁面仲有動效。

如果你想令模型產出嘅前端效果更加靚,可以用呢個網站(motionsites.ai)提供嘅各種美觀嘅前端樣式,俾 Agent 參考執行。

05 半個鐘長程任務

呢個係我最睇重嘅一項,我嘅工作有太多嘢要畫原型。

我之前寫過一個 Skill 叫pm-image2protogithub.com/zephyrwang6/pm-skills)截一張參考網頁嘅圖掟入去,佢分析佈局、初始化 Next.js 項目、配 Tailwind、逐個組件復刻、調樣式、本地部署,全自動。

呢種任務嘅特點係半個鐘起步、幾十輪工具調用、上下文壓力極大。

下面係 M2.7 復刻嘅本地化工程文件,幾十個代碼文件,好全面。

飛書文檔 - 圖片

中途遇到咗幾次樣式對唔上嘅情況,佢自己對比咗原頁面同本地渲染嘅差異,調整咗佈局參數。有一個組件嘅響應式斷點冇處理好,佢都自己排查修返好,全程冇問過我。

大概行咗半個幾鐘,任務完成。本地項目部署好咗,瀏覽器打開直接睇到效果。出嚟嘅嘢超出預期。項目結構清晰,組件拆分合理。

飛書文檔 - 圖片

仲附帶咗一份設計文檔,記錄咗頁面嘅佈局邏輯、組件層級、交互說明。拎嚟做產品原型完全夠用,甚至可以直接喺呢個基礎上繼續開發。

飛書文檔 - 圖片

全程冇中斷。

接近一個鐘嘅長程任務,幾十輪工具調用,由訪問網頁到寫代碼到調試部署,一口氣行曬。呢個喺之前用國產模型嘅時候係唔敢諗嘅。以前同樣嘅 Skill,行到一半基本就要手動接力。

我之前做嘅呢啲 Skill,唔再只可以綁死喺海外模型上面啦。

順便講嚇 url2proto 呢個 Skill 嘅另一個用法:vibe coding。

唔一定非要復刻現有頁面,亦都可以將一個參考頁面嘅連結掟入去,話俾佢知「參考呢個風格,幫我搭一個 XXX 產品嘅框架」,佢會喺復刻嘅基礎上按需求改造,快速出一個可以運行嘅工程文件。

呢個案例令我有信心用 M2.7 嚟實現 vibecoding,做全棧開發。

M2.7 嘅 Token Plan 嘅價格同海外模型比起來平好多。

飛書文檔 - 圖片

喺價格方面,M2.7 只有 GLM-5.1 嘅 80%,穩定性同等,係更划算嘅選擇。

06 最後

MiniMax 嘅 Token Plan 仲支援圖片、音頻、視頻生成嘅額度都計埋入去,而且唔佔用編程額度。

我前幾日用一個 Agent 全自動整咗條產品介紹影片:寫文案、合成語音、配圖、配樂。

以前呢個係一整條工作流程,而家一個 OpenClaw 會話行得通。

而家理解咗點解 openclaw 同 Hermes 創始人話 Minimax 係最好用嘅開源模型。

如果你同我一樣,每日靠 Agent 行大量真實任務、對每一蚊嘅產出敏感、唔想再為某個模型嘅「小聰明」埋單,M2.7 值得排到主力候選第一位。

佢平,但係唔會求其。佢唔係頂配,但夠用、穩定、聽話。

國產編程模型這幾個月卷得離譜。

旗艦模型一個月更新一次,選擇有很多:Minimax2.7、DeepSeek V4 ,GLM-5.1 ,Kimi K2.6 ,Claude Opus 4.7、codex 5.5,

很多朋友反饋不知道怎麼選。

我主力用的 Claude,但還是會遇到 token 不夠的情況。

這時候就需要找一些平替,我看到 Minimax 在海外的評價很高。

Hermes 創始人說,它是性價比最棒的模型。

飛書文檔 - 圖片

OpenClaw 創始人 Peter 早在今年 1 月他就在 X 上和播客裏說 Minimax 是"當下最好的開源模型",編程任務上能用 5% 的成本接近 CodeX 的效果。

飛書文檔 - 圖片

我就抱着好奇的心態,來測一測 Minimax 最新的 M2.7 到底如何?

這一個月,幾百次 Skill 調用,幾十個項目,多項橫向對比,

我可以先下結論:Minimax M2.7是模型讓我花的錢最少、活幹得最穩的國產模型。

01 M2.7 整體評價

M2.7 的位置很微妙。

Opus 4.7 不用質疑,是天花板,但價格大概是 M2.7 的 15 倍,複雜架構、跨文件重構這種活它最穩。

DeepSeek V4 Pro 價格是 M2.7 的 3 倍左右,強推理、深度調試是它的強項。

飛書文檔 - 圖片

GLM-5.1 這一版主打長程任務穩定性,但價格比 M2.7 貴個 20% 左右。

M2.7 自己就站在最便宜的旗艦檔位上。

再往下還有一堆 0.5 倍價格的小模型,但只能幹玩具項目。

我每天的工作有很多細碎的活,比如:

  • 每日定時給我搜索網絡上的播客、RSS 信息給我轉成日報
  • 把一份 PDF 轉成 PPT
  • 給文章配幾張HTML 的邏輯圖
  • 復刻一個網頁原型
  • 畫幾個流程圖

這些活的共同點是:Token 消耗多、任務定義清晰、鏈路不長、對工具調用穩定性要求高

這恰好是 M2.7 的舒適區,它的真實表現如何?

可以看看下面這幾個我這周真實跑過的case。

02 用 M2.7 執行定時任務

我把 M2.7 接入到了我的 openclaw,就可以在飛書裏面主動收到 openclaw 發給我的消息。

我做了幾個定時執行的任務,每天有幾次他會給我發我關注的博主的信息,我關注的 YouTube 的視頻轉成音頻,我關注的一些話題,給我推送一些選題方案。

1 每天早上 RSS 總結

我用的是rss-aggregator(github.com/zephyrwang6/info-skill)這個 Skill,把訂閲的博客和資訊源博主地址餵給它,定時每天跑三次,按主題歸類,提煉出當天值得看的幾條,自動推到飛書。

飛書文檔 - 圖片

2 播客自動處理

我關注的 100 多個 YouTube 頻道只要有更新,M2.7 就會給我挑選一個精品總結成文字發給我。

它先用youtube-feed掃最近 48 小時的新視頻,再用youtube-transcript-cn把字幕拉下來翻成中文,最後走podcast-workflow跑一遍摘要、金句提取,全部塞進飛書知識庫。整個流程一條龍,我醒來直接看精華版,不用花 1 小時聽原聲。

Skill 地址:github.com/zephyrwang6/info-skill

飛書文檔 - 圖片

3 選題素材採集。

每天掃一遍 X、即刻、小紅書的關鍵詞,把跟我領域相關的爆款內容抓回來歸檔,順手生成選題候選。

我早上醒來,去掃一眼,有哪些值得研究的就深入去看。

Skill 地址:github.com/zephyrwang6/info-skill

飛書文檔 - 圖片

這些任務以前都是"想做但懶得做",現在 Agent 在那兒默默跑,每天早上打開飛書就有一沓乾貨等着我。

Minimax 可以精準的調用工具搜索海內外信息,給到我總結分析。

03 PDF 轉可編輯的 PPT

任務很簡單,把一份圖片型掃描財報 PDF,轉成可編輯的 PPTX。

我同時丟給了 DeepSeek V4 Pro 和 M2.7,兩個都用到的 Minimax 官方 Office Skills(github.com/MiniMax-AI/skills

DS V4 Pro 的做法挺"聰明"的。它發現是圖片型 PDF,沒辦法直接讀文字,於是選了最省事的路徑,把每頁 PDF 截圖,作為一張圖片塞進 PPT。出來的 .pptx 能打開,看起來也像那麼回事。

飛書文檔 - 圖片

但點進去一看,每頁就是一張圖。不能改字、不能調樣式、不能複用模板。

M2.7 先識別出這是圖片型 PDF,主動調 OCR 把文字扣出來。然後分析了每頁的版式,把內容按結構化方式重建成原生 PPT 形狀。

飛書文檔 - 圖片

成品和我們手搓的 PPT 幾乎無差,字能改、表能編輯、模板能套。

飛書文檔 - 圖片

這個差距有意思的地方在於任務理解

DS V4 Pro 截圖貼 PPT 這個方案技術上完全跑通。但它沒理解我要的不是"一份長得像 PPT 的文件",是"一份能編輯的 PPT"。

M2.7 在動手前先想了一下,這個用戶拿到 PPT 之後要幹嘛?

這種"想清楚再動手"的特質,在我後面幾個 case 裏反覆出現。

04 前端審美在線

這是我敢用 Minimax M2.7 開發產品的最大原因,它設計的頁面真的還挺不錯的,可以看看下面這個效果:

飛書文檔 - 圖片
飛書文檔 - 圖片

整個頁面的字體是精心設計過的,頁面也有動效。

如果你想讓模型產出的前端效果更好看,可以使用這個網站(motionsites.ai)提供的各種美觀的前端樣式,給到 Agent 參考執行。

05 半小時長程任務

這是我最看重的一項,我的工作有太多原型畫。

我之前寫過一個 Skill 叫pm-image2protogithub.com/zephyrwang6/pm-skills)截一張參考網頁的圖丟進去,它分析佈局、初始化 Next.js 項目、配 Tailwind、逐組件復刻、調樣式、本地部署,全自動。

這種任務的特點是半小時起步、幾十輪工具調用、上下文壓力極大。

下面是 M2.7 復刻的本地化工程文件,幾十個代碼文件,很全面。

飛書文檔 - 圖片

中間遇到了幾次樣式對不上的情況,它自己對比了原頁面和本地渲染的差異,調整了佈局參數。有一個組件的響應式斷點沒處理好,它也自己排查修掉了,全程沒問我。

大概跑了半個多小時,任務完成。本地項目部署好了,瀏覽器打開直接能看到效果。出來的東西超出預期。項目結構清晰,組件拆分合理。

飛書文檔 - 圖片

還附帶了一份設計文檔,記錄了頁面的佈局邏輯、組件層級、交互說明。拿來做產品原型完全夠用,甚至可以直接在這個基礎上繼續開發。

飛書文檔 - 圖片

全程沒中斷。

接近一個小時的長程任務,幾十輪工具調用,從訪問網頁到寫代碼到調試部署,一口氣跑完了。這在之前用國產模型的時候是不敢想的。以前同樣的 Skill,跑到一半基本就得手動接力。

我之前做的這些 Skill,不再只能綁死在海外模型上了。

順便說一下 url2proto 這個 Skill 的另一個用法:vibe coding 。

不一定非要復刻現有頁面,也可以把一個參考頁面的連結丟進去,告訴它"參考這個風格,幫我搭一個 XXX 產品的框架",它會在復刻的基礎上按需求改造,快速出一個可運行的工程文件。

這個案例讓我有信心用 M2.7 來實現 vibecoding,做全棧開發。

M2.7 的Token Plan 的價格和海外模型比起來便宜挺多的。

飛書文檔 - 圖片

在價格方面,M2.7 只有 GLM-5.1 的 80%,穩定性同等,是更划算的選擇。

06 最後

MiniMax 的 Token Plan 還支持圖片、音頻、視頻生成的額度也算進去,且不佔編程額度。

我前幾天用一個 Agent 全自動做了條產品介紹視頻:寫文案、合成語音、配圖、配樂。

以前這是一整條工作流,現在一個 OpenClaw 會話跑通。

現在理解了為什麼 openclaw 和 Hermes 創始人說 Minimax 是最好用的開源模型。

如果你跟我一樣,每天靠 Agent 跑大量真實任務、對每一塊錢的產出敏感、不想再為某個模型的"小聰明"買單,M2.7 值得排到主力候選第一位。

它便宜,但不糊弄。它不是頂配,但夠用、穩定、聽話。