用 MiniMax M3 分析財報,效果有點驚豔!
整理版優先睇
MiniMax M3 模型金融分析實測:一條龍勝過多模型接力
呢篇文章係一位 AI 實測者親身試用 MiniMax 最新開源模型 M3,針對金融分析場景做嘅深度評測。作者想睇嚇 M3 嘅多模態、長上下文同編碼能力,係咪真係可以一條龍完成睇 K 線圖、讀財報、做可視化圖表嗰啲分析工作。整體嚟講,M3 嘅表現相當驚豔,唔單止識別準確、推理嚴謹,仲可以獨立完成成條分析鏈路,唔使好似以前咁要靠閉源模型或者切換唔同工具。
實測入面,作者將 M3 分別同 Gemini 3.1 Pro 同 DeepSeek V4 Pro 做對比。喺 K 線圖識別方面,M3 嘅細緻程度略勝 Gemini,連關鍵嘅大陽線都睇得出;喺財報分析方面,M3 提取數字嗰陣仲會自行驗證加總,確保冇遺漏,而 DeepSeek 就出咗攪錯幣種嘅低級錯誤。Coding 能力方面,M3 一次生成嘅 HTML 分析頁面包含 K 線圖,UI 簡潔直觀,比 DeepSeek 好得多。
最值得留意嘅係 M3 嘅總結態度——佢唔會強行畀出買定沽嘅結論,而係客觀列出利多同風險因素,甚至主動標明財報入面有可疑嘅數據變動。呢種嚴謹同負責任嘅風格,令作者覺得佢更加靠譜。成個實測展示咗 M3 作為開源模型,已經有能力勝任過往只有閉源商用模型先做到嘅全流程分析工作,對於重視數據私隱嘅用戶嚟講,係一個好吸引嘅選擇。
- M3 係全球首個將超長上下文、前沿編碼同原生多模態集於一身嘅開源模型,可以一條龍完成金融分析鏈路。
- K 線圖識別上,M3 嘅細緻程度略勝 Gemini 3.1 Pro,可以具體指出關鍵大陽線同突破位置。
- 財報分析中,M3 提取數字準確,仲會自行驗證各業務線加總,確保冇遺漏;DeepSeek 就搞錯歐盟罰款幣種,金融場景係嚴重錯誤。
- Coding 能力大幅提升,一次生成嘅 HTML 分析頁面包含 K 線圖,UI 比 DeepSeek 更簡潔美觀,數據呈現直觀。
- M3 喺總結時保持客觀,唔強行下結論,只列出利多風險同不確定性,甚至主動標出財報入面未解釋嘅異常數據,態度專業靠譜。
M3 模型亮點同實測背景
上星期 MiniMax 正式發表新一代旗艦模型 M3,呢個模型最引人注目嘅地方係同時支援 超長上下文、前沿編碼能力同原生多模態。過去兩年大家幾乎都覺得開源模型想同頂級閉源模型相比,必須同時具備呢三項能力,而家 M3 做到咗,仲係全球首個將三者合一嘅開源模型。
作者想測試 M3 係咪真係咁掂,於是揾咗蘋果公司嘅近期股價同最新季度財報,模擬一個金融分析師嘅工作流程——由睇 K 線圖、讀財報,到做可視化圖表同總結。為咗有參考,仲分別用 Gemini 3.1 Pro 同 DeepSeek V4 Pro 做對比。
多模態識別:K 線圖讀取細緻度略勝 Gemini
作者準備咗一張蘋果近半年嘅日 K 線圖,叫 M3 觀察所有信息並講出近期趨勢、波動幅度同最高最低價格。結果 M3 輸出準確,最高點 317.4、最低點 242.97,甚至識別到 K 線圖柱子嘅漲跌幅,指出「5 月初一根紅色大陽線拔地而起,突破壓力線」。
同樣嘅 Prompt 同圖片傳畀 Gemini 3.1 Pro,兩者數值識別準確度唔相伯仲,但論睇圖嘅細緻程度,M3 略勝半籌——佢讀出嘅信息更多、畫面感更強,例如關鍵大陽線細節都觀察到,呢點的確有驚豔到。
長文檔檢索同多步推理:財報分析表現嚴謹
作者將蘋果最新季度財報(幾十頁 PDF)丟畀 M3,要求佢提取核心財務數字、標明出處、計算同比數據同拆解各業務線營收佔比。M3 嘅表現出乎意料,提取嘅數字同頁數大部分正確,計算營收同比時畀出 16.6%,而財報寫 17%,表現得幾嚴謹。
更值得一讚嘅係,M3 仲自己做多一步驗證——將各產品線營收加總同總營收對賬,確認冇遺漏。呢種唔硬湊、唔糊弄嘅態度,令作者覺得佢確實似一位專業分析師。
- M3 對財報入面嘅數字提取同計算準確率好高,仲會自行驗證加總。
- DeepSeek V4 Pro 雖然排版更靚、有 LaTeX 公式,但犯咗嚴重錯誤:將歐盟罰款嘅幣種由歐元錯當做英鎊,金融場景裏面呢種錯好致命。
- 論嚴謹同細節,M3 喺呢次對比中表現更好。
編碼能力同客觀總結:一條龍服務更勝從前
最後測試 M3 嘅 Coding 能力——要求佢將分析 K 線圖同財報得到嘅資訊,做成一個單頁 HTML 分析看板,包含關鍵指標卡片、業務線營收佔比圖表、近期走勢同風險點等。結果 M3 一次生成嘅頁面明顯比 DeepSeek 好,連 K 線圖都畫咗出嚟,而 DeepSeek 個頁面有文字重疊,信息點唔夠簡潔。
作者最後叫 M3 做系統性總結,佢嘅回覆令人印象深刻——唔直接拋出升定跌,而係結合 K 線圖同財報,客觀列出睇好嘅理由、睇淡嘅風險同仲要留意嘅不確定性。佢仲指出財報有一項資產數據變動偏大但原文冇解釋,如實標明「存疑」。呢種唔替讀者拍板、淨係交代判斷依據嘅風格,反而令作者覺得更加靠譜。
上個禮拜,MiniMax 正式推出咗新一代旗艦模型 M3,喺 AI 圈子入面引起咗好多討論。
今次 M3 升級嘅亮點,係同時支援超長上下文、尖端編碼能力同原生多模態。
過去兩年,大家幾乎都覺得開源模型想同頂級閉源模型比併,一定要同時有齊呢三項能力。
而家 M3 做到咗,仲係全球第一個將呢三大能力整合埋一齊嘅開源模型。

跟住就係,為咗配合 M3,MinMax 仲推出咗 MiniMax Code,體驗同 CodeX 差唔多。
今日抽時間體驗嚇,順便實測嚇 M3 模型嘅多模態、Coding 等能力。
今次實測會將 M3 當做一個金融分析師,幫手完成睇 K 線圖、讀財報、做可視化圖表總結。
前幾日,蘋果全球開發者大會 WWDC 啱啱完結,股價有啲波動,啱好用 M3 嚟分析下。
睇 K 線圖
首先嚟睇下 M3 嘅多模態能力準備咗一張蘋果近半年嘅日 K 線圖。
打開 MiniMax Code,叫佢仔細睇清楚 K 線圖上面嘅所有資訊,然後講嚇近期趨勢、波動幅度、最高最低價格等。
可以上下滾動嘅圖片
M3 好快就輸出結果,可能係有啲心急,輸出嘅 Markdown 內容工具都唔記得渲染咗。
但 M3 辨識到嘅資訊全部準確,最高點 317.4、最低點 242.97,仲有各項指標嘅具體數值。
甚至真係睇得明 K 線圖入面啲柱嘅升跌幅,指出 5 月初有一條紅色大陽線突然升起,突破咗壓力線。

同樣嘅 Prompt 同 K 線圖,都 send 咗俾多模態識別入面嘅標杆 Gemini 3.1 Pro 模型,做咗下對比。
講真話,兩者嘅數值辨識準確度都絲毫不差,但論睇圖嘅仔細程度,M3 稍勝一籌。
M3 讀到嘅資訊更多、畫面感更強,例如一條關鍵嘅大陽線都觀察到,呢個的確有啲驚豔。
可以上下滾動嘅圖片
啃財報
準備加難度啦,繼續測試下 M3 模型對 長文檔檢索 和 多步推理能力。
掟俾佢一份蘋果最新季度財報嘅 PDF,有幾十頁內容,順便可以測試 M3 超長上下文嘅表現點樣。
要求佢提取核心財務數字並標明出處,計算核心數據,同埋拆解各業務線營收佔比。
可以上下滾動嘅圖片
M3 嘅表現有啲出乎意料,提取出嚟嘅數字同頁數,大部分我都對過一次,都係正確嘅。
喺計算營收同比嗰陣,佢俾出嚟係 16.6%,而財報入面寫嘅係 17%,表現得幾嚴謹下。
甚至仲自己做一次驗證,將各產品線營收加埋,同總營收對數,確認冇遺漏。

呢種唔硬湊、唔求其、嚴謹嘅表現,呢個時候覺得 M3 的確係一位唔錯嘅專業分析師。
同一份財報同樣 Prompt,今次選擇 send 俾擅長金融分析嘅 DeepSeek V4 Pro 對比嚇。
可以上下滾動嘅圖片
第一眼感覺,DeepSeek 輸出嘅內容排版比 M3 要直觀簡潔好多,而且仲有 LaTeX 公式。
內容排版 M3 稍為輸少少,呢個都可能係 MiniMax Code 對輸出嘅內容渲染仲未好完善。
另外 DeepSeek 喺分析財報提取、計算、同比、佔比呢啲數字都係正確嘅。
但發現咗嚴重嘅錯誤,佢將財報入面一筆歐盟罰款嘅幣種,由「歐元」當成咗「英鎊」。
數字金額冇錯,但對幣種符號佢搞錯咗,呢個喺金融場景入面屬於非常嚴重嘅犯錯。
今次 M3 同 DeepSeek 嘅對比,喺讀文件推算數值呢方面實力相當,但論嚴謹同細節 M3 要好啲。
做可視化分析看板
然後繼續,睇下 M3 今次嘅 Coding 能力據講比上一代模型有咗好大嘅提升。
為咗同 DeepSeek 對比,我先叫 M3 將前面分析 K 線圖同財報得到嘅資訊,做一次整理。
拎到呢份總結之後,分別喺 M3 同 DeepSeek 上新開一個對話,做一個單頁 HTML 分析看板。
要求放上關鍵指標卡片、各業務線營收佔比嘅圖表、近期走勢,同埋風險點等資訊。
下面分別係 M3 同 DeepSeek 出嚟嘅頁面效果圖,兩者都係一次生成。
M3
DeepSeek今次對比好明顯 M3 做出嚟嘅頁面比 DeepSeek 好好多,連 K 線圖都畫埋出嚟。
而 DeepSeek 頁面上嘅營收佔比位置,仲出現咗文字重疊,頁面上嘅資訊點都唔夠簡潔直觀。
同樣一次直出,兩者數據雖然冇錯,但 M3 嘅代碼編寫能力,同 UI 審美更加勝一籌。
下判斷
最後叫 M3 對今次蘋果嘅股票分析做一次系統性嘅總結,作為今次實測嘅收尾。
可以上下滾動嘅圖片
從輸出嘅結果嚟睇,佢冇直接拋出係升定跌,而係將見到嘅 K 線圖同財報結合埋一齊。
客觀咁分別列出睇好嘅理由、睇淡嘅風險,同埋幾處仲要繼續留意嘅不確定性。
仲指出財報入面有一項資產數據變動偏大,但原文冇解釋,都如實標明存疑。
冇強行下定論,唔幫我哋拍板,淨係將判斷依據講清楚,反而令我覺得 M3 更加可靠。
需要說明下,上面分析得到嘅結論,僅供參考,唔構成任何投資建議,大家可以自行評估。
寫喺最後
以上就係今日嘅 M3 體驗,順便同 Gemini 3.1 Pro、DeepSeek-V4-Pro 模型實測對比咗下。
整體嚟睇,M3 今次升級將強大嘅編碼能力、超長上下文同原生多模態能力整合埋一齊之後,可以用佢嚟完成好多工作場景。
就好似今次嘅分析場景,直接用 M3 就可以完成成個分析鏈路,唔使切換到唔同模型、唔同工具嚟接力完成。
無論係對開發者,定係金融從業者嚟講,呢種「全流程跑通」嘅能力,都比單項跑分更有價值。
以前想跑通咁樣成條鏈路,基本上只能依賴閉源商用模型,數據都要交出去。
而家有一個可以自己掌控、私有部署嘅開源模型選擇,對重視數據私隱嘅應用場景就有解決辦法喇。
今日嘅分享到呢度結束,多謝大家抽時間閲讀,我哋下期再見,Respect!
上週,MiniMax 正式發佈了新一代旗艦模型 M3,在 AI 圈子裏引發不少討論。
這次 M3 升級亮點,同時支持超長上下文、前沿編碼能力和原生多模態。
在過去兩年,大家幾乎都覺得開源模型想與頂級閉源模型一比,必須同時具備這三項能力。
如今 M3 做到了,也是全球首個將這三大能力合在一塊的開源模型。

然後就是,為了適配 M3,MinMax 還發布 MiniMax Code,體驗和 CodeX 類似。
今天抽空體驗一下,同時實測看看 M3 模型的 多模態、Coding 等能力。
這次實測會把 M3 當成一名金融分析師,幫忙完成看 K 線圖、讀財報、做可視化圖表總結。
前幾天,蘋果全球開發者大會 WWDC 剛結束,股價出現點波動,正好讓 M3 來分析下。
讀 K 線圖
首先來看下 M3 的多模態能力,準備了一張蘋果近半年的日 K 線圖。
打開 MiniMax Code,讓它仔細觀察 K 線圖上的所有信息,並說說近期趨勢、波動幅度、最高最低價格等。
可以上下滾動的圖片
M3 很快就輸出結果,可能是着急了點,輸出的 Markdown 內容工具都忘記渲染了。
但 M3 識別到的信息全部準確,最高點 317.4、最低點 242.97、還有各項指標的具體數值。
甚至是真的讀懂了 K 線圖裏柱子的漲跌幅,點出 5 月初一根紅色大陽線拔地而起,突破壓力線。

同樣的 Prompt 和 K 線圖,也發給了多模態識別當中標杆 Gemini 3.1 Pro 模型,做了下對比。
說實話,兩者的數值識別準確度都絲毫不差,但論看圖的細緻,M3 略勝半籌。
M3 讀出的信息更多、畫面感更強,就如一根關鍵的大陽線都能觀察到,這個的確驚豔。
可以上下滾動的圖片
啃財報
準備上難度了,繼續測試一下 M3 模型對 長文檔檢索 和 多步推理能力。
丟給它一份蘋果最新季度財報的 PDF,有幾十頁內容,也可以測試 M3 超長上下文表現如何。
要求它要提取核心財務數字並標明出處,計算核心數據、以及拆解各業務線營收佔比。
可以上下滾動的圖片
M3 的表現有點出乎意料,提取出來的數字和頁數,大部分我都去核對了一下都是正確的。
在計算營收同比時,它給出的是 16.6%,而財報裏寫的是 17%,表現得挺嚴謹的。
甚至還自己做一次驗證,把各產品線營收加總,去跟總營收對上賬,確認沒有遺漏。

這種不硬湊、不糊弄、嚴謹的表現,這時候感覺 M3 確實是一位不錯的專業分析師。
同一份財報同樣 Prompt,這次選擇發給擅長金融分析方面的 DeepSeek V4 Pro 對比看看。
可以上下滾動的圖片
第一眼感受,DeepSeek 輸出的內容排版比 M3 要直觀簡潔的多,而且還有 LaTeX 公式。
內容排版 M3 略輸一籌,這也可能是 MiniMax Code 對輸出的內容渲染還不是很完善。
另外 DeepSeek 在分析財報提取、計算、同比、佔比這些數字也是正確的。
但發現了嚴重的錯誤,它把財報裏一筆歐盟罰款的幣種,從「歐元」認為是「英鎊」。
數字金額沒錯,但對幣種符號它搞錯了,這在金融場景裏屬於非常嚴重的犯錯。
這次 M3 與 DeepSeek 的對比,在讀文檔推算數值這塊實力相當,但論嚴謹和細節 M3 要更好一些。
做可視化分析看板
然後繼續,看下 M3 這次的 Coding 能力,據說比上一代模型有了很大的提升。
為了與 DeepSeek 對比,我先讓 M3 把前面分析 K 線圖和財報得到的信息,做一次整理。
拿到這份總結後,分別在 M3 和 DeepSeek 上新開一個對話,做一個單頁 HTML 分析看板。
要求放上關鍵指標卡片、各業務線營收佔比的圖表、近期走勢,以及風險點等信息。
下面分別是 M3 和 DeepSeek 出來的頁面效果圖,兩者均是一次生成。
M3
DeepSeek這次對比很明顯 M3 做出來頁面要比 DeepSeek 好很多,連 K 線圖都給畫了出來。
而 DeepSeek 頁面上的營收佔比位置,還出現了文字重疊,頁面上的信息點也不夠簡潔直觀。
同樣一次直出,兩者數據雖沒錯,但 M3 的代碼編寫能力,還有 UI 審美更勝一籌。
下判斷
最後讓 M3 對這次蘋果的股票分析做一次系統性的總結,作為這次實測收尾。
可以上下滾動的圖片
從輸出的結果來看,它沒有直接拋出是漲還是跌,而是把所看到的 K 線圖和財報結合一起。
客觀地分別列出看多的理由、看空的風險,以及幾處還要繼續盯的不確定性。
還指出財報裏有一項資產數據變動偏大,但原文沒解釋,也如實標明存疑。
沒有強行下定論,不替我們拍板、只把判斷依據說清楚,反而讓我覺得 M3 更加靠譜。
需要說明下,上面分析得到的結論,僅供參考,不構成任何投資建議,大家可以自我評估。
寫在最後
以上就是今天的 M3 體驗,順便與Gemini 3.1 Pro、DeepSeek-V4-Pro 模型實測對比了下。
整體來看,M3 這次升級把強大的編碼能力、超長上下文和原生多模態能力整合在一起後,可以用它來完成很多工作場景。
就比如這次的分析場景,直接用 M3 就能完成一整個分析鏈路,無需切換到不同模型、不同工具來接力完成。
無論是對開發者,還是金融從業者來說,這種「全流程跑通」的能力,都要比單項跑分更有價值。
過去想跑通這樣一整條鏈路,基本只能依賴閉源商用模型,數據也得交出去。
如今有一個能自己掌控、私有部署的開源模型選擇,對看重數據隱私的應用場景就有解法了。
今天的分享到此結束,感謝大家抽空閲讀,我們下期再見,Respect!




