DeepSeek V4好用嗎?【秋芝的AI開箱】
整理版優先睇
DeepSeek V4 唔係炸裂之作,但百萬上下文變標配、Agent能力強,性價比高,絕對值得用
呢篇文章係秋芝嘅AI開箱系列,作者係一個活躍嘅AI產品評測者,經常用香港用語同讀者分享最新模型嘅真實體驗。今次佢想解答一個問題:DeepSeek V4 係咪真係咁勁?值唔值得用?整體結論係:DeepSeek V4 冇外界期待咁炸裂,但已經重回一線模型行列,尤其係百萬原生上下文由頂配變標配,Agent能力突出,而且實際使用成本比帳面低好多。
秋芝指出,DeepSeek V4 同最新閉源模型仲有3-6個月差距,但追平咗上一代Opus 4.5,喺國產同開源模型入面算領先。最重要嘅升級係百萬上下文,之前開源領域同國內都冇,而家做到低成本標配,對Agent時代係必備基建。另外,API價格表面睇微貴,但實際同一任務DS花費遠少過GLM同Opus,flash版性價比極高。
作者仲提到Agent能力係亮點,工具使用、寫作、編程等對標海外旗艦,建議接入Claude Code、龍蝦等Agent使用。最後佢話DeepSeek唔係靠一次發佈改變格局,但佢哋持續開源同研究已經令中國AI走出跟隨階段。整體推薦用,但如果唔用Agent都唔使fomo。
- DeepSeek V4 追上上一代頂級模型(Opus 4.5),同國產對手比略好但冇明顯差距,算係重回一線。
- 百萬原生上下文由頂配變標配,Agent必備基建,成本大幅降低,係今次最重要升級。
- API帳面價格微貴,但實際執行同一任務花費遠低於GLM5.1同Opus4.6,flash版性價比極高。
- Agent能力突出,工具使用、中文寫作、編程等對標海外旗艦,建議接入Agent框架使用。
- DeepSeek改變行業格局係靠持續開源同研究,而唔係一次炸裂發佈,中國AI已進入自主探索階段。
冇炸裂,但重回一線
DeepSeek V4 如果同而家最頂尖嘅閉源模型(例如 Opus 4.6)比,按佢哋自己講法仲有3-6個月差距,算係追平咗上一代 Opus 4.5。放喺國產模型同開源模型入面比,算係領先,同最新嘅 GLM5.1、Kimi2.6 比略好,但拉唔開差距。
冇炸裂,但重回一線
百萬上下文由頂配變標配
呢一點幾乎係今次發佈最重要嘅嘢。有效長上下文喺Agent時代太重要,DeepSeek將佢變成標配,仲降低成本,開創先河。
睇落貴,實際仲平過對手
從API價目表睇,DS V4 Pro比國產幾家微貴,但秋芝實測同一任務,GLM5.1要50蚊,V4 Pro只用10蚊。flash版推理能力同pro差不多,普通任務表現冇乜分別,只係複雜推理差啲。
flash版性價比極高,同pro表現差好少
秋芝話佢調錯API將flash當pro用半日都冇發現,兩者價格差12倍。另外5月5號前調用flash有原價1/4優惠。
Agent能力強,建議接入用
DS V4各方面能力提升,尤其突出係Agent相關能力(工具使用)、世界知識、中文寫作、辦公任務、競賽編程同數學。呢啲方面對標海外旗艦模型。
Agent能力係亮點,工具使用同寫作表現出色
除咗客戶端免費用,秋芝建議接入Claude Code、龍蝦、Hermes呢啲Agent,去官網買API,拷貝Anthropic格式嘅base_url,貼上key就得。佢仲用DS生成PDF報告,效果比Opus 4.6好,但國產模型對skill主動判斷有問題,DS V4都有。
- 1 去官網買API,獲取Anthropic格式嘅base_url
- 2 將key貼上Agent工具
- 3 要將推理強度拉到最高,記得設定參數
改變格局唔係靠一次發佈
好多人對DS V4好大期望,想佢拳打閉源、碾壓開源、一次改變行業格局。但秋芝話呢種期待唔理智,因為冇人能夠喺又難又長又唔確定嘅事入面次次四兩撥千斤。
行業格局唔係靠一次發佈改變
佢哋發佈結尾寫咗好正嘅句子。秋芝總結話:如果唔用Agent都唔使fomo,因為DS V4同其他模型差唔多,唔會錯過一個億。
1. 冇炸裂,但係重返一線
DeepSeek V4 如果同而家最頂尖嘅閉源模型(例如 Opus 4.6)比較,按佢哋自己嘅講法仲有3-6個月嘅差距,算係追平咗上一代嘅Opus 4.5。
擺喺國產模型同開源模型裏面比較,算係領先咗,同最新嘅GLM5.1、Kimi2.6比較可以話好少少,但係都拉唔開差距。

2. 百萬上下文由頂配變咗做標配
呢一點差唔多係今次發佈最重要嘅一點。100萬原生上下文之前喺開源領域、國內都係冇嘅,Claude都要用頂配嘅Opus先有,
而家 Agent 時代,有效嘅長上下文可以話係太重要啦,能夠將百萬上下文做到更低成本,變成標配,屬於係Agent可以普及到普通人嘅必備基建。所以龍蝦都即刻更新,將DeepSeek V4做咗龍蝦嘅默認模型!

3. 價錢睇落好似貴少少,其實唔係
今次從api價目表表面睇,同國產幾間比較,DeepSeek V4 Pro嘅api仲貴少少。

但我實際用落去竟然唔係咁,同一個任務,GLM5.1做50蚊先做完,v4pro只用咗10蚊,我揾咗其他朋友都試咗幾次,都係咁。。

另外,flash版其實唔係傳統意義上嘅低配模型,佢推理能力同pro差唔多,喺普通任務上嘅表現基本冇分別,只係喺複雜推理上flash差少少。

我琴日調錯咗api,將flash當pro用咗半日我一直冇發現,後尾改返之後一跑,發現都冇咩大分別,例如呢兩個邊個係pro邊個係flash做嘅,你分唔分到出嚟?但係佢哋價錢相差12倍,

然後呢兩個係Opus4.6同GLM5.1,

所以flash負責普通任務,而家可能係性價比最好嘅,而且5月5號之前調用,係原價1/4嘅優惠~

4. Agent能力強,可以用落你嘅Agent度
今次DS各方面能力都提升咗,其中比較突出嘅係Agent相關能力(工具使用)、世界知識、中文寫作、辦公任務、競賽編程同數學。呢啲方面對標嘅係海外旗艦模型。
所以大家除咗客戶端日常免費使用之外,仲建議接入Claude Code、龍蝦、Hermes呢類Agent,上官網買api,喺呢度複製Anthropic格式嘅base_url,將key貼過去就得啦,

我已經全線接入諗住用幾日試嚇,如果大家要將推理強度拉到最高嘅話,記得咁樣設置~

呢個係我用DeepSeek幫我查嘅DS發佈歷程,然後叫佢整成PDF報告,PDF呢方面竟然比Opus4.6做得好,而且Opus仲用咗skill。

不過實測落嚟,國產模型對skill嘅主動判斷調用普遍有啲問題,成日要我手動提示佢,V4都有呢種情況。
5. DeepSeek改變咗嘅行業格局,唔係靠一次發佈
好多朋友對ds V4有好大期望,希望佢打低閉源,碾壓開源,改變行業格局。
但係其實呢種期望唔係好理智,因為冇人能夠喺又難、又長、又唔確定嘅事情裏面每次都四兩撥千斤,震撼世界。因為呢啲唔係短劇情節...
而且行業格局並唔係一次發佈就改變到,而且佢其實已經變咗。
而家你睇,DeepSeek仲同國產芯片搞協同,幾間中國AI公司都喺度你來我往咁解決下一步智能嘅探索問題。

成個姿態已經變咗。中國AI已經唔係純粹跟隨嘅階段啦,所以雖然DeepSeek V4模型大家體感上冇咁驚豔,但係DS背後做嘅嘢,他們的研究、技術報告嘅開放,佢哋嘅持續開源,其實同當年V3、R1冇分別。
佢哋嘅發佈結尾都寫咗一句好好嘅話~

好啦,整體都係建議大家用嚇嘅,當然如果你懶得切換模型,或者你根本唔用Agent,都唔使fomo,因為佢都差唔多!唔會錯過一個億~
最後再總結嚇今日呢篇文章你需要知道嘅DeepSeek五件事!

我哋下次見啦~

郵箱:join@qiuzhi2046.com
郵件主題:應聘[崗位]-姓名-渠道
線下全職:深圳
多謝鐵鐵們都幫手轉發推薦呀~
1. 沒有炸裂,但重回一線
DeepSeek V4 如果跟現在最頂尖的閉源模型(比如 Opus 4.6)比,按它們自己的說法還有3-6個月的差距,算是追平了上一代的Opus 4.5。
放在國產模型和開源模型裏比,算是領先了,跟最新的GLM5.1、Kimi2.6比可以說略好一點,但也拉不開差距。

2. 百萬上下文從頂配變成標配
這一點幾乎是這次發佈最重要的一點。100w原生上下文之前在開源領域、國內都是沒有的,Claude也得用頂配的Opus才有,
而現在 Agent 時代,有效的長上下文可以說是太重要了,能把百萬上下文做成更低成本,變成標配,屬於是Agent能普惠到普通人的必備基建。所以龍蝦也立馬更新,把DeepSeek V4作為了龍蝦的默認模型!

3. 價格看着微貴了,其實沒有
這次從api價目表表面看,跟國產幾家比,DeepSeek V4 Pro的api還微貴一點。

但我實際用下來居然不是這樣的,同樣的任務,GLM5.1幹50塊才做完,v4pro只花了10塊,我找其他小夥伴也試了幾次,也是如此。。

另外,flash版其實不是傳統意義上的低配模型,它推理能力跟pro差不多,在普通任務上的表現基本沒差,只是在複雜推理上flash差一點。

我昨天調錯了api,把flash當pro用了半天我一直沒發現,後來改回來一跑,發現也沒啥大區別,比如這倆誰是pro誰是flash做的,你能分出來嗎,但它們價格卻差12倍,

然後這倆是Opus4.6和GLM5.1 ,

所以flash承擔普通任務,現在可能是性價比最好的,而且5月5號之前調用,是原價1/4的優惠 ~

4. Agent能力強,可以用到你的Agent裏
這次DS的各方面能力都提升了,其中比較突出的是Agent相關能力(工具使用)、世界知識、中文寫作、辦公任務、競賽編程和數學。這些方面對標的是海外旗艦模型。
所以大家除了客戶端日常免費用以外,還建議接入Claude Code、龍蝦、Hermes這類Agent,官網買api,在這裏拷貝Anthropic格式的base_url,把key粘貼過去就好啦,

我已全線接入準備用幾天試試,那如果大家要把推理強度拉到最高的話,記得這樣設置~

那這是我用DeepSeek幫我查的DS發佈歷程,然後讓它做成PDF報告,PDF這塊居然比Opus4.6做得好,而且Opus還用了skill。

不過實測下來,國產模型對skill的主動判斷調用普遍有點問題,總是需要我手動提示它,V4也有這種情況。
5. DeepSeek改變的行業格局,不靠一次發佈
很多朋友對ds V4有很大期待,希望它拳打閉源,碾壓開源,改變行業格局。
但其實這種期待不是很理智,因為沒人能在又難、又長、又不確定的事情裏面每次都四兩撥千斤,震撼世界。因為這也不是短劇情節...
而且行業格局也並不是一次發佈就改變的,而且它其實已經變了。
現在你看,DeepSeek還在跟國產芯片搞協同,幾家中國AI公司都在你來我往地在解決下一步智能的探索問題。

就是整個姿態已經變了。中國AI已經不是純粹跟隨的階段了,所以雖然DeepSeek V4模型大家體感上沒那麼驚豔,但是DS背後做的事,他們的研究、技術報告的開放,他們的持續開源,其實跟當時V3、R1沒有區別。
他們的發佈結尾也寫了一句非常好的話~

好啦,整體還是建議大家用用的,當然如果你懶得切換模型,或者你根本就不用Agent,也不用fomo,因為它也差不了太多!不會錯過一個億~
最後再總結下今天這篇文章你需要知道的DeepSeek五件事!

我們下次見啦~

郵箱:join@qiuzhi2046.com
郵件主題:應聘[崗位]-姓名-渠道
線下全職:深圳
感謝鐵鐵們也幫忙轉發推薦呀 ~