Qwen3.6 真好玩,使我的大腦旋轉

作者:一澤Eze
日期:2026年4月4日 上午11:09
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Qwen3.6-Plus 前端 Coding 與多模態推理表現出色,Agent 長程任務有進步但深度待提升

整理版摘要

阿里千問最近推出咗新模型 Qwen3.6-Plus,作者進行咗一系列測試。文章首先介紹咗模型嘅三個主要維度:原生多模態、Agentic Coding 同埋 100 萬上下文窗口。然後作者用多個實測案例評估模型嘅單輪 Coding、多模態推理同 Agent 長程任務能力。整體結論係 Qwen3.6-Plus 喺前端代碼生成同視覺推理方面表現出色,尤其係單輪 Coding 可以同 Claude Opus 4.6 媲美;Agent 長程任務比起上代有進步,但複雜度上限仍有提升空間。定價方面以 256k 為界階梯計費,性價比唔錯。

喺前端代碼測試中,Qwen3.6-Plus 喺「TextPlayground」文字特效任務完成度好高,文字鏈效果尤其好;而喺 3D 樣板房呢類高難度任務上,Claude Opus 4.6 表現更好,但整體仲有改善空間。多模態推理方面,模型喺找圖中不合理地方同地鐵換乘路線推斷都表現準確,延續 Qwen 家族優良傳統。Agent 長程任務部分,模型能夠完成並行調研熱榜同開發桌寵,但桌寵嘅自動進食策略同鼠標穿透需要手動調整,反映長程 Agent 深度不足。最後作者總結,建議用家可以用喺前端開發同視覺識別場景,Agent 任務則需要配合其他工具使用。

  • Qwen3.6-Plus 喺單輪前端代碼生成任務上表現優秀,與 Claude Opus 4.6 差唔多,尤其係文字特效任務完成度好高。
  • 模型嘅多模態推理能力延續上代優勢,喺地鐵換乘呢類複雜圖像推理中準確率高,識別細節豐富。
  • Agent 長程任務比上代有進步,可以完成並行調研同桌寵開發,但複雜深度有限,需要多輪調整先得。
  • 定價以 256k 上下文為界限階梯計費,對於一般應用性價比唔錯。
  • 適合用喺前端開發、視覺識別場景,Agent 任務可以配合 Claude Code 等工具使用。
結構示例

內容片段

內容片段 text
創建一個交互式網頁項目:「TextPlayground
- 文字特效實驗場」頁面頂部有 Tab 欄切換不同文字交互模式。頁面展示一段英文文本,每個字母獨立渲染為粒子。五個模式:
1. 磁力場 — 按住鼠標,附近文字被排斥推開形成空洞,鬆開後緩慢迴歸原位2. 文字鏈 — 點擊一個字母粘在鼠標上,拖動時相鄰字母像鎖鏈一樣依次跟隨3. 漩渦 — 按住鼠標,附近文字圍繞鼠標旋轉形成螺旋4. 追光 — 鼠標劃過的文字發光放大,形成漸隱的亮帶軌跡,不改變文字位置5. 拆字成灰 — 按住鼠標,附近的字母溶解為細小粒子飄散,鬆開後粒子重新聚合回字形視覺要求:
- 背景淺色紙張質感- 動畫流暢 60fps- 切換模式時文字平滑過渡回原位不使用任何第三方庫,純原生實現。項目結構和技術方案自主決定。
整理重點

模型發布與核心特性

阿里千問最近推出咗新模型 Qwen3.6-Plus,主打三個維度提升模型能力。

原生多模態:沿襲上代優秀能力,可勝任複雜多模態推理任務。

Agentic Coding:強化前端網頁開發、複雜代碼開發同終端自動化任務。

100萬上下文窗口,配合新 API 參數 preserve_thinking,保留多輪推理過程。

目前新模型已上架阿里雲百鍊,可以接入 Claude CodeOpenClawQwen Code 等編程助手使用,chat.qwen.ai 亦可直接體驗。

整理重點

前端代碼生成測試

作者用多個 Demo 測試單輪 Coding 質量,包括複雜網頁文字特效同 3D 樣板房。

文字特效任務Qwen3.6-Plus 完成度高,文字鏈效果比 Gemini 好。

3D 樣板房:難度大,Claude Opus 4.6 表現突出,但各家都有錯位問題。

測試 Prompt 要求一次指令生成五個交互相式,Qwen 各項完成度均在線。

整理重點

多模態推理能力

上代模型已展現優秀多模態推理,今代繼續提升。作者測試兩個 Case

找不合理Qwen 找出更多直觀問題,總正確數領先 Gemini

地鐵換乘Qwen 作答耗時不到 50 秒,答案正確無誤。

模型喺複雜多細節圖像識別與理解能力突出。

整理重點

Agent長程規劃與執行

測試通用聯網任務同日式桌寵開發,評估長程 Agent 能力。

聯網任務使用作者自製嘅 Web-Access Skill,成功並行調研知乎、微博、B 站熱榜。

桌寵開發:模型合理拆分任務,一輪 Prompt 完成主體,但自動進食策略同鼠標穿透需調整。

整體而言,長程 Agent 任務比上代進步,但複雜度上限仍有待提升。

整理重點

定價與總結

Qwen3.6-Plus 已上架阿里雲百鍊,以 256k 上下文為界限階梯計價。

前端代碼及單輪 Coding 能力表現較好。

視覺識別推理高可用度。

Agent 長程任務比上代進步。

作者總結,模型適合前端開發同視覺識別場景,Agent 任務可配合其他工具使用。

今個禮拜,阿里千問又出咗新模型 Qwen3.6-Plus。

先睇前端 Coding 效果 Demo——流動文字特效,係由呢個新模型一次指令入面跑出嚟。

另外,參考近期 A 社嘅終端桌寵潮流,開發咗一隻喺你電腦度不斷屙💩嘅螃蟹:

Qwen3.6-Plus 主打三個維度:

  • 原生多模態:繼承咗上代 Qwen3.5-Plus 嘅優秀多模態能力,可以勝任複雜多模態推理任務,例如睇地鐵圖規劃轉車路線。
  • Agentic Coding: 前端網頁開發、複雜代碼開發、終端操作同自動化任務能力提升咗
  • 100 萬上下文窗口,同埋提供咗新嘅 API 參數 preserve_thinking,可以喺多輪對話入面保留中間推理過程
Image

摘自千問提供嘅 Benchmark 結果

目前新模型已經上架阿里雲百鍊。可以直接接入 Claude Code、OpenClaw、Qwen Code 等編程助手使用。chat.qwen.ai 都可以直接體驗。

Image
Qwen3.6 嘅視覺推理一流,試咗好多好玩 Case,令我個腦都打轉。



💻 代碼生成 Demo

都係由代碼生成 Demo 效果睇起,側重觀察單輪 Coding 生成質量,初步鎖定模型水平。

Case 1:複雜網頁文字特效

Prompt 一樣,分別用 Qwen3.6-Plus、Gemini 3.1 Pro、Claude Opus 4.6,一次指令就跑出結果。

為咗增加複雜度,要求模型喺一次生成入面,完成多項特效模式開發。


Qwen3.6-Plus:

Gemini 3.1 Pro:

Claude Opus 4.6:

Qwen 各項完成度都喺線,文字鏈表現更加好;Opus 就喺動畫精細度上略佔優勢;Gemini表現比較平。


測試 Prompt 如下:

創建一個交互式網頁項目:「TextPlayground - 文字特效實驗場」
頁面頂部有 Tab 欄切換不同文字交互模式。頁面展示一段英文文本,每個字母獨立渲染為粒子。

五個模式:
1. 磁力場 — 按住鼠標,附近文字被排斥推開形成空洞,鬆開後緩慢迴歸原位
2. 文字鏈 — 點擊一個字母粘在鼠標上,拖動時相鄰字母像鎖鏈一樣依次跟隨
3. 漩渦 — 按住鼠標,附近文字圍繞鼠標旋轉形成螺旋
4. 追光 — 鼠標劃過的文字發光放大,形成漸隱的亮帶軌跡,不改變文字位置
5. 拆字成灰 — 按住鼠標,附近的字母溶解為細小粒子飄散,鬆開後粒子重新聚合回字形

視覺要求:
- 背景淺色紙張質感
- 動畫流暢 60fps
- 切換模式時文字平滑過渡回原位

不使用任何第三方庫,純原生實現。項目結構和技術方案自主決定。



Case 2:3D 樣板房

呢個任務打算俾模型上一下強度。如果要完整完成,需要模型對 3D 開發、材質把控、真實樣板房佈局都有深入理解。


Qwen3.6-Plus:

Claude Opus 4.6:

Gemini 3.1 Pro:

喺呢個任務下,Claude 表現突出,但整體嚟講,對於當前模型嚟講都有較大挑戰。各家喺房間佈局上都有錯位、假走廊、錯門現象。



👀 依然頂級嘅多模態推理

上代模型 Qwen3.5-Plus 喺春節期間嘅多模態識別同推理能力,實測表現非常搶眼。持續觀察多模態表現水平。

Case 1:揾出圖入面全部唔符合現實嘅地方

仔細找全圖中全部不符合現實的地方
Image

Qwen3.6-Plus

Image

Gemini 3.1 Pro

Image

相比之下,Qwen 總體勝出。

從畫面細緻度嚟觀察,Qwen 揾出咗更多直觀嘅問題,保持 1 個數量嘅總正確數領先。而 Gemini 表現出略好嘅空間規律理解,能夠揾出畫面睇起嚟正常但係唔符合規律嘅問題。



Case 2:地鐵轉車路線推測

呢題主要考察模型對複雜細節圖片內容嘅識別同信息推理。

問題 Prompt 如下:

從許村到南湖站最近的換乘路線是什麼?不準聯網,只能從我提供的圖片進行推理
Image

Qwen 作答耗時唔夠 50秒,答案正確無誤,成功勝任視覺推理任務場景 ✅

Image

 對於複雜多細節圖像嘅識別同理解能力突出。



🦐 Agent 長程規劃與執行

Qwen3.6-Plus 長程 Agentic 任務能力,比前代有一定提升。相比複雜長程任務,更擅長前端同指令明確嘅代碼任務生成。

Case 1:通用聯網任務

使用近日爆紅嘅通用聯網 Agent Skill 「Web-Access」(我整嘅),測試 Qwen3.6-Plus 喺複雜網絡環境嘅 Agent Loop 表現。

直接俾出並行調研指令:

幫我並行調研知乎、微博、B站的今日熱榜內容,返回今日日報給我
Image

抓取三個平台今日內容如下,並展現出模型自發對跨平台共性熱點進行整合嘅智能行為。

Image
Image
Image

喺任務過程中,可勝任指令遵循表現良好,最終佢抓取嘅內容經核實,內容數據都同實際情況一致。



Case 2:Mac 桌寵開發

測試 Qwen3.6-Plus 喺長程 Agentic Coding 能力,要求佢根據已有角色資源,製作一隻可以喺電腦桌面底部瘋狂食飯、屙 💩 嘅螃蟹桌寵(Btw,呢隻桌寵嘅角色資產都係用 Qwen3.6-Plus 畫嘅)

Image
使用像素桌寵資產:/Documents/pixel-assets/assets/crab.js                                             
製作Mac桌寵,要求:點擊角色可愛撫,有表情反應;點擊桌面屏幕底部邊緣,可餵食;角色在桌面底部無規則遊蕩,經常拉💩;點擊💩 
可清理。僅桌寵遊戲可見交互部分可點擊,其餘透明區域鼠標可穿透。

接受任務之後,首先對任務進行咗合理嘅拆分:

Image

並喺 1 輪 Prompt 下,一次性完成遊戲主體開發,喺 Mac 上可以直接運行。喺自動進食、屙💩嘅實際行為策略、滑鼠穿透實現需要調整,即係模型長程 Agent 任務執行深度有待提升。

(如果對 DIY 可以喺你桌面周圍屙💩嘅桌寵有興趣,Maybe 遲啲可以更新一期文章 ⬇️)

Image



💰 定價與總結

Qwen3.6-Plus 已經上架阿里雲百鍊,以 256k 上下文為界限,階梯計價:

Image

總結一下:

Qwen3.6-Plus 喺前端代碼或者單輪 Coding 能力上,有較好表現。Agent 長程任務比上代有進步,複雜度上限仲有提升空間。

另外,喺視覺識別推理場景,體現出明顯嘅高可用度,延續咗 Qwen 家族喺多模態識別場景嘅一流水準


希望呢篇文章可以對你有所啟發,多謝點讚、關注、分享

圖片


本週,阿里千問又發新模型 Qwen3.6-Plus。

先看前端 Coding 效果 Demo——流動文字特效,由該新模型一次指令內跑出。

另外,參考最近的 A 社的終端桌寵潮流,開發了一隻在你電腦上不斷拉💩的螃蟹:

Qwen3.6-Plus 主打三個維度:

  • 原生多模態:沿襲上代 Qwen3.5-Plus 優秀多模態能力,可勝任複雜多模態推理任務,如看地鐵圖規劃換乘路線。
  • Agentic Coding: 前端網頁開發、複雜代碼開發、終端操作與自動化任務能力提升
  • 100 萬上下文窗口,以及提供了新的 API 參數 preserve_thinking,可在多輪對話中保留中間推理過程
Image

摘自千問提供的 Benchmark 結果

目前新模型已上架阿里雲百鍊。可直接接入 Claude Code、OpenClaw、Qwen Code 等編程助手使用。chat.qwen.ai 也可直接體驗。

Image
Qwen3.6 的視覺推理一流,測了很多好玩 Case,使我的大腦旋轉。



💻 代碼生成 Demo

依舊從代碼生成 Demo 效果看起,側重觀察單輪 Coding 生成質量,初步錨定模型水平。

Case 1:複雜網頁文字特效

Prompt 相同,分別用 Qwen3.6-Plus、Gemini 3.1 Pro、Claude Opus 4.6,一次指令跑出結果。

為增加複雜度,要求模型在一次生成中,完成多項特效模式開發。


Qwen3.6-Plus:

Gemini 3.1 Pro:

Claude Opus 4.6:

Qwen 各項完成度均在線,文字鏈表現更佳;Opus 則在動畫精細度上略佔優勢;Gemini表現較平。


測試 Prompt 如下:

創建一個交互式網頁項目:「TextPlayground - 文字特效實驗場」
頁面頂部有 Tab 欄切換不同文字交互模式。頁面展示一段英文文本,每個字母獨立渲染為粒子。

五個模式:
1. 磁力場 — 按住鼠標,附近文字被排斥推開形成空洞,鬆開後緩慢迴歸原位
2. 文字鏈 — 點擊一個字母粘在鼠標上,拖動時相鄰字母像鎖鏈一樣依次跟隨
3. 漩渦 — 按住鼠標,附近文字圍繞鼠標旋轉形成螺旋
4. 追光 — 鼠標劃過的文字發光放大,形成漸隱的亮帶軌跡,不改變文字位置
5. 拆字成灰 — 按住鼠標,附近的字母溶解為細小粒子飄散,鬆開後粒子重新聚合回字形

視覺要求:
- 背景淺色紙張質感
- 動畫流暢 60fps
- 切換模式時文字平滑過渡回原位

不使用任何第三方庫,純原生實現。項目結構和技術方案自主決定。



Case 2:3D 樣板房

這個任務打算給模型上一下強度。若要完整完成,需要模型對 3D 開發、材質把控、真實樣板房佈局均有深入理解。


Qwen3.6-Plus:

Claude Opus 4.6:

Gemini 3.1 Pro:

該任務下,Claude 表現突出,但整體來說,對於當前模型來說均有較大挑戰。各家在房間佈局上均存在錯位、假過道、錯門現象。



👀 依舊頂級的多模態推理

上代模型 Qwen3.5-Plus 在春節期間的多模態識別與推理能力,實測表現非常搶眼。持續觀察多模態表現水平。

Case 1:找出圖中全部不符合現實的地方

仔細找全圖中全部不符合現實的地方
Image

Qwen3.6-Plus

Image

Gemini 3.1 Pro

Image

相較而言,Qwen 總體勝出。

從畫面細緻度觀察來講,Qwen 找出了更多直觀的問題,保持 1 個數量的總正確數領先。而 Gemini 表現出略好的空間規律理解,能找出畫面看起來正常但不符合規律的問題。



Case 2:地鐵換乘路線推測

此題主要考察模型對複雜細節圖片內容的識別與信息推理。

問題 Prompt 如下:

從許村到南湖站最近的換乘路線是什麼?不準聯網,只能從我提供的圖片進行推理
Image

Qwen 作答耗時不到 50s,答案正確無誤,成功勝任視覺推理任務場景 ✅

Image

 對於複雜多細節圖像的識別與理解能力突出。



🦐 Agent 長程規劃與執行

Qwen3.6-Plus 長程 Agentic 任務能力,較前代有一定提升。相較複雜長程任務,更擅長前端與指令明確的代碼任務生成。

Case 1:通用聯網任務

使用近日爆火的通用聯網 Agent Skill 「Web-Access」(我做的),測試 Qwen3.6-Plus 在複雜網絡環境的 Agent Loop 表現。

直接給出並行調研指令:

幫我並行調研知乎、微博、B站的今日熱榜內容,返回今日日報給我
Image

抓取三平台今日內容如下,並展現出模型自發對跨平台共性熱點進行整合的智能行為。

Image
Image
Image

在任務過程中,可勝任指令遵循表現良好,最終其抓取內容經核實,內容數據均與實際情況一致。



Case 2:Mac 桌寵開發

測試 Qwen3.6-Plus 在長程 Agentic Coding 能力,要求其根據已有角色資源,製作一隻能在電腦桌面底部瘋狂吃飯、拉 💩 的螃蟹桌寵(Btw,這隻桌寵的角色資產也是用 Qwen3.6-Plus 畫的)

Image
使用像素桌寵資產:/Documents/pixel-assets/assets/crab.js                                             
製作Mac桌寵,要求:點擊角色可愛撫,有表情反應;點擊桌面屏幕底部邊緣,可餵食;角色在桌面底部無規則遊蕩,經常拉💩;點擊💩 
可清理。僅桌寵遊戲可見交互部分可點擊,其餘透明區域鼠標可穿透。

接受任務後,首先對任務進行了合理的拆分:

Image

並在 1 輪 Prompt 下,一次性完成遊戲主體開發,在 Mac 上可直接運行。在自動進食、拉💩的實際行為策略、鼠標穿透實現需要調整,即模型長程 Agent 任務執行深度有待提升。

(如果對 DIY 能在你桌面上到處拉💩的桌寵感興趣,Maybe 後面可以更新一期文章 ⬇️)

Image



💰 定價與總結

Qwen3.6-Plus 已上架阿里雲百鍊,以 256k 上下文為界限,階梯計價:

Image

總結一下:

Qwen3.6-Plus 在前端代碼 or 單輪 Coding 能力上,有較好表現。Agent 長程任務較上代有所進步,複雜度上限還有提升空間。

另外,在視覺識別推理場景,體現出了明顯的高可用度,延續了 Qwen 家族在多模態識別場景的一流水準


希望本文能對你有所啓發,感謝點贊、關注、分享

圖片