Qwen3.6 真好玩，使我的大腦旋轉

作者：一澤Eze

日期：2026年4月4日上午11:09

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

Qwen3.6-Plus 前端 Coding 與多模態推理表現出色，Agent 長程任務有進步但深度待提升

整理版摘要

阿里千問最近推出咗新模型 Qwen3.6-Plus，作者進行咗一系列測試。文章首先介紹咗模型嘅三個主要維度：原生多模態、Agentic Coding 同埋 100 萬上下文窗口。然後作者用多個實測案例評估模型嘅單輪 Coding、多模態推理同 Agent 長程任務能力。整體結論係 Qwen3.6-Plus 喺前端代碼生成同視覺推理方面表現出色，尤其係單輪 Coding 可以同 Claude Opus 4.6 媲美；Agent 長程任務比起上代有進步，但複雜度上限仍有提升空間。定價方面以 256k 為界階梯計費，性價比唔錯。

喺前端代碼測試中，Qwen3.6-Plus 喺「TextPlayground」文字特效任務完成度好高，文字鏈效果尤其好；而喺 3D 樣板房呢類高難度任務上，Claude Opus 4.6 表現更好，但整體仲有改善空間。多模態推理方面，模型喺找圖中不合理地方同地鐵換乘路線推斷都表現準確，延續 Qwen 家族優良傳統。Agent 長程任務部分，模型能夠完成並行調研熱榜同開發桌寵，但桌寵嘅自動進食策略同鼠標穿透需要手動調整，反映長程 Agent 深度不足。最後作者總結，建議用家可以用喺前端開發同視覺識別場景，Agent 任務則需要配合其他工具使用。

Qwen3.6-Plus 喺單輪前端代碼生成任務上表現優秀，與 Claude Opus 4.6 差唔多，尤其係文字特效任務完成度好高。
模型嘅多模態推理能力延續上代優勢，喺地鐵換乘呢類複雜圖像推理中準確率高，識別細節豐富。
Agent 長程任務比上代有進步，可以完成並行調研同桌寵開發，但複雜深度有限，需要多輪調整先得。
定價以 256k 上下文為界限階梯計費，對於一般應用性價比唔錯。
適合用喺前端開發、視覺識別場景，Agent 任務可以配合 Claude Code 等工具使用。

結構示例

內容片段

內容片段 text

創建一個交互式網頁項目：「TextPlayground
- 文字特效實驗場」頁面頂部有 Tab 欄切換不同文字交互模式。頁面展示一段英文文本，每個字母獨立渲染為粒子。五個模式：
1. 磁力場 — 按住鼠標，附近文字被排斥推開形成空洞，鬆開後緩慢迴歸原位2. 文字鏈 — 點擊一個字母粘在鼠標上，拖動時相鄰字母像鎖鏈一樣依次跟隨3. 漩渦 — 按住鼠標，附近文字圍繞鼠標旋轉形成螺旋4. 追光 — 鼠標劃過的文字發光放大，形成漸隱的亮帶軌跡，不改變文字位置5. 拆字成灰 — 按住鼠標，附近的字母溶解為細小粒子飄散，鬆開後粒子重新聚合回字形視覺要求：
- 背景淺色紙張質感- 動畫流暢 60fps- 切換模式時文字平滑過渡回原位不使用任何第三方庫，純原生實現。項目結構和技術方案自主決定。

整理重點

模型發布與核心特性

阿里千問最近推出咗新模型 Qwen3.6-Plus，主打三個維度提升模型能力。

原生多模態：沿襲上代優秀能力，可勝任複雜多模態推理任務。

Agentic Coding：強化前端網頁開發、複雜代碼開發同終端自動化任務。

100萬上下文窗口，配合新 API 參數 preserve_thinking，保留多輪推理過程。

目前新模型已上架阿里雲百鍊，可以接入 Claude Code、OpenClaw、Qwen Code 等編程助手使用，chat.qwen.ai 亦可直接體驗。

整理重點

前端代碼生成測試

作者用多個 Demo 測試單輪 Coding 質量，包括複雜網頁文字特效同 3D 樣板房。

文字特效任務：Qwen3.6-Plus 完成度高，文字鏈效果比 Gemini 好。

3D 樣板房：難度大，Claude Opus 4.6 表現突出，但各家都有錯位問題。

測試 Prompt 要求一次指令生成五個交互相式，Qwen 各項完成度均在線。

整理重點

多模態推理能力

上代模型已展現優秀多模態推理，今代繼續提升。作者測試兩個 Case。

找不合理：Qwen 找出更多直觀問題，總正確數領先 Gemini。

地鐵換乘：Qwen 作答耗時不到 50 秒，答案正確無誤。

模型喺複雜多細節圖像識別與理解能力突出。

整理重點

Agent長程規劃與執行

測試通用聯網任務同日式桌寵開發，評估長程 Agent 能力。

聯網任務使用作者自製嘅 Web-Access Skill，成功並行調研知乎、微博、B 站熱榜。

桌寵開發：模型合理拆分任務，一輪 Prompt 完成主體，但自動進食策略同鼠標穿透需調整。

整體而言，長程 Agent 任務比上代進步，但複雜度上限仍有待提升。

整理重點

定價與總結

Qwen3.6-Plus 已上架阿里雲百鍊，以 256k 上下文為界限階梯計價。

前端代碼及單輪 Coding 能力表現較好。

視覺識別推理高可用度。

Agent 長程任務比上代進步。

作者總結，模型適合前端開發同視覺識別場景，Agent 任務可配合其他工具使用。

今個禮拜，阿里千問又出咗新模型 Qwen3.6-Plus。

先睇前端 Coding 效果 Demo——流動文字特效，係由呢個新模型一次指令入面跑出嚟。

另外，參考近期 A 社嘅終端桌寵潮流，開發咗一隻喺你電腦度不斷屙💩嘅螃蟹：

Qwen3.6-Plus 主打三個維度：

原生多模態：繼承咗上代 Qwen3.5-Plus 嘅優秀多模態能力，可以勝任複雜多模態推理任務，例如睇地鐵圖規劃轉車路線。
Agentic Coding：前端網頁開發、複雜代碼開發、終端操作同自動化任務能力提升咗
100 萬上下文窗口，同埋提供咗新嘅 API 參數 preserve_thinking，可以喺多輪對話入面保留中間推理過程

摘自千問提供嘅 Benchmark 結果

目前新模型已經上架阿里雲百鍊。可以直接接入 Claude Code、OpenClaw、Qwen Code 等編程助手使用。chat.qwen.ai 都可以直接體驗。

Qwen3.6 嘅視覺推理一流，試咗好多好玩 Case，令我個腦都打轉。

💻 代碼生成 Demo

都係由代碼生成 Demo 效果睇起，側重觀察單輪 Coding 生成質量，初步鎖定模型水平。

Case 1：複雜網頁文字特效

Prompt 一樣，分別用 Qwen3.6-Plus、Gemini 3.1 Pro、Claude Opus 4.6，一次指令就跑出結果。

為咗增加複雜度，要求模型喺一次生成入面，完成多項特效模式開發。

Qwen3.6-Plus：

Gemini 3.1 Pro：

Claude Opus 4.6：

Qwen 各項完成度都喺線，文字鏈表現更加好；Opus 就喺動畫精細度上略佔優勢；Gemini表現比較平。

測試 Prompt 如下：

創建一個交互式網頁項目：「TextPlayground - 文字特效實驗場」
頁面頂部有 Tab 欄切換不同文字交互模式。頁面展示一段英文文本，每個字母獨立渲染為粒子。

五個模式：
1. 磁力場 — 按住鼠標，附近文字被排斥推開形成空洞，鬆開後緩慢迴歸原位
2. 文字鏈 — 點擊一個字母粘在鼠標上，拖動時相鄰字母像鎖鏈一樣依次跟隨
3. 漩渦 — 按住鼠標，附近文字圍繞鼠標旋轉形成螺旋
4. 追光 — 鼠標劃過的文字發光放大，形成漸隱的亮帶軌跡，不改變文字位置
5. 拆字成灰 — 按住鼠標，附近的字母溶解為細小粒子飄散，鬆開後粒子重新聚合回字形

視覺要求：
- 背景淺色紙張質感
- 動畫流暢 60fps
- 切換模式時文字平滑過渡回原位

不使用任何第三方庫，純原生實現。項目結構和技術方案自主決定。

Case 2：3D 樣板房

呢個任務打算俾模型上一下強度。如果要完整完成，需要模型對 3D 開發、材質把控、真實樣板房佈局都有深入理解。

Qwen3.6-Plus：

Claude Opus 4.6：

Gemini 3.1 Pro：

喺呢個任務下，Claude 表現突出，但整體嚟講，對於當前模型嚟講都有較大挑戰。各家喺房間佈局上都有錯位、假走廊、錯門現象。

👀 依然頂級嘅多模態推理

上代模型 Qwen3.5-Plus 喺春節期間嘅多模態識別同推理能力，實測表現非常搶眼。持續觀察多模態表現水平。

Case 1：揾出圖入面全部唔符合現實嘅地方

仔細找全圖中全部不符合現實的地方

Qwen3.6-Plus

Gemini 3.1 Pro

相比之下，Qwen 總體勝出。

從畫面細緻度嚟觀察，Qwen 揾出咗更多直觀嘅問題，保持 1 個數量嘅總正確數領先。而 Gemini 表現出略好嘅空間規律理解，能夠揾出畫面睇起嚟正常但係唔符合規律嘅問題。

Case 2：地鐵轉車路線推測

呢題主要考察模型對複雜細節圖片內容嘅識別同信息推理。

問題 Prompt 如下：

從許村到南湖站最近的換乘路線是什麼？不準聯網，只能從我提供的圖片進行推理

Qwen 作答耗時唔夠 50秒，答案正確無誤，成功勝任視覺推理任務場景 ✅

對於複雜多細節圖像嘅識別同理解能力突出。

🦐 Agent 長程規劃與執行

Qwen3.6-Plus 長程 Agentic 任務能力，比前代有一定提升。相比複雜長程任務，更擅長前端同指令明確嘅代碼任務生成。

Case 1：通用聯網任務

使用近日爆紅嘅通用聯網 Agent Skill 「Web-Access」（我整嘅），測試 Qwen3.6-Plus 喺複雜網絡環境嘅 Agent Loop 表現。

直接俾出並行調研指令：

幫我並行調研知乎、微博、B站的今日熱榜內容，返回今日日報給我

抓取三個平台今日內容如下，並展現出模型自發對跨平台共性熱點進行整合嘅智能行為。

喺任務過程中，可勝任指令遵循表現良好，最終佢抓取嘅內容經核實，內容數據都同實際情況一致。

Case 2：Mac 桌寵開發

測試 Qwen3.6-Plus 喺長程 Agentic Coding 能力，要求佢根據已有角色資源，製作一隻可以喺電腦桌面底部瘋狂食飯、屙 💩 嘅螃蟹桌寵（Btw，呢隻桌寵嘅角色資產都係用 Qwen3.6-Plus 畫嘅）

使用像素桌寵資產：/Documents/pixel-assets/assets/crab.js                                             
製作Mac桌寵，要求：點擊角色可愛撫，有表情反應；點擊桌面屏幕底部邊緣，可餵食；角色在桌面底部無規則遊蕩，經常拉💩；點擊💩 
可清理。僅桌寵遊戲可見交互部分可點擊，其餘透明區域鼠標可穿透。

接受任務之後，首先對任務進行咗合理嘅拆分：

並喺 1 輪 Prompt 下，一次性完成遊戲主體開發，喺 Mac 上可以直接運行。喺自動進食、屙💩嘅實際行為策略、滑鼠穿透實現需要調整，即係模型長程 Agent 任務執行深度有待提升。

（如果對 DIY 可以喺你桌面周圍屙💩嘅桌寵有興趣，Maybe 遲啲可以更新一期文章 ⬇️）

💰 定價與總結

Qwen3.6-Plus 已經上架阿里雲百鍊，以 256k 上下文為界限，階梯計價：

總結一下：

Qwen3.6-Plus 喺前端代碼或者單輪 Coding 能力上，有較好表現。Agent 長程任務比上代有進步，複雜度上限仲有提升空間。

另外，喺視覺識別推理場景，體現出明顯嘅高可用度，延續咗 Qwen 家族喺多模態識別場景嘅一流水準。

希望呢篇文章可以對你有所啟發，多謝點讚、關注、分享

本週，阿里千問又發新模型 Qwen3.6-Plus。

先看前端 Coding 效果 Demo——流動文字特效，由該新模型一次指令內跑出。

另外，參考最近的 A 社的終端桌寵潮流，開發了一隻在你電腦上不斷拉💩的螃蟹：

Qwen3.6-Plus 主打三個維度：

原生多模態：沿襲上代 Qwen3.5-Plus 優秀多模態能力，可勝任複雜多模態推理任務，如看地鐵圖規劃換乘路線。
Agentic Coding：前端網頁開發、複雜代碼開發、終端操作與自動化任務能力提升
100 萬上下文窗口，以及提供了新的 API 參數 preserve_thinking，可在多輪對話中保留中間推理過程

摘自千問提供的 Benchmark 結果

目前新模型已上架阿里雲百鍊。可直接接入 Claude Code、OpenClaw、Qwen Code 等編程助手使用。chat.qwen.ai 也可直接體驗。

Qwen3.6 的視覺推理一流，測了很多好玩 Case，使我的大腦旋轉。

💻 代碼生成 Demo

依舊從代碼生成 Demo 效果看起，側重觀察單輪 Coding 生成質量，初步錨定模型水平。

Case 1：複雜網頁文字特效

Prompt 相同，分別用 Qwen3.6-Plus、Gemini 3.1 Pro、Claude Opus 4.6，一次指令跑出結果。

為增加複雜度，要求模型在一次生成中，完成多項特效模式開發。

Qwen3.6-Plus：

Gemini 3.1 Pro：

Claude Opus 4.6：

Qwen 各項完成度均在線，文字鏈表現更佳；Opus 則在動畫精細度上略佔優勢；Gemini表現較平。

測試 Prompt 如下：

創建一個交互式網頁項目：「TextPlayground - 文字特效實驗場」
頁面頂部有 Tab 欄切換不同文字交互模式。頁面展示一段英文文本，每個字母獨立渲染為粒子。

五個模式：
1. 磁力場 — 按住鼠標，附近文字被排斥推開形成空洞，鬆開後緩慢迴歸原位
2. 文字鏈 — 點擊一個字母粘在鼠標上，拖動時相鄰字母像鎖鏈一樣依次跟隨
3. 漩渦 — 按住鼠標，附近文字圍繞鼠標旋轉形成螺旋
4. 追光 — 鼠標劃過的文字發光放大，形成漸隱的亮帶軌跡，不改變文字位置
5. 拆字成灰 — 按住鼠標，附近的字母溶解為細小粒子飄散，鬆開後粒子重新聚合回字形

視覺要求：
- 背景淺色紙張質感
- 動畫流暢 60fps
- 切換模式時文字平滑過渡回原位

不使用任何第三方庫，純原生實現。項目結構和技術方案自主決定。

Case 2：3D 樣板房

這個任務打算給模型上一下強度。若要完整完成，需要模型對 3D 開發、材質把控、真實樣板房佈局均有深入理解。

Qwen3.6-Plus：

Claude Opus 4.6：

Gemini 3.1 Pro：

該任務下，Claude 表現突出，但整體來說，對於當前模型來說均有較大挑戰。各家在房間佈局上均存在錯位、假過道、錯門現象。

👀 依舊頂級的多模態推理

上代模型 Qwen3.5-Plus 在春節期間的多模態識別與推理能力，實測表現非常搶眼。持續觀察多模態表現水平。

Case 1：找出圖中全部不符合現實的地方

仔細找全圖中全部不符合現實的地方

Qwen3.6-Plus

Gemini 3.1 Pro

相較而言，Qwen 總體勝出。

從畫面細緻度觀察來講，Qwen 找出了更多直觀的問題，保持 1 個數量的總正確數領先。而 Gemini 表現出略好的空間規律理解，能找出畫面看起來正常但不符合規律的問題。

Case 2：地鐵換乘路線推測

此題主要考察模型對複雜細節圖片內容的識別與信息推理。

問題 Prompt 如下：

從許村到南湖站最近的換乘路線是什麼？不準聯網，只能從我提供的圖片進行推理

Qwen 作答耗時不到 50s，答案正確無誤，成功勝任視覺推理任務場景 ✅

對於複雜多細節圖像的識別與理解能力突出。

🦐 Agent 長程規劃與執行

Qwen3.6-Plus 長程 Agentic 任務能力，較前代有一定提升。相較複雜長程任務，更擅長前端與指令明確的代碼任務生成。

Case 1：通用聯網任務

使用近日爆火的通用聯網 Agent Skill 「Web-Access」（我做的），測試 Qwen3.6-Plus 在複雜網絡環境的 Agent Loop 表現。

直接給出並行調研指令：

幫我並行調研知乎、微博、B站的今日熱榜內容，返回今日日報給我

抓取三平台今日內容如下，並展現出模型自發對跨平台共性熱點進行整合的智能行為。

在任務過程中，可勝任指令遵循表現良好，最終其抓取內容經核實，內容數據均與實際情況一致。

Case 2：Mac 桌寵開發

測試 Qwen3.6-Plus 在長程 Agentic Coding 能力，要求其根據已有角色資源，製作一隻能在電腦桌面底部瘋狂吃飯、拉 💩 的螃蟹桌寵（Btw，這隻桌寵的角色資產也是用 Qwen3.6-Plus 畫的）

使用像素桌寵資產：/Documents/pixel-assets/assets/crab.js                                             
製作Mac桌寵，要求：點擊角色可愛撫，有表情反應；點擊桌面屏幕底部邊緣，可餵食；角色在桌面底部無規則遊蕩，經常拉💩；點擊💩 
可清理。僅桌寵遊戲可見交互部分可點擊，其餘透明區域鼠標可穿透。

接受任務後，首先對任務進行了合理的拆分：

並在 1 輪 Prompt 下，一次性完成遊戲主體開發，在 Mac 上可直接運行。在自動進食、拉💩的實際行為策略、鼠標穿透實現需要調整，即模型長程 Agent 任務執行深度有待提升。

（如果對 DIY 能在你桌面上到處拉💩的桌寵感興趣，Maybe 後面可以更新一期文章 ⬇️）

💰 定價與總結

Qwen3.6-Plus 已上架阿里雲百鍊，以 256k 上下文為界限，階梯計價：

總結一下：

Qwen3.6-Plus 在前端代碼 or 單輪 Coding 能力上，有較好表現。Agent 長程任務較上代有所進步，複雜度上限還有提升空間。

另外，在視覺識別推理場景，體現出了明顯的高可用度，延續了 Qwen 家族在多模態識別場景的一流水準。

希望本文能對你有所啓發，感謝點贊、關注、分享