2026 上半年，我真正離不開的 12 個 AI 工具

作者：雷子思考筆記

日期：2026年5月3日上午8:41

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

2026上半年最實用AI工具清單：從開發到設計，12款真正能幹活的推薦

整理版摘要

呢篇文章係作者雷子喺2026年上半年嘅真實用家覆盤。佢本身係一個產品經理兼開發者，成日要處理編程、設計、彙報、調研、內容創作等任務。佢發現今年AI工具已經唔再只係「好玩」，而係真正進入「能幹活」嘅階段——穩定、可靠、可以直接融入日常工作流程。佢由自己高頻使用嘅工具中，揀咗12款出嚟逐一分析，涵蓋編程（Codex）、生圖（GPT-Image-2、Gemini、豆包）、PPT（Claude、NotebookLM）、3D建模（Tripo3D、混元3D）、數據抓取分析（Accio Work）、會議紀要（元寶AI錄音筆+Claude）、深度研究（ChatGPT Deep Research）、AI瀏覽器（Tabbit）、PDF閲讀（豆包瀏覽器）、視頻創作（Seedance 2.0）、內容創作（Claude Opus 4.6）同信息檢索（ChatGPT+豆包）。

作者嘅整體結論係：AI工具已經過咗嚐鮮期，真正值得留低嘅，唔係參數最強或者發布會最炸嘅，而係能夠真實幫你減少重複勞動、加快判斷、將想法推進成結果嘅產品。佢特別強調「先拆流程，再談工具」——用之前要搞清楚自己想解決咩問題，再揀適合嘅工具，而唔係盲目追新。

呢篇文章嘅價值在於提供咗一個實戰篩選視角：每個工具嘅優劣、適用場景、同其他工具嘅差異，同埋作者點樣將佢哋組合成一條完整工作流。對於想喺2026年提升工作效率嘅人嚟講，好值得參考。

AI工具已進入「能幹活」階段：穩定可靠，可直接融入工作流程，唔再只係玩嚇。
Codex（GPT-5.5）係作者最常用嘅編程工具，勝在門檻低、Token消耗唔高；Claude Code雖強但貴且易封號。
GPT-Image-2 改變咗生圖遊戲：文字、排版、創意理解大幅領先，Nano Banana同即夢喺特定場景依然有用。
Claude 擅長整理PPT邏輯鏈，NotebookLM適合從資料生成提綱；Accio Work可連結飛書微信，直接抓取網頁數據做分析。
工具組合比單一工具更重要：ChatGPT Deep Research做行業調研、元寶+Claude處理會議、豆包瀏覽器輔助PDF閲讀，各有所長。

整理重點

編程開發：Codex 成日 carry 複雜項目

作者雖然用過好多人推薦嘅 Claude Code，但佢自己用得最多嘅仲係 Codex（GPT-5.4 / 5.5）。佢話 Claude 真係好強，尤其係理解需求同做系統架構，但問題係好快就用完用量限制，仲超級容易封號。

Codex 使用門檻低，Token消耗冇咁癲，效果亦好好

而家 Codex 同 Claude Code 已經可以 carry 一個複雜項目，就算你唔識寫 code，只要講得清需求、判斷到頁面符唔符合預期，就可以由頭到尾做曬成個系統。作者話呢個轉變好大：以前要揾程序員先做到嘅嘢，而家只要你將需求拆清楚，叫 Codex 一步一步做就得，你嘅角色變成產品經理——定義需求、驗收結果、不斷反饋。

整理重點

圖片設計生成：GPT-Image-2 大幅領先，但其他工具仍有價值

今年 AI 生圖進入咗 Next Level。以前八成時間都係靠抽卡，人物不一致、文字錯誤、排版混亂，而家已經變咗。作者覺得，喺 GPT-Image-2 出之前，Nano Banana Pro 幾乎無可替代，而國內嘅豆包同即夢亦好適合日常工作流，尤其係即夢可以一次出 4 張，抽卡效率高。

GPT-Image-2 出之後，其他生圖模型好似一下子變成上個時代嘅產品

GPT-Image-2 唔單止畫得靚，仲會考慮標題層級、視覺焦點、文字位置、整體氣質。做產品海報時，佢會理解賣點、組合產品、留出排版空間。作者而家嘅工作流係：商業化成圖、公眾號封面、產品海報先用 GPT-Image-2；需要多圖參考、快速換風格、角色一致性，就揀 Nano Banana；國內內容、電商圖、小紅書圖就用即夢。

整理重點

PPT 製作與深度調研：Claude + NotebookLM + Deep Research

作者係產品經理，以前成日手動做 PPT，但由去年年底開始，佢幾乎冇再自己動手做過。佢嘅組合係：用 NotebookLM 處理一堆資料，幫佢抓重點、做總結、生成提綱；然後再用 Claude 組織成一套有邏輯鏈嘅 PPT。

做 PPT 最難嘅唔係排版，而係整套邏輯鏈

Claude 特別擅長將散亂材料組織成一條打動人嘅敍事線。例如做商業計劃書，會由市場機會講到用戶痛點，再講解決方案、產品能力、商業模式同增長路徑。Claude 出嘅內容審美穩定：簡潔、高級、優雅。至於深度調研，作者用 ChatGPT 嘅深度研究模式做行業調研、競品研究。佢話 Deep Research 好似研究員咁幫你揾資料、讀資料、對比整合，最後輸出完整報告，將原本半日到一日嘅調研壓縮到一個可快速判斷嘅初版報告，對創業者嚟講好重要。

整理重點

業務工具：Accio Work 同會議處理組合

作者推薦咗兩個業務場景嘅工具。第一個係 Accio Work，佢係阿里國際出嘅跨境電商 Agent，但作者話唔做跨境都覺得好好用。佢可以連結飛書同微信，內置好多 Skill，即使係針對跨境電商，只要稍為調整就可以變成適合自己嘅 skill。最正係可以直接訪問瀏覽器，調用軟件嘅登錄態，去網頁抓取真實數據做分析，得出結論。

Accio Work 好似可以自己入現場睇，再基於真實數據俾結論

第二個係會議紀要工具組合：先用元寶 AI 錄音筆錄音，確保唔漏信息，再將內容交俾 Claude 處理，提取客戶關注點、關鍵決策、後續動作、可沉澱成 SOP 嘅內容。作者以前用釘釘嘅釘Talk，但每個月得1300分鐘免費，用曬要俾錢，所以改用免費嘅元寶。

整理重點

其他實用工具：AI 瀏覽器、PDF 閲讀、視頻同內容創作

作者仲介紹咗幾個場景嘅工具：Tabbit 係美團做嘅 AI 瀏覽器，可以接入多個模型，將網頁由信息入口變成任務現場，減少複製貼上嘅摩擦；豆包瀏覽器好適合睇 PDF，左邊睇原文右邊問 AI，例如財報可以即時問收入增長來源、毛利率點解下降等，大幅降低閲讀門檻；Seedance 2.0 係視頻創作模型，效果係目前最好之一；Claude Opus 4.6 係作者最愛嘅內容創作工具，AI 味最弱，好似一個耐心編輯，幫你順邏輯、調語氣、刪廢話。

Claude Opus 4.6 係 AI 味最弱嘅模型，乾淨、剋制、似編輯

最後作者分享咗自己嘅信息檢索策略：工作查國外嘢用 ChatGPT 5.5，生活查國內政策、辦事流程用豆包。佢總結話，上半年最大感受係工具已過嚐鮮期，真正值得留低嘅，係可以真實幫你幹活、減少重複勞動、加快判斷、將想法推進成結果嘅產品。

大家好，我係雷子

今年上半年，我好明顯覺得AI工具已經由「好玩」進到「做到嘢」嘅階段喇。

以前好多工具睇落好勁，但真正放喺工作上，一係唔穩定，一係太難教，可能只係適合post上朋友圈show off嚇。而家唔同曬，好多工具已經可以直接幫我完成工作：寫code、做圖、做PPT、查資料、讀財報、開會、做片、做內容，甚至跑一啲複雜嘅業務任務。

趁住五一假期，我決定覆盤一下，今年上半年我自己真係成日用、而且覺得值得推薦嘅工具。

編程同開發：Codex（GPT5.4 或 GPT5.5）

雖然Claude Code今年超級hit，甚至好多開發者已經當佢做默認嘅AI編程工具，但我自己用得最多嘅都係Codex。

唔係話Claude唔勁，Claude真係好勁，尤其係理解需求、處理複雜上下文、做系統架構嘅時候，體驗好順暢。而且Claude寫出嚟嘅系統好乾淨。但係佢真係好貴，用咗冇幾分鐘就彈用量限制。而且好敏感，好易俾人封號。

Codex相比之下使用門檻就低好多，而且用GPT5.4嘅話，Token消耗冇咁勁，效果亦都好唔錯。而家5.5出咗之後，效果更加勁！

以前我對AI編程嘅理解係：叫佢幫我寫某個function，或者解釋某段code。

而家完全變咗。而家嘅Codex同Claude Code，已經可以直接handle一個複雜嘅project。你就算一啲code都唔識，只要你講得清楚需求，判斷到個page同功能係咪符合預期，就可以做到一個完整嘅系統。

譬如你要做一個小程序後台、一個dashboard、一個landing page、一個產品prototype，以前你會覺得呢樣嘢一定要揾programmer。而家你可以將需求拆清楚，叫Codex一步一步做：

先搭project結構，再做頁面，再接API，再改樣式，再處理error，再打包deploy。

你要做嘅嘢更加似product manager：define需求、驗收結果、不斷俾feedback。

圖片設計生成：ChatGPT（GPT-Image-2 ）/Gemini（nano banana ）/豆包（即夢）

今年AI生圖真係進入Next Level喇。

如果話以前用AI生圖，80%都係靠抽卡，咁今年嘅生圖模型已經進入「做到嘢」嘅階段。

以前想做一張公眾號封面、電商頭圖、產品海報、小程序背景圖，成日要來回抽：人物唔一致、文字錯、排版亂、細節唔受控制。而家呢件事已經變咗。

喺GPT-Image-2出嚟之前，我覺得Nano Banana Pro幾乎係無可替代嘅。

喺國內環境，豆包同即夢都好適合日常工作流程。尤其係即夢，我用得好多，一個重要原因係佢一次可以生成4張。抽卡概率會明顯提高，亦唔使一張一張等。

但係GPT-Image-2出咗之後，我嘅感覺係：其他生圖模型一下子好似上個時代嘅產品咁。

譬如你叫佢做一張公眾號封面，佢唔止生成一個靚畫面，仲會考慮標題層級、視覺焦點、文字位置、整體氣質。你叫佢做產品海報，佢會理解賣點、組合產品、留位俾排版。你叫佢做frontend頁面視覺稿，佢都可以俾到相對完整嘅界面邏輯。

尤其係文字、排版、創意、特效、複雜指令理解，呢幾個維度都勁。

試咗GPT-Image-2，香蕉感覺好似上個時代嘅產物咁

我而家嘅工作流程基本上係：

要做商業化成圖、公眾號封面、產品海報、詳情頁視覺，優先先用GPT-Image-2。

要做多圖參考、快速換風格、角色一致性，Nano Banana依然好好用。

要做國內內容、電商圖、小紅書圖、需要抽多幾張，即夢好適合。

而且GPT-Image-2只要有ChatGPT Plus會員就用得。好似可以無限用（暫時未試到佢嘅上限）

PPT製作：Claude、notebookLM

作為product manager，以前可能日日都做PPT，但係由舊年年底開始，我幾乎冇自己手動做過PPT喇。

NotebookLM特別適合處理一大堆資料。譬如你有行業報告、會議紀要、產品文檔、競品資料、研究論文，以前你要一篇篇睇、一段段摘，再自己整理成PPT。而家可以先丟俾NotebookLM，叫佢幫你捉重點、做總結、生成大綱。

Google官方已經將NotebookLM推向研究同內容生產工具方向，佢支援從資料入面生成Audio Overview、Video Overview、Mind Map、Slide Deck等內容；Slide Deck功能仲可以揀更詳細嘅Deck或者更適合展示嘅Presenter Slides。

但我覺得做PPT最難嘅地方，其實一直唔係排版，亦唔係資料整理，而係成個PPT嘅邏輯鏈。

呢個都係Claude特別勁嘅地方。

Claude好擅長將散亂嘅材料組織成一條可以打動人嘅敍事線。譬如做business plan，佢會幫你由市場機會講到用戶痛點，再講解決方案、產品能力、商業模式同增長路徑。做產品介紹，佢會幫你由客戶角度講結果，而唔係塞功能。做行業研究報告，佢會幫你將資訊變成判斷。

而且Claude做出嚟嘅內容審美好穩定：簡潔、高級、優雅，唔會成個mon都係大字報，亦唔會將PPT寫成Word。

生成3D模型：Tripo3D、騰訊混元3D

我接觸到嘅圖片生成3D嘅模型或產品唔係好多，用得最多嘅就係騰訊嘅混元3D，而且係免費嘅，每日有20次免費生成機會。

不過因為係免費嘅，我感覺佢呢個產品化做得唔係幾好，更加似一個實驗室產品。譬如生成之後嘅微調、生成記錄嘅保存呢方面都冇做。

所以我日常用得比較多嘅係Tripo3D，整體效果同產品體驗都做得幾完整。

如果你只係想快速將一個產品、角色、擺件、道具做成3D雛形，Tripo3D更省心。

佢唔一定每次都完美，但係由upload圖片、生成模型、睇效果、download資產呢條鏈路嚟講，更加似一個可以日常使用嘅產品。

即時抓數據/分析：Accio Work

Accio Work最早俾人認識，係因為佢係阿里國際推出嘅跨境電商Agent。

Accio Work被定位成面向全球中小企嘅企業級AI Agent，可以部署一組可自訂嘅AI Agents，處理電商運營、供應鏈、店鋪搭建、營銷等任務；Accio官方都強調佢唔係純粹傾偈，而係可以執行真實業務任務，帶有內置skills同connectors。

我宣佈呢個係目前國內最好用嘅Agent！！

但其實我本身唔做跨境電商，我仍然覺得佢好好用。可以滿足我日常生活入面全部對Agent嘅需求。可以好方便咁連接到飛書同微信。佢入面內置嘅好多Skill，雖然大多數都係針對跨境電商嘅，但我哋國內嘅邏輯係差唔多嘅，我會調整嚇封裝成一個真正適合自己嘅skill，而唔使從頭開始開發。

而且用佢嚟抓即時數據真係好方便，佢可以直接訪問我個browser，並且直接調用我啲software嘅登錄狀態，可以直接去訪問網頁抓取資訊，去做基於最真實數據嘅分析，俾我得出結論。

普通AI做分析，成日係基於你copy俾佢嘅一小段資訊。Accio Work更加似係可以自己入去睇現場，再基於真實數據俾你結論。

對跨境電商團隊嚟講，佢嘅價值就更加明顯喇。

我已經推薦俾好幾個做跨境電商嘅朋友，有人用咗之後直接俾團隊每個人配account。因為佢處理嘅唔係一個單點任務，而係一成套工作流程：揾產品、睇競品、查供應鏈、寫素材、做店鋪、做營運。

會議紀要：元寶AI錄音筆+Claude

會議紀要工具好多，但我而家更加睇重兩件事：第一，可唔可以低門檻記錄；第二，可唔可以將會議內容變成可重用嘅資產。

元寶AI錄音筆解決嘅係「我先唔好漏咗資訊」，Claude解決嘅係「呢啲資訊到底有咩用」。我而家開會、訪問、聽課，都會先用元寶錄低。

但會議紀要真正嘅價值，絕對唔係將每句說話抄低。

所以我會再將內容交俾Claude，叫佢繼續處理：客戶真正關心啲乜？呢次會議有邊啲關鍵決策？之後要做啲咩行動？邊啲說話可以變成方案入面嘅表達？邊啲內容可以沉澱成SOP？

我以前都係用釘釘嘅釘Talk錄音卡片，但係佢每個月得1300分鐘嘅免費轉錄時長，用曬就要開membership，我有啲唔捨得，所以好多時我都係用元寶嚟錄音。

免費先係最終嘅競爭力呀！！

深度研究：ChatGPT嘅深度研究模式

ChatGPT嘅深度研究模式，特別適合做「慢思考問題」。

譬如：一個行業值唔值得入？一個品類有冇機會？一個賽道嘅競爭格局係點？一個產品喺海外有冇需求？一個政策變化會帶嚟咩影響？

呢類問題你用普通search好痛苦，因為search結果係一堆碎片。你要自己開網頁、判斷來源、提取資訊、交叉驗證，再組織成報告。

Deep Research嘅價值係，佢會好似研究員咁去揾資料、讀資料、對比同整合資料，最後輸出一個完整嘅研究報告。

我自己用佢最多嘅場景係市場調研、行業調研、競品研究。

譬如我想睇一個健康產品賽道，佢可以幫我查市場規模、用戶需求、競品變化、價格帶、渠道趨勢同風險點。佢唔會淨係俾一個答案我，而係幫我從資訊噪音入面拉出一條主線。

GPT-5.5出咗之後，我好明顯覺得佢更加可靠。OpenAI官方都強調GPT-5.5面向coding、research、data analysis等複雜任務，並喺多個數據分析同科學推理基準上提升明顯。

佢可以將一個原本需要半日至一日嘅調研，壓縮到一個可以快速判斷嘅初版報告。

對創業者嚟講，呢樣太重要喇。

因為好多時候你唔需要一份完美報告，你需要嘅係快速判斷：呢個方向有冇繼續投入嘅價值。

AI瀏覽器：Tabbit

Tabbit係美團做嘅AI瀏覽器，仲係比較小眾嘅，我見推薦嘅博主人數都幾少。

我自己用落，覺得佢好適合國內用戶，因為佢可以接入國內外唔少模型，使用門檻相對低。

AI瀏覽器最大嘅意義我覺得係：佢將「網頁」由資訊入口，變成了任務現場。

以前我哋用browser，係自己開網頁、自己睇、自己copy、自己總結、自己操作。

你喺多個網頁之間來回切換，佢可以幫你將資訊匯總起嚟。

普通AI chat工具嘅問題係，佢同網頁之間隔咗一層。你要copy貼上，要screenshot，要描述context。AI瀏覽器嘅意義就係減少呢層摩擦。

所以我覺得AI瀏覽器未來唔係browser嘅小功能，而係Agent嘅入口。

因為大部分人嘅真實工作都發生喺browser入面：查資料、睇後台、填表格、處理訂單、睇數據、發內容。如果AI可以直接理解網頁內容，並參與操作，佢就離真正嘅工作助理更近一步。

PDF閲讀：豆包瀏覽器

PDF閲讀呢個場景，係我最近俾一個朋友觸發嘅。

佢每日炒股，成日睇公司財報。一份財報可以睇三日，我睇見都覺得心急。

我諗：咩年代喇，睇個PDF仲要咁麻煩？

後來我俾佢試咗好幾個工具，最後發現對佢呢種普通用戶嚟講，最容易上手嘅都係豆包瀏覽器。

佢嘅好處唔係「幫你睇曬份財報」，而係俾你一邊睇完整嘅PDF，一邊隨時問AI。

譬如你打開一份公司年報，左邊睇原文，右邊問豆包：呢間公司今年收入增長主要來自邊度？毛利率點解下降？經營現金流同淨利潤差異大唔大？管理層提到嘅主要風險係咩？幫我對比嚇今年同舊年嘅研發費用變化。

如果遇到需要思考、計算、分析嘅地方，可以直接screenshot或者copy俾右邊嘅對話框，叫豆包幫你解釋。

對專業投資嚟講，呢個肯定唔可以代替自己嘅判斷。但佢可以大幅降低財報閲讀門檻。

AI喺呢度最適合做輔助閲讀：幫你定位重點、解釋概念、對比數據、提醒風險。AI唔一定代替你做判斷，但可以令你唔再俾厚厚嘅PDF嚇怕。

視頻創作：seedance2.0

Seedance 2.0呢個就唔使講太多喇。

而家抖音上AI視頻、AI短劇、AI臉已經周圍都係，睇得多甚至有啲審美疲勞。但不得不講，Seedance 2.0目前仍然係效果最好嘅視頻模型之一。

內容創作：Claude Opus4.6

內容創作呢方面，我用得最多嘅係Claude Opus 4.6。

我覺得佢係AI味最弱嘅AI。

佢唔似好多模型，一開頭就堆金句、堆概念、堆好模板化嘅表達。

Claude更加似一個有耐性嘅編輯。

佢會幫你順邏輯、調語氣、刪廢話，將一段好散嘅想法整理成可以讀得落嘅文章。

我自己最鍾意佢嘅一點係：佢比較剋制。

佢唔會每句說話都想做爆款金句，亦唔會將文章寫得好油。好多時候我掟俾佢一段好亂嘅想法，佢可以幫我整理成一篇相對自然、順滑、似真人寫嘅內容。

但係我都要吐槽一句：更新到4.7之後，我個人體感真係差咗唔少。

有時佢會更加囉嗦，更加鍾意講靚廢話，少咗4.6嗰種乾淨、剋制、似編輯一樣嘅感覺。

所以如果問我內容創作最推薦邊個模型，我都係會揀Claude Opus 4.6。

內容檢索：工作用ChatGPT，生活用豆包

我而家檢索資訊會分場景。工作上，尤其係查國外產品、技術文檔、行業趨勢、海外市場，我更常用ChatGPT 5.5，因為佢對資料嘅理解同綜合能力更強。

生活上，譬如查國內政策、辦事流程、旅遊攻略、本地資訊、中文平台內容，我更常用豆包。

工具冇絕對萬能，關鍵係揀啱資訊源。

國外資料揾ChatGPT，國內生活揾豆包，呢個組合對我嚟講效率最高。

寫喺最後

今年上半年我最大嘅感受係，AI工具已經過咗嚐鮮階段。

真正值得留低嘅工具，核心唔係參數有幾勁、發佈會有幾震撼，而係佢可唔可以真實咁幫我做到嘢。

Codex幫我做開發，GPT-Image-2幫我做視覺，NotebookLM同Claude幫我做PPT，Accio Work幫我跑業務任務，元寶同Claude幫我處理會議，Deep Research幫我做調研，豆包幫我讀PDF，Seedance 2.0幫我做視頻。

AI工具越來越多，但真正成日用嘅永遠唔會太多。

可以減少重複勞動，可以幫我更快做判斷，可以將一個想法推進成結果，呢啲先係我願意一直用落去嘅AI產品。

大家好，我是雷子

今年上半年，我明顯感覺到AI 工具已經從“好玩”進入“能幹活”的階段了。

以前很多工具看起來很炫，但真正放到工作裏，要麼不穩定，要麼太費調教，可能只適合發朋友圈展示一下。現在不一樣了，很多工具已經能直接幫我完成工作了：寫代碼、做圖、做 PPT、查資料、讀財報、開會、做視頻、做內容，甚至跑一些複雜的業務任務。

趁着五一假期，我決定覆盤一下，今年上半年我自己真正高頻使用、並且覺得值得推薦的工具。

編程和開發：Codex（GPT5.4 or GPT5.5）

雖然 Claude Code 今年超級火，甚至很多開發者已經把它當成默認的 AI 編程工具，但我自己用得最多的還是 Codex。

不是說Claude不強，Claude真的很強，尤其是理解需求、處理複雜上下文、做系統架構的時候，體驗非常絲滑。而且Claude寫出來的系統非常乾淨。但是他真的很貴，沒用幾分鐘就彈用量限制了。而且超級敏敏肌，非常容易被封號。

Codex相比之下使用門檻就低很多，而且用GPT5.4的話，Token消耗也沒這麼廢，效果也非常不錯。現在5.5出來後，效果更厲害了！

以前我對 AI 編程的理解是：讓它幫我寫某個函數，或者解釋某段代碼。

現在完全變了。現在的 Codex 和 Claude Code，已經可以直接 carry 一個複雜項目了。你哪怕一點代碼都不懂，只要你能把需求講清楚，能判斷頁面和功能是不是符合預期，就可以做出一個完整系統。

比如你要做一個小程序後台、一個數據看板、一個落地頁、一個產品原型，以前你會覺得這件事必須找程序員。現在你可以把需求拆清楚，讓 Codex 一步一步做：

先搭項目結構，再做頁面，再接接口，再修樣式，再處理報錯，再打包部署。

你要做的事情更像產品經理：定義需求、驗收結果、不斷反饋。

圖片設計生成：ChatGPT（GPT-Image-2 ）/Gemini（nano banana ）/豆包（即夢）

今年 AI 生圖真的進入 Next Level 了。

如果說以前用 AI 生圖，80% 還是靠抽卡，那今年的生圖模型已經進入“能幹活”的階段。

以前想做一張公眾號封面、電商頭圖、產品海報、小程序背景圖，經常要反覆抽：人物不一致、文字錯誤、排版混亂、細節不受控。現在這件事已經變了。

在 GPT-Image-2 出來之前，我覺得 Nano Banana Pro 幾乎是無可替代的。

國內環境裏，豆包和即夢也很適合日常工作流。尤其是即夢，我用得很多，一個重要原因是它一次可以生成 4 張。抽卡概率會明顯提高，也不用一張一張等。

但 GPT-Image-2 出來之後，我的感覺是：其他生圖模型一下子像上個時代的產品了。

比如你讓它做一張公眾號封面，它不只是生成一個漂亮畫面，還會考慮標題層級、視覺焦點、文字位置、整體氣質。你讓它做產品海報，它會理解賣點、組合產品、留出排版空間。你讓它做前端頁面視覺稿，它也能給出相對完整的界面邏輯。

尤其是文字、排版、創意、特效、複雜指令理解，這幾個維度都非常強。

測了 GPT-Image-2，香蕉感覺像上個時代的產物了

我現在的工作流基本是：

要做商業化成圖、公眾號封面、產品海報、詳情頁視覺，優先用 GPT-Image-2。

要做多圖參考、快速換風格、角色一致性，Nano Banana 依然很好用。

要做國內內容、電商圖、小紅書圖、需要多抽幾張，即夢很適合。

而且GPT-Image-2 只要有 ChatGPT Plus 會員就能用。好像可以無限用（目前還沒測到他的上限）

PPT製作：Claude、notebookLM

作為產品經理，以前可能每天都在做PPT，但是從去年年底開始，我幾乎沒有自己手動做過PPT了。

NotebookLM 特別適合處理一堆資料。比如你有行業報告、會議紀要、產品文檔、競品資料、研究論文，以前你要一篇篇看、一段段摘，再自己整理成 PPT。現在可以先丟給 NotebookLM，讓它幫你抓重點、做總結、生成提綱。

Google 官方已經把 NotebookLM 往研究和內容生產工具方向推，它支持從資料裏生成 Audio Overview、Video Overview、Mind Map、Slide Deck 等內容；Slide Deck 功能還能選擇更詳細的 Deck 或更適合展示的 Presenter Slides。

但我覺得做 PPT 最難的地方，其實一直不是排版，也不是資料整理，而是整套 PPT 的邏輯鏈。

這也是 Claude 特別強的地方。

Claude 很擅長把散亂材料組織成一條能打動人的敍事線。比如做商業計劃書，它會幫你從市場機會講到用戶痛點，再講解決方案、產品能力、商業模式和增長路徑。做產品介紹，它會幫你從客戶視角講結果，而不是堆功能。做行業研究彙報，它會幫你把信息變成判斷。

而且 Claude 做出來的內容審美很穩定：簡潔、高級、優雅，不會滿屏大字報，也不會把 PPT 寫成 Word。

生成3D模型：Tripo3D、騰訊混元3D

我接觸到的圖片生成3D的模型或產品不是很多，用的最多的就是騰訊的混元3D了，而且是免費的，每天都有20次的免費生成機會。

不過因為是免費的，我感覺他的這個產品化做的不是很好，更像是一個實驗室產品。比如生成之後的微調、生成記錄的保存這塊都沒有做。

所以我日常用的更多的是Tripo3D整個效果和產品體驗都做的挺完整的。

如果你只是想快速把一個產品、角色、擺件、道具做成 3D 雛形，Tripo3D 更省心。

它不一定每次都完美，但從上傳圖片、生成模型、查看效果、下載資產這條鏈路來說，更像一個可以日常使用的產品。

實時抓數據/分析：Accio Work

Accio Work 最早被大家知道，是因為它是阿里國際推出的跨境電商 Agent。

Accio Work 被定位成面向全球中小企業的企業級 AI Agent，可以部署一組可定製的 AI Agents，處理電商運營、供應鏈、店鋪搭建、營銷等任務；Accio 官方也強調它不是單純聊天，而是可以執行真實業務任務，帶有內置 skills 和 connectors。

我宣佈這是目前國內最好用的Agent！！

但是其實我本身不做跨境電商，我仍然覺得他很好用。可以滿足我日常生活裏全部對於Agent的需求。可以很方便的連結到飛書和微信。他裏面內置的很多Skill，雖然大多數都是針對跨境電商的，但是我們國內的邏輯是差不多的，我會調整調整的封裝成一個真正適合自己的skill，而不用從頭開始開發。

而且用它來抓實時的數據真的特別方便，他可以直接訪問我的瀏覽器，並且直接調用我的軟件的登錄態，可以直接去訪問網頁抓取信息，去做基於最真實數據的分析，來給我得出結論。

普通 AI 做分析，經常是基於你複製給它的一小段信息。Accio Work 更像是可以自己進去看現場，再基於真實數據給你結論。

對跨境電商團隊來說，它的價值就更明顯了。

我已經推薦給好幾個做跨境電商的朋友，有人用了之後直接給團隊每個人配賬號。因為它處理的不是一個單點任務，而是一整套工作流：找產品、看競品、查供應鏈、寫素材、做店鋪、跑運營。

會議紀要：元寶AI錄音筆+Claude

會議紀要工具很多，但我現在更看重兩件事：第一，能不能低門檻記錄；第二，能不能把會議內容變成可複用資產。

元寶 AI 錄音筆解決的是“我先別漏掉信息”，Claude 解決的是“這些信息到底有什麼用”。我現在開會、訪談、聽課，都會先用元寶錄下來。

但會議紀要真正的價值，絕對不是把每句話抄下來。

所以我會再把內容交給 Claude，讓它繼續處理：客戶真正關心什麼？這次會議有哪些關鍵決策？後續要做哪些動作？哪些話可以變成方案裏的表達？哪些內容可以沉澱成 SOP？

我以前都是用釘釘的釘Talk錄音卡片，但是他每個月只有1300分鐘的免費轉錄時長，用完了就得開會員，我有點捨不得，所以很多時候我還是會用元寶來錄音。

免費還是最終的競爭力呀！！

深度研究：ChatGPT的深度研究模式

ChatGPT 的深度研究模式，特別適合做“慢思考問題”。

比如：一個行業值不值得進？一個品類有沒有機會？一個賽道的競爭格局是什麼？一個產品在海外有沒有需求？一個政策變化會帶來什麼影響？

這類問題你用普通搜索很痛苦，因為搜索結果是一堆碎片。你要自己打開網頁、判斷來源、提取信息、交叉驗證，再組織成報告。

Deep Research 的價值是，它會像研究員一樣去找資料、讀資料、對比和整合資料，最後輸出一個完整的研究報告。

我自己用它最多的場景是市場調研、行業調研、競品研究。

比如我想看一個健康產品賽道，它可以幫我查市場規模、用戶需求、競品變化、價格帶、渠道趨勢和風險點。它不會只給我一個答案，而是幫我從信息噪音里拉出一條主線。

GPT-5.5 出來之後，我明顯感覺它更靠譜了。OpenAI 官方也強調 GPT-5.5 面向 coding、research、data analysis 等複雜任務，並在多個數據分析和科學推理基準上提升明顯。

他可以把一個原本需要半天到一天的調研，壓縮到一個可快速判斷的初版報告。

對創業者來說，這太重要了。

因為很多時候你不需要一份完美報告，你需要的是快速判斷：這個方向有沒有繼續投入的價值。

AI瀏覽器：Tabbit

Tabbit是美團做的AI瀏覽器，還是比較小眾的，我看推薦的博主還挺少的。

我自己用下來，感覺它很適合國內用戶，因為它可以接入國內外不少模型，使用門檻相對低。

AI 瀏覽器最大的意義我覺得是：它把“網頁”從信息入口，變成了任務現場。

以前我們用瀏覽器，是自己打開網頁、自己看、自己複製、自己總結、自己操作。

你在多個網頁之間來回切換，它可以幫你把信息彙總起來。

普通 AI 聊天工具的問題是，它和網頁之間隔了一層。你要複製粘貼，要截圖，要描述上下文。AI 瀏覽器的意義就是減少這層摩擦。

所以我覺得 AI 瀏覽器未來不是瀏覽器的小功能，而是 Agent 的入口。

因為大部分人的真實工作都發生在瀏覽器裏：查資料、看後台、填表格、處理訂單、看數據、發內容。如果 AI 能直接理解網頁內容，並參與操作，它就離真正的工作助理更近了一步。

PDF閲讀：豆包瀏覽器

PDF 閲讀這個場景，是我最近被一個朋友觸發的。

他每天炒股，經常看公司財報。一份財報能看三天，我看着都着急。

我就在想：什麼年代了，看個 PDF 還要這麼費勁？

後來我給他試了好幾個工具，最後發現對他這種普通用戶來說，最好上手的還是豆包瀏覽器。

它的好處不是“替你讀完財報”，而是讓你一邊看完整 PDF，一邊隨時問 AI。

比如你打開一份公司年報，左邊看原文，右邊問豆包：這家公司今年收入增長主要來自哪裏？毛利率為什麼下降？經營現金流和淨利潤差異大不大？管理層提到的主要風險是什麼？幫我對比一下今年和去年的研發費用變化。

如果遇到需要思考、計算、分析的地方，可以直接截圖或者複製給右邊的對話框，讓豆包幫你解釋。

對專業投資來說，這肯定不能替代自己的判斷。但它能大幅降低財報閲讀門檻。

AI在這裏最適合做輔助閲讀：幫你定位重點、解釋概念、對比數據、提醒風險。AI 不一定替代你做判斷，但可以讓你不再被厚厚的 PDF 嚇退。

視頻創作：seedance2.0

Seedance 2.0 這個就不用說太多了。

現在抖音上 AI 視頻、AI 短劇、AI 臉已經滿天飛，看多了甚至有點審美疲勞。但不得不說，Seedance 2.0 目前仍然是效果最好的視頻模型之一。

內容創作：Claude Opus4.6

內容創作這塊，我用得最多的是 Claude Opus 4.6。

我覺得它是 AI 味最弱的 AI。

它不像很多模型，一上來就堆金句、堆概念、堆很模板化的表達。

Claude 更像一個耐心的編輯。

它會幫你順邏輯、調語氣、刪廢話，把一段很散的想法整理成能讀下去的文章。

我自己最喜歡它的一點是：它比較剋制。

它不會每句話都想當爆款金句，也不會把文章寫得特別油。很多時候我丟給它一段很亂的想法，它能幫我整理成一篇相對自然、順滑、像真人寫的內容。

但我也要吐槽一句：更新到 4.7 之後，我個人體感真的差了不少。

有時候它會更囉嗦，更喜歡講漂亮廢話，少了 4.6 那種乾淨、剋制、像編輯一樣的感覺。

所以如果問我內容創作最推薦哪個模型，我還是會選 Claude Opus 4.6。

內容檢索：工作用ChatGPT，生活用豆包

我現在檢索信息會分場景。工作上，尤其是查國外產品、技術文檔、行業趨勢、海外市場，我更常用 ChatGPT 5.5，因為它對資料的理解和綜合能力更強。

生活上，比如查國內政策、辦事流程、旅遊攻略、本地信息、中文平台內容，我更常用豆包。

工具沒有絕對萬能，關鍵是選對信息源。

國外資料找 ChatGPT，國內生活找豆包，這個組合對我來說效率最高。

寫在最後

今年上半年我最大的感受是，AI 工具已經過了嚐鮮階段。

真正值得留下來的工具，核心不是參數多強、發佈會多炸，而是它能不能真實的幫我幹活。

Codex 幫我做開發，GPT-Image-2 幫我做視覺，NotebookLM 和 Claude 幫我做 PPT，Accio Work 幫我跑業務任務，元寶和 Claude 幫我處理會議，Deep Research 幫我做調研，豆包幫我讀 PDF，Seedance 2.0 幫我做視頻。

AI 工具越來越多，但真正高頻使用的永遠不會太多。

能減少重複勞動，能幫我更快做判斷，能把一個想法推進成結果，這才是我願意一直用下去的 AI 產品。