2026 上半年,我真正離不開的 12 個 AI 工具

作者:雷子思考筆記
日期:2026年5月3日 上午8:41
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

2026上半年最實用AI工具清單:從開發到設計,12款真正能幹活的推薦

整理版摘要

呢篇文章係作者雷子喺2026年上半年嘅真實用家覆盤。佢本身係一個產品經理兼開發者,成日要處理編程、設計、彙報、調研、內容創作等任務。佢發現今年AI工具已經唔再只係「好玩」,而係真正進入「能幹活」嘅階段——穩定、可靠、可以直接融入日常工作流程。佢由自己高頻使用嘅工具中,揀咗12款出嚟逐一分析,涵蓋編程(Codex)、生圖(GPT-Image-2、Gemini、豆包)、PPT(Claude、NotebookLM)、3D建模(Tripo3D、混元3D)、數據抓取分析(Accio Work)、會議紀要(元寶AI錄音筆+Claude)、深度研究(ChatGPT Deep Research)、AI瀏覽器(Tabbit)、PDF閲讀(豆包瀏覽器)、視頻創作(Seedance 2.0)、內容創作(Claude Opus 4.6)同信息檢索(ChatGPT+豆包)。

作者嘅整體結論係:AI工具已經過咗嚐鮮期,真正值得留低嘅,唔係參數最強或者發布會最炸嘅,而係能夠真實幫你減少重複勞動、加快判斷、將想法推進成結果嘅產品。佢特別強調「先拆流程,再談工具」——用之前要搞清楚自己想解決咩問題,再揀適合嘅工具,而唔係盲目追新。

呢篇文章嘅價值在於提供咗一個實戰篩選視角:每個工具嘅優劣、適用場景、同其他工具嘅差異,同埋作者點樣將佢哋組合成一條完整工作流。對於想喺2026年提升工作效率嘅人嚟講,好值得參考。

  • AI工具已進入「能幹活」階段:穩定可靠,可直接融入工作流程,唔再只係玩嚇。
  • CodexGPT-5.5)係作者最常用嘅編程工具,勝在門檻低、Token消耗唔高;Claude Code雖強但貴且易封號。
  • GPT-Image-2 改變咗生圖遊戲:文字、排版、創意理解大幅領先,Nano Banana同即夢喺特定場景依然有用。
  • Claude 擅長整理PPT邏輯鏈,NotebookLM適合從資料生成提綱;Accio Work可連結飛書微信,直接抓取網頁數據做分析。
  • 工具組合比單一工具更重要ChatGPT Deep Research做行業調研、元寶+Claude處理會議、豆包瀏覽器輔助PDF閲讀,各有所長。
整理重點

編程開發:Codex 成日 carry 複雜項目

作者雖然用過好多人推薦嘅 Claude Code,但佢自己用得最多嘅仲係 CodexGPT-5.4 / 5.5)。佢話 Claude 真係好強,尤其係理解需求同做系統架構,但問題係好快就用完用量限制,仲超級容易封號。

Codex 使用門檻低,Token消耗冇咁癲,效果亦好好

而家 CodexClaude Code 已經可以 carry 一個複雜項目,就算你唔識寫 code,只要講得清需求、判斷到頁面符唔符合預期,就可以由頭到尾做曬成個系統。作者話呢個轉變好大:以前要揾程序員先做到嘅嘢,而家只要你將需求拆清楚,叫 Codex 一步一步做就得,你嘅角色變成產品經理——定義需求、驗收結果、不斷反饋。

整理重點

圖片設計生成:GPT-Image-2 大幅領先,但其他工具仍有價值

今年 AI 生圖進入咗 Next Level。以前八成時間都係靠抽卡,人物不一致、文字錯誤、排版混亂,而家已經變咗。作者覺得,喺 GPT-Image-2 出之前,Nano Banana Pro 幾乎無可替代,而國內嘅 豆包同即夢 亦好適合日常工作流,尤其係即夢可以一次出 4 張,抽卡效率高。

GPT-Image-2 出之後,其他生圖模型好似一下子變成上個時代嘅產品

GPT-Image-2 唔單止畫得靚,仲會考慮標題層級、視覺焦點、文字位置、整體氣質。做產品海報時,佢會理解賣點、組合產品、留出排版空間。作者而家嘅工作流係:商業化成圖、公眾號封面、產品海報先用 GPT-Image-2;需要多圖參考、快速換風格、角色一致性,就揀 Nano Banana;國內內容、電商圖、小紅書圖就用即夢。

整理重點

PPT 製作與深度調研:Claude + NotebookLM + Deep Research

作者係產品經理,以前成日手動做 PPT,但由去年年底開始,佢幾乎冇再自己動手做過。佢嘅組合係:用 NotebookLM 處理一堆資料,幫佢抓重點、做總結、生成提綱;然後再用 Claude 組織成一套有邏輯鏈嘅 PPT

PPT 最難嘅唔係排版,而係整套邏輯鏈

Claude 特別擅長將散亂材料組織成一條打動人嘅敍事線。例如做商業計劃書,會由市場機會講到用戶痛點,再講解決方案、產品能力、商業模式同增長路徑。Claude 出嘅內容審美穩定:簡潔、高級、優雅。至於深度調研,作者用 ChatGPT 嘅深度研究模式 做行業調研、競品研究。佢話 Deep Research 好似研究員咁幫你揾資料、讀資料、對比整合,最後輸出完整報告,將原本半日到一日嘅調研壓縮到一個可快速判斷嘅初版報告,對創業者嚟講好重要。

整理重點

業務工具:Accio Work 同會議處理組合

作者推薦咗兩個業務場景嘅工具。第一個係 Accio Work,佢係阿里國際出嘅跨境電商 Agent,但作者話唔做跨境都覺得好好用。佢可以連結飛書同微信,內置好多 Skill,即使係針對跨境電商,只要稍為調整就可以變成適合自己嘅 skill。最正係可以 直接訪問瀏覽器,調用軟件嘅登錄態,去網頁抓取真實數據做分析,得出結論。

Accio Work 好似可以自己入現場睇,再基於真實數據俾結論

第二個係會議紀要工具組合:先用 元寶 AI 錄音筆 錄音,確保唔漏信息,再將內容交俾 Claude 處理,提取客戶關注點、關鍵決策、後續動作、可沉澱成 SOP 嘅內容。作者以前用釘釘嘅釘Talk,但每個月得1300分鐘免費,用曬要俾錢,所以改用免費嘅元寶。

整理重點

其他實用工具:AI 瀏覽器、PDF 閲讀、視頻同內容創作

作者仲介紹咗幾個場景嘅工具Tabbit 係美團做嘅 AI 瀏覽器,可以接入多個模型,將網頁由信息入口變成任務現場,減少複製貼上嘅摩擦;豆包瀏覽器 好適合睇 PDF,左邊睇原文右邊問 AI,例如財報可以即時問收入增長來源、毛利率點解下降等,大幅降低閲讀門檻;Seedance 2.0 係視頻創作模型,效果係目前最好之一;Claude Opus 4.6 係作者最愛嘅內容創作工具,AI 味最弱,好似一個耐心編輯,幫你順邏輯、調語氣、刪廢話。

Claude Opus 4.6 係 AI 味最弱嘅模型,乾淨、剋制、似編輯

最後作者分享咗自己嘅信息檢索策略:工作查國外嘢用 ChatGPT 5.5,生活查國內政策、辦事流程用 豆包。佢總結話,上半年最大感受係工具已過嚐鮮期,真正值得留低嘅,係可以真實幫你幹活、減少重複勞動、加快判斷、將想法推進成結果嘅產品。

大家好,我係雷子
今年上半年,我好明顯覺得AI工具已經由「好玩」進到「做到嘢」嘅階段喇。
以前好多工具睇落好勁,但真正放喺工作上,一係唔穩定,一係太難教,可能只係適合post上朋友圈show off嚇。而家唔同曬,好多工具已經可以直接幫我完成工作:寫code、做圖、做PPT、查資料、讀財報、開會、做片、做內容,甚至跑一啲複雜嘅業務任務。
趁住五一假期,我決定覆盤一下,今年上半年我自己真係成日用、而且覺得值得推薦嘅工具。

圖片       
編程同開發:Codex(GPT5.4 或 GPT5.5)
01
圖片
雖然Claude Code今年超級hit,甚至好多開發者已經當佢做默認嘅AI編程工具,但我自己用得最多嘅都係Codex。
唔係話Claude唔勁,Claude真係好勁,尤其係理解需求、處理複雜上下文、做系統架構嘅時候,體驗好順暢。而且Claude寫出嚟嘅系統好乾淨。但係佢真係好貴,用咗冇幾分鐘就彈用量限制。而且好敏感,好易俾人封號。
圖片

Codex相比之下使用門檻就低好多,而且用GPT5.4嘅話,Token消耗冇咁勁,效果亦都好唔錯。而家5.5出咗之後,效果更加勁!
圖片
以前我對AI編程嘅理解係:叫佢幫我寫某個function,或者解釋某段code。
而家完全變咗。而家嘅Codex同Claude Code,已經可以直接handle一個複雜嘅project。你就算一啲code都唔識,只要你講得清楚需求,判斷到個page同功能係咪符合預期,就可以做到一個完整嘅系統。
譬如你要做一個小程序後台、一個dashboard、一個landing page、一個產品prototype,以前你會覺得呢樣嘢一定要揾programmer。而家你可以將需求拆清楚,叫Codex一步一步做:
先搭project結構,再做頁面,再接API,再改樣式,再處理error,再打包deploy。
你要做嘅嘢更加似product manager:define需求、驗收結果、不斷俾feedback。

圖片       
圖片設計生成:ChatGPT(GPT-Image-2 )/Gemini(nano banana )/豆包(即夢)
02
圖片
今年AI生圖真係進入Next Level喇。
如果話以前用AI生圖,80%都係靠抽卡,咁今年嘅生圖模型已經進入「做到嘢」嘅階段。
以前想做一張公眾號封面、電商頭圖、產品海報、小程序背景圖,成日要來回抽:人物唔一致、文字錯、排版亂、細節唔受控制。而家呢件事已經變咗。
喺GPT-Image-2出嚟之前,我覺得Nano Banana Pro幾乎係無可替代嘅。
喺國內環境,豆包同即夢都好適合日常工作流程。尤其係即夢,我用得好多,一個重要原因係佢一次可以生成4張。抽卡概率會明顯提高,亦唔使一張一張等。
圖片
但係GPT-Image-2出咗之後,我嘅感覺係:其他生圖模型一下子好似上個時代嘅產品咁。
譬如你叫佢做一張公眾號封面,佢唔止生成一個靚畫面,仲會考慮標題層級、視覺焦點、文字位置、整體氣質。你叫佢做產品海報,佢會理解賣點、組合產品、留位俾排版。你叫佢做frontend頁面視覺稿,佢都可以俾到相對完整嘅界面邏輯。
尤其係文字、排版、創意、特效、複雜指令理解,呢幾個維度都勁。
試咗GPT-Image-2,香蕉感覺好似上個時代嘅產物咁
我而家嘅工作流程基本上係:
  • 要做商業化成圖、公眾號封面、產品海報、詳情頁視覺,優先先用GPT-Image-2。
  • 要做多圖參考、快速換風格、角色一致性,Nano Banana依然好好用。
  • 要做國內內容、電商圖、小紅書圖、需要抽多幾張,即夢好適合。
而且GPT-Image-2只要有ChatGPT Plus會員就用得。好似可以無限用(暫時未試到佢嘅上限)

圖片       
PPT製作:Claude、notebookLM
03
圖片
作為product manager,以前可能日日都做PPT,但係由舊年年底開始,我幾乎冇自己手動做過PPT喇。
NotebookLM特別適合處理一大堆資料。譬如你有行業報告、會議紀要、產品文檔、競品資料、研究論文,以前你要一篇篇睇、一段段摘,再自己整理成PPT。而家可以先丟俾NotebookLM,叫佢幫你捉重點、做總結、生成大綱。
Google官方已經將NotebookLM推向研究同內容生產工具方向,佢支援從資料入面生成Audio Overview、Video Overview、Mind Map、Slide Deck等內容;Slide Deck功能仲可以揀更詳細嘅Deck或者更適合展示嘅Presenter Slides。
但我覺得做PPT最難嘅地方,其實一直唔係排版,亦唔係資料整理,而係成個PPT嘅邏輯鏈。
呢個都係Claude特別勁嘅地方。
Claude好擅長將散亂嘅材料組織成一條可以打動人嘅敍事線。譬如做business plan,佢會幫你由市場機會講到用戶痛點,再講解決方案、產品能力、商業模式同增長路徑。做產品介紹,佢會幫你由客戶角度講結果,而唔係塞功能。做行業研究報告,佢會幫你將資訊變成判斷。
而且Claude做出嚟嘅內容審美好穩定:簡潔、高級、優雅,唔會成個mon都係大字報,亦唔會將PPT寫成Word。

圖片       
生成3D模型:Tripo3D、騰訊混元3D
04
圖片
我接觸到嘅圖片生成3D嘅模型或產品唔係好多,用得最多嘅就係騰訊嘅混元3D,而且係免費嘅,每日有20次免費生成機會。
不過因為係免費嘅,我感覺佢呢個產品化做得唔係幾好,更加似一個實驗室產品。譬如生成之後嘅微調、生成記錄嘅保存呢方面都冇做。
所以我日常用得比較多嘅係Tripo3D,整體效果同產品體驗都做得幾完整。
如果你只係想快速將一個產品、角色、擺件、道具做成3D雛形,Tripo3D更省心。
圖片
佢唔一定每次都完美,但係由upload圖片、生成模型、睇效果、download資產呢條鏈路嚟講,更加似一個可以日常使用嘅產品。

圖片       
即時抓數據/分析:Accio Work
05
圖片
Accio Work最早俾人認識,係因為佢係阿里國際推出嘅跨境電商Agent。
Accio Work被定位成面向全球中小企嘅企業級AI Agent,可以部署一組可自訂嘅AI Agents,處理電商運營、供應鏈、店鋪搭建、營銷等任務;Accio官方都強調佢唔係純粹傾偈,而係可以執行真實業務任務,帶有內置skills同connectors。
我宣佈呢個係目前國內最好用嘅Agent!!
但其實我本身唔做跨境電商,我仍然覺得佢好好用。可以滿足我日常生活入面全部對Agent嘅需求。可以好方便咁連接到飛書同微信。佢入面內置嘅好多Skill,雖然大多數都係針對跨境電商嘅,但我哋國內嘅邏輯係差唔多嘅,我會調整嚇封裝成一個真正適合自己嘅skill,而唔使從頭開始開發。
而且用佢嚟抓即時數據真係好方便,佢可以直接訪問我個browser,並且直接調用我啲software嘅登錄狀態,可以直接去訪問網頁抓取資訊,去做基於最真實數據嘅分析,俾我得出結論。
普通AI做分析,成日係基於你copy俾佢嘅一小段資訊。Accio Work更加似係可以自己入去睇現場,再基於真實數據俾你結論。
對跨境電商團隊嚟講,佢嘅價值就更加明顯喇。
我已經推薦俾好幾個做跨境電商嘅朋友,有人用咗之後直接俾團隊每個人配account。因為佢處理嘅唔係一個單點任務,而係一成套工作流程:揾產品、睇競品、查供應鏈、寫素材、做店鋪、做營運。

圖片       
會議紀要:元寶AI錄音筆+Claude
06
圖片

會議紀要工具好多,但我而家更加睇重兩件事:第一,可唔可以低門檻記錄;第二,可唔可以將會議內容變成可重用嘅資產。
元寶AI錄音筆解決嘅係「我先唔好漏咗資訊」,Claude解決嘅係「呢啲資訊到底有咩用」。我而家開會、訪問、聽課,都會先用元寶錄低。
但會議紀要真正嘅價值,絕對唔係將每句說話抄低。
所以我會再將內容交俾Claude,叫佢繼續處理:客戶真正關心啲乜?呢次會議有邊啲關鍵決策?之後要做啲咩行動?邊啲說話可以變成方案入面嘅表達?邊啲內容可以沉澱成SOP?
我以前都係用釘釘嘅釘Talk錄音卡片,但係佢每個月得1300分鐘嘅免費轉錄時長,用曬就要開membership,我有啲唔捨得,所以好多時我都係用元寶嚟錄音。
免費先係最終嘅競爭力呀!!

圖片       
深度研究:ChatGPT嘅深度研究模式
07
圖片
ChatGPT嘅深度研究模式,特別適合做「慢思考問題」。
譬如:一個行業值唔值得入?一個品類有冇機會?一個賽道嘅競爭格局係點?一個產品喺海外有冇需求?一個政策變化會帶嚟咩影響?
呢類問題你用普通search好痛苦,因為search結果係一堆碎片。你要自己開網頁、判斷來源、提取資訊、交叉驗證,再組織成報告。
Deep Research嘅價值係,佢會好似研究員咁去揾資料、讀資料、對比同整合資料,最後輸出一個完整嘅研究報告。
我自己用佢最多嘅場景係市場調研、行業調研、競品研究。
譬如我想睇一個健康產品賽道,佢可以幫我查市場規模、用戶需求、競品變化、價格帶、渠道趨勢同風險點。佢唔會淨係俾一個答案我,而係幫我從資訊噪音入面拉出一條主線。
GPT-5.5出咗之後,我好明顯覺得佢更加可靠。OpenAI官方都強調GPT-5.5面向coding、research、data analysis等複雜任務,並喺多個數據分析同科學推理基準上提升明顯。
佢可以將一個原本需要半日至一日嘅調研,壓縮到一個可以快速判斷嘅初版報告。
對創業者嚟講,呢樣太重要喇。
因為好多時候你唔需要一份完美報告,你需要嘅係快速判斷:呢個方向有冇繼續投入嘅價值。

圖片       
AI瀏覽器:Tabbit
08
圖片
Tabbit係美團做嘅AI瀏覽器,仲係比較小眾嘅,我見推薦嘅博主人數都幾少。
我自己用落,覺得佢好適合國內用戶,因為佢可以接入國內外唔少模型,使用門檻相對低。
圖片
AI瀏覽器最大嘅意義我覺得係:佢將「網頁」由資訊入口,變成了任務現場。
以前我哋用browser,係自己開網頁、自己睇、自己copy、自己總結、自己操作。
你喺多個網頁之間來回切換,佢可以幫你將資訊匯總起嚟。
普通AI chat工具嘅問題係,佢同網頁之間隔咗一層。你要copy貼上,要screenshot,要描述context。AI瀏覽器嘅意義就係減少呢層摩擦。
所以我覺得AI瀏覽器未來唔係browser嘅小功能,而係Agent嘅入口。
因為大部分人嘅真實工作都發生喺browser入面:查資料、睇後台、填表格、處理訂單、睇數據、發內容。如果AI可以直接理解網頁內容,並參與操作,佢就離真正嘅工作助理更近一步。

圖片       
PDF閲讀:豆包瀏覽器
09
圖片
PDF閲讀呢個場景,係我最近俾一個朋友觸發嘅。
佢每日炒股,成日睇公司財報。一份財報可以睇三日,我睇見都覺得心急。
我諗:咩年代喇,睇個PDF仲要咁麻煩?
後來我俾佢試咗好幾個工具,最後發現對佢呢種普通用戶嚟講,最容易上手嘅都係豆包瀏覽器。
佢嘅好處唔係「幫你睇曬份財報」,而係俾你一邊睇完整嘅PDF,一邊隨時問AI。
譬如你打開一份公司年報,左邊睇原文,右邊問豆包:呢間公司今年收入增長主要來自邊度?毛利率點解下降?經營現金流同淨利潤差異大唔大?管理層提到嘅主要風險係咩?幫我對比嚇今年同舊年嘅研發費用變化。
如果遇到需要思考、計算、分析嘅地方,可以直接screenshot或者copy俾右邊嘅對話框,叫豆包幫你解釋。
對專業投資嚟講,呢個肯定唔可以代替自己嘅判斷。但佢可以大幅降低財報閲讀門檻。
AI喺呢度最適合做輔助閲讀:幫你定位重點、解釋概念、對比數據、提醒風險。AI唔一定代替你做判斷,但可以令你唔再俾厚厚嘅PDF嚇怕。

圖片       
視頻創作:seedance2.0
10
圖片
Seedance 2.0呢個就唔使講太多喇。
而家抖音上AI視頻、AI短劇、AI臉已經周圍都係,睇得多甚至有啲審美疲勞。但不得不講,Seedance 2.0目前仍然係效果最好嘅視頻模型之一。

圖片       
內容創作:Claude Opus4.6
11
圖片

內容創作呢方面,我用得最多嘅係Claude Opus 4.6。
我覺得佢係AI味最弱嘅AI。
佢唔似好多模型,一開頭就堆金句、堆概念、堆好模板化嘅表達。
Claude更加似一個有耐性嘅編輯。
佢會幫你順邏輯、調語氣、刪廢話,將一段好散嘅想法整理成可以讀得落嘅文章。
我自己最鍾意佢嘅一點係:佢比較剋制。
佢唔會每句說話都想做爆款金句,亦唔會將文章寫得好油。好多時候我掟俾佢一段好亂嘅想法,佢可以幫我整理成一篇相對自然、順滑、似真人寫嘅內容。
但係我都要吐槽一句:更新到4.7之後,我個人體感真係差咗唔少。
有時佢會更加囉嗦,更加鍾意講靚廢話,少咗4.6嗰種乾淨、剋制、似編輯一樣嘅感覺。
所以如果問我內容創作最推薦邊個模型,我都係會揀Claude Opus 4.6。

圖片       
內容檢索:工作用ChatGPT,生活用豆包
12
圖片
我而家檢索資訊會分場景。工作上,尤其係查國外產品、技術文檔、行業趨勢、海外市場,我更常用ChatGPT 5.5,因為佢對資料嘅理解同綜合能力更強。
生活上,譬如查國內政策、辦事流程、旅遊攻略、本地資訊、中文平台內容,我更常用豆包。
工具冇絕對萬能,關鍵係揀啱資訊源。
國外資料揾ChatGPT,國內生活揾豆包,呢個組合對我嚟講效率最高。

圖片       
寫喺最後


今年上半年我最大嘅感受係,AI工具已經過咗嚐鮮階段。
真正值得留低嘅工具,核心唔係參數有幾勁、發佈會有幾震撼,而係佢可唔可以真實咁幫我做到嘢。
Codex幫我做開發,GPT-Image-2幫我做視覺,NotebookLM同Claude幫我做PPT,Accio Work幫我跑業務任務,元寶同Claude幫我處理會議,Deep Research幫我做調研,豆包幫我讀PDF,Seedance 2.0幫我做視頻。
AI工具越來越多,但真正成日用嘅永遠唔會太多。
可以減少重複勞動,可以幫我更快做判斷,可以將一個想法推進成結果,呢啲先係我願意一直用落去嘅AI產品。
大家好,我是雷子
今年上半年,我明顯感覺到AI 工具已經從“好玩”進入“能幹活”的階段了。
以前很多工具看起來很炫,但真正放到工作裏,要麼不穩定,要麼太費調教,可能只適合發朋友圈展示一下。現在不一樣了,很多工具已經能直接幫我完成工作了:寫代碼、做圖、做 PPT、查資料、讀財報、開會、做視頻、做內容,甚至跑一些複雜的業務任務。
趁着五一假期,我決定覆盤一下,今年上半年我自己真正高頻使用、並且覺得值得推薦的工具。

圖片       
編程和開發:Codex(GPT5.4 or GPT5.5)
01
圖片
雖然 Claude Code 今年超級火,甚至很多開發者已經把它當成默認的 AI 編程工具,但我自己用得最多的還是 Codex。
不是說Claude不強,Claude真的很強,尤其是理解需求、處理複雜上下文、做系統架構的時候,體驗非常絲滑。而且Claude寫出來的系統非常乾淨。但是他真的很貴,沒用幾分鐘就彈用量限制了。而且超級敏敏肌,非常容易被封號。
圖片

Codex相比之下使用門檻就低很多,而且用GPT5.4的話,Token消耗也沒這麼廢,效果也非常不錯。現在5.5出來後,效果更厲害了!
圖片
以前我對 AI 編程的理解是:讓它幫我寫某個函數,或者解釋某段代碼。
現在完全變了。現在的 Codex 和 Claude Code,已經可以直接 carry 一個複雜項目了。你哪怕一點代碼都不懂,只要你能把需求講清楚,能判斷頁面和功能是不是符合預期,就可以做出一個完整系統。
比如你要做一個小程序後台、一個數據看板、一個落地頁、一個產品原型,以前你會覺得這件事必須找程序員。現在你可以把需求拆清楚,讓 Codex 一步一步做:
先搭項目結構,再做頁面,再接接口,再修樣式,再處理報錯,再打包部署。
你要做的事情更像產品經理:定義需求、驗收結果、不斷反饋。

圖片       
圖片設計生成:ChatGPT(GPT-Image-2 )/Gemini(nano banana )/豆包(即夢)
02
圖片
今年 AI 生圖真的進入 Next Level 了。
如果說以前用 AI 生圖,80% 還是靠抽卡,那今年的生圖模型已經進入“能幹活”的階段。
以前想做一張公眾號封面、電商頭圖、產品海報、小程序背景圖,經常要反覆抽:人物不一致、文字錯誤、排版混亂、細節不受控。現在這件事已經變了。
在 GPT-Image-2 出來之前,我覺得 Nano Banana Pro 幾乎是無可替代的。
國內環境裏,豆包和即夢也很適合日常工作流。尤其是即夢,我用得很多,一個重要原因是它一次可以生成 4 張。抽卡概率會明顯提高,也不用一張一張等。
圖片
但 GPT-Image-2 出來之後,我的感覺是:其他生圖模型一下子像上個時代的產品了。
比如你讓它做一張公眾號封面,它不只是生成一個漂亮畫面,還會考慮標題層級、視覺焦點、文字位置、整體氣質。你讓它做產品海報,它會理解賣點、組合產品、留出排版空間。你讓它做前端頁面視覺稿,它也能給出相對完整的界面邏輯。
尤其是文字、排版、創意、特效、複雜指令理解,這幾個維度都非常強。
測了 GPT-Image-2,香蕉感覺像上個時代的產物了
我現在的工作流基本是:
  • 要做商業化成圖、公眾號封面、產品海報、詳情頁視覺,優先用 GPT-Image-2。
  • 要做多圖參考、快速換風格、角色一致性,Nano Banana 依然很好用。
  • 要做國內內容、電商圖、小紅書圖、需要多抽幾張,即夢很適合。
而且GPT-Image-2 只要有 ChatGPT Plus 會員就能用。好像可以無限用(目前還沒測到他的上限)

圖片       
PPT製作:Claude、notebookLM
03
圖片
作為產品經理,以前可能每天都在做PPT,但是從去年年底開始,我幾乎沒有自己手動做過PPT了。
NotebookLM 特別適合處理一堆資料。比如你有行業報告、會議紀要、產品文檔、競品資料、研究論文,以前你要一篇篇看、一段段摘,再自己整理成 PPT。現在可以先丟給 NotebookLM,讓它幫你抓重點、做總結、生成提綱。
Google 官方已經把 NotebookLM 往研究和內容生產工具方向推,它支持從資料裏生成 Audio Overview、Video Overview、Mind Map、Slide Deck 等內容;Slide Deck 功能還能選擇更詳細的 Deck 或更適合展示的 Presenter Slides。
但我覺得做 PPT 最難的地方,其實一直不是排版,也不是資料整理,而是整套 PPT 的邏輯鏈。
這也是 Claude 特別強的地方。
Claude 很擅長把散亂材料組織成一條能打動人的敍事線。比如做商業計劃書,它會幫你從市場機會講到用戶痛點,再講解決方案、產品能力、商業模式和增長路徑。做產品介紹,它會幫你從客戶視角講結果,而不是堆功能。做行業研究彙報,它會幫你把信息變成判斷。
而且 Claude 做出來的內容審美很穩定:簡潔、高級、優雅,不會滿屏大字報,也不會把 PPT 寫成 Word。

圖片       
生成3D模型:Tripo3D、騰訊混元3D
04
圖片
我接觸到的圖片生成3D的模型或產品不是很多,用的最多的就是騰訊的混元3D了,而且是免費的,每天都有20次的免費生成機會。
不過因為是免費的,我感覺他的這個產品化做的不是很好,更像是一個實驗室產品。比如生成之後的微調、生成記錄的保存這塊都沒有做。
所以我日常用的更多的是Tripo3D整個效果和產品體驗都做的挺完整的。
如果你只是想快速把一個產品、角色、擺件、道具做成 3D 雛形,Tripo3D 更省心。
圖片
它不一定每次都完美,但從上傳圖片、生成模型、查看效果、下載資產這條鏈路來說,更像一個可以日常使用的產品。

圖片       
實時抓數據/分析:Accio Work
05
圖片
Accio Work 最早被大家知道,是因為它是阿里國際推出的跨境電商 Agent。
Accio Work 被定位成面向全球中小企業的企業級 AI Agent,可以部署一組可定製的 AI Agents,處理電商運營、供應鏈、店鋪搭建、營銷等任務;Accio 官方也強調它不是單純聊天,而是可以執行真實業務任務,帶有內置 skills 和 connectors。
我宣佈這是目前國內最好用的Agent!!
但是其實我本身不做跨境電商,我仍然覺得他很好用。可以滿足我日常生活裏全部對於Agent的需求。可以很方便的連結到飛書和微信。他裏面內置的很多Skill,雖然大多數都是針對跨境電商的,但是我們國內的邏輯是差不多的,我會調整調整的封裝成一個真正適合自己的skill,而不用從頭開始開發。
而且用它來抓實時的數據真的特別方便,他可以直接訪問我的瀏覽器,並且直接調用我的軟件的登錄態,可以直接去訪問網頁抓取信息,去做基於最真實數據的分析,來給我得出結論。
普通 AI 做分析,經常是基於你複製給它的一小段信息。Accio Work 更像是可以自己進去看現場,再基於真實數據給你結論。
對跨境電商團隊來說,它的價值就更明顯了。
我已經推薦給好幾個做跨境電商的朋友,有人用了之後直接給團隊每個人配賬號。因為它處理的不是一個單點任務,而是一整套工作流:找產品、看競品、查供應鏈、寫素材、做店鋪、跑運營。

圖片       
會議紀要:元寶AI錄音筆+Claude
06
圖片

會議紀要工具很多,但我現在更看重兩件事:第一,能不能低門檻記錄;第二,能不能把會議內容變成可複用資產。
元寶 AI 錄音筆解決的是“我先別漏掉信息”,Claude 解決的是“這些信息到底有什麼用”。我現在開會、訪談、聽課,都會先用元寶錄下來。
但會議紀要真正的價值,絕對不是把每句話抄下來。
所以我會再把內容交給 Claude,讓它繼續處理:客戶真正關心什麼?這次會議有哪些關鍵決策?後續要做哪些動作?哪些話可以變成方案裏的表達?哪些內容可以沉澱成 SOP?
我以前都是用釘釘的釘Talk錄音卡片,但是他每個月只有1300分鐘的免費轉錄時長,用完了就得開會員,我有點捨不得,所以很多時候我還是會用元寶來錄音。
免費還是最終的競爭力呀!!

圖片       
深度研究:ChatGPT的深度研究模式
07
圖片
ChatGPT 的深度研究模式,特別適合做“慢思考問題”。
比如:一個行業值不值得進?一個品類有沒有機會?一個賽道的競爭格局是什麼?一個產品在海外有沒有需求?一個政策變化會帶來什麼影響?
這類問題你用普通搜索很痛苦,因為搜索結果是一堆碎片。你要自己打開網頁、判斷來源、提取信息、交叉驗證,再組織成報告。
Deep Research 的價值是,它會像研究員一樣去找資料、讀資料、對比和整合資料,最後輸出一個完整的研究報告。
我自己用它最多的場景是市場調研、行業調研、競品研究。
比如我想看一個健康產品賽道,它可以幫我查市場規模、用戶需求、競品變化、價格帶、渠道趨勢和風險點。它不會只給我一個答案,而是幫我從信息噪音里拉出一條主線。
GPT-5.5 出來之後,我明顯感覺它更靠譜了。OpenAI 官方也強調 GPT-5.5 面向 coding、research、data analysis 等複雜任務,並在多個數據分析和科學推理基準上提升明顯。
他可以把一個原本需要半天到一天的調研,壓縮到一個可快速判斷的初版報告。
對創業者來說,這太重要了。
因為很多時候你不需要一份完美報告,你需要的是快速判斷:這個方向有沒有繼續投入的價值。

圖片       
AI瀏覽器:Tabbit
08
圖片
Tabbit是美團做的AI瀏覽器,還是比較小眾的,我看推薦的博主還挺少的。
我自己用下來,感覺它很適合國內用戶,因為它可以接入國內外不少模型,使用門檻相對低。
圖片
AI 瀏覽器最大的意義我覺得是:它把“網頁”從信息入口,變成了任務現場。
以前我們用瀏覽器,是自己打開網頁、自己看、自己複製、自己總結、自己操作。
你在多個網頁之間來回切換,它可以幫你把信息彙總起來。
普通 AI 聊天工具的問題是,它和網頁之間隔了一層。你要複製粘貼,要截圖,要描述上下文。AI 瀏覽器的意義就是減少這層摩擦。
所以我覺得 AI 瀏覽器未來不是瀏覽器的小功能,而是 Agent 的入口。
因為大部分人的真實工作都發生在瀏覽器裏:查資料、看後台、填表格、處理訂單、看數據、發內容。如果 AI 能直接理解網頁內容,並參與操作,它就離真正的工作助理更近了一步。

圖片       
PDF閲讀:豆包瀏覽器
09
圖片
PDF 閲讀這個場景,是我最近被一個朋友觸發的。
他每天炒股,經常看公司財報。一份財報能看三天,我看着都着急。
我就在想:什麼年代了,看個 PDF 還要這麼費勁?
後來我給他試了好幾個工具,最後發現對他這種普通用戶來說,最好上手的還是豆包瀏覽器。
它的好處不是“替你讀完財報”,而是讓你一邊看完整 PDF,一邊隨時問 AI。
比如你打開一份公司年報,左邊看原文,右邊問豆包:這家公司今年收入增長主要來自哪裏?毛利率為什麼下降?經營現金流和淨利潤差異大不大?管理層提到的主要風險是什麼?幫我對比一下今年和去年的研發費用變化。
如果遇到需要思考、計算、分析的地方,可以直接截圖或者複製給右邊的對話框,讓豆包幫你解釋。
對專業投資來說,這肯定不能替代自己的判斷。但它能大幅降低財報閲讀門檻。
AI在這裏最適合做輔助閲讀:幫你定位重點、解釋概念、對比數據、提醒風險。AI 不一定替代你做判斷,但可以讓你不再被厚厚的 PDF 嚇退。

圖片       
視頻創作:seedance2.0
10
圖片
Seedance 2.0 這個就不用說太多了。
現在抖音上 AI 視頻、AI 短劇、AI 臉已經滿天飛,看多了甚至有點審美疲勞。但不得不說,Seedance 2.0 目前仍然是效果最好的視頻模型之一。

圖片       
內容創作:Claude Opus4.6
11
圖片

內容創作這塊,我用得最多的是 Claude Opus 4.6。
我覺得它是 AI 味最弱的 AI。
它不像很多模型,一上來就堆金句、堆概念、堆很模板化的表達。
Claude 更像一個耐心的編輯。
它會幫你順邏輯、調語氣、刪廢話,把一段很散的想法整理成能讀下去的文章。
我自己最喜歡它的一點是:它比較剋制。
它不會每句話都想當爆款金句,也不會把文章寫得特別油。很多時候我丟給它一段很亂的想法,它能幫我整理成一篇相對自然、順滑、像真人寫的內容。
但我也要吐槽一句:更新到 4.7 之後,我個人體感真的差了不少。
有時候它會更囉嗦,更喜歡講漂亮廢話,少了 4.6 那種乾淨、剋制、像編輯一樣的感覺。
所以如果問我內容創作最推薦哪個模型,我還是會選 Claude Opus 4.6。

圖片       
內容檢索:工作用ChatGPT,生活用豆包
12
圖片
我現在檢索信息會分場景。工作上,尤其是查國外產品、技術文檔、行業趨勢、海外市場,我更常用 ChatGPT 5.5,因為它對資料的理解和綜合能力更強。
生活上,比如查國內政策、辦事流程、旅遊攻略、本地信息、中文平台內容,我更常用豆包。
工具沒有絕對萬能,關鍵是選對信息源。
國外資料找 ChatGPT,國內生活找豆包,這個組合對我來說效率最高。

圖片       
寫在最後


今年上半年我最大的感受是,AI 工具已經過了嚐鮮階段。
真正值得留下來的工具,核心不是參數多強、發佈會多炸,而是它能不能真實的幫我幹活。
Codex 幫我做開發,GPT-Image-2 幫我做視覺,NotebookLM 和 Claude 幫我做 PPT,Accio Work 幫我跑業務任務,元寶和 Claude 幫我處理會議,Deep Research 幫我做調研,豆包幫我讀 PDF,Seedance 2.0 幫我做視頻。
AI 工具越來越多,但真正高頻使用的永遠不會太多。
能減少重複勞動,能幫我更快做判斷,能把一個想法推進成結果,這才是我願意一直用下去的 AI 產品。