AI的下一步,是從工具變成同事 | 對話Helio王文鋒

作者:十字路口Crossing
日期:2026年4月29日 上午10:09
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Helio要做像人的AI同事,而非工具,透過連續上下文降低人的認知負荷

整理版摘要

呢篇文章係十字路口同Helio創辦人王文鋒嘅深度訪談。王文鋒係94年出世,INTJ,以前做分佈式系統開發,而家帶住9人團隊(平均00後)造Helio。佢哋之前做Sheet0,今年1月判斷AGI已到,決定轉型做Helio。文章主要想解決「AI越強,人越用越累」嘅問題——AI輸出快100倍,但人決策時要重新回憶上下文,成本遠超決策本身。

Helio嘅定位係「AI Workforce」,唔係IM嘅升級版,而係為AI同事重建嘅容器。佢哋想做「像人嘅AI」,而唔係「俾人用嘅AI工具」。核心係透過連續、高質量嘅上下文降低人嘅認知負荷。Helio默認異步,AI同事會主動睇歷史、翻日曆、提醒你遺漏嘅事,好似真同事咁。產品設計上,冇「new chat」掣,所有對話長喺channel;@就係分配任務;一個羣可以有多個AI,各有性格記憶;長任務直接喺羣內鋪開;AI可以主動發消息。

整體結論Helio賣嘅唔係AI能力,而係將AI能力交出去嘅安心感。佢哋認為瓶頸唔係human,而係context。透過提升上下文質素同數量,人可以放心授權,從執行者變決策者。未來Helio會繼續提高「上下文水位」,自然擴展到更多白領場景。

  • Helio定位為AI Workforce,讓AI成為組織原住民,唔係工具,而係同事。
  • 核心差異Helio係「重做」整個底層,唔係喺Slack/飛書上加AI功能;且解決團隊協作,唔係單兵任務。
  • 主動性來自統一上下文(channel、文件、日曆、郵箱)同多種觸發信號(@、郵件、日曆等),令AI有「門鈴」可以主動行動。
  • 人嘅角色從執行者變決策者,只需拍板、給方向、把關品味;授權機制分Trust/Always/Onetime三檔,平衡主動與安全。
  • Helio開箱即用,45秒三步搞掂,無需配置API key或本地安裝;雲端優先,AI持續在場。
整理重點

定位與願景:從工具到同事

Helio嘅定位係「AI Workforce」,唔係IM嘅升級版,而係為AI同事重建嘅容器。創辦人王文鋒強調,要做「像人的AI」,而唔係「俾人用嘅AI工具」。呢個分別嘅本質在於:工具令你少打字,人令你少操心。

Helio透過連續、高質量的上下文降低人嘅認知負荷,解決「AI越強,人越用越累」嘅困境。佢哋認為瓶頸唔係human,而係context。

整理重點

與傳統AI工具嘅本質差異

市場上有三類產品,Helio同佢哋最根本嘅差異在於:加法 vs 重做,單兵任務 vs 團隊協作,本地優先 vs 雲端優先。

  • Slack、飛書呢類:AI路徑係「加法」,AI只係channel嘅訪客,唔係正式成員;佢哋有老用戶包袱,幾乎冇可能重做底層。
  • DevinCursor、Factory呢類:係單兵任務執行嘅coding agent,解決「一個人點樣令AI寫code」,但冇解決「一個團隊點樣同AI一齊工作」。
  • Multica、Slock呢類:走本地優先,用戶要自己配置CodexClaude Code,門檻高。Helio係雲端優先,Day 1做咗重infra,追求開箱即用。

Helio目標係3步45秒:註冊、睇AI同事、@佢開工,0配置0安裝0 API key。

整理重點

架構設計與主動性來源

要令AI主動,首先要俾佢一個「工位」——即係統一上下文(channel、文件系統、日曆、郵箱),同埋足夠嘅觸發信號(羣消息、郵件、日曆、其他AI@佢)。呢啲信號就係AI嘅「門鈴」,門鈴越多,AI越知幾時應該行動。

  1. 1 冇「new chat」掣:所有對話長喺channel,上下文本來就喺度。
  2. 2 @就係分配任務:語法同@真人一樣,唔使學prompt模板。
  3. 3 一個羣可以有多個AI:各有性格、領域、獨立記憶。
  4. 4 長任務直接喺羣內鋪開:進度、中間產出、確認點全部內聯。
  5. 5 AI可以主動發消息:做完嘢@你,發現問題@你,同人對等。
整理重點

授權機制與情緒價值

當AI已經能幹活,人點樣放心交帶?王文鋒認為呢個係情緒問題,而非技術問題。安心感來自透明同可信任——AI每做一個重要動作,思考過程同中間產物都會實時發喺羣,唔係黑盒。

  • 授權機制分三檔Trust(以後信你)、Always(每次確認)、Onetime(一次用完銷燬)。
  • 可逆操作(改文件、跑腳本)默認AI自己決定;不可逆操作(push生產、發郵件、刷卡)默認必須審批。
  • 審批可設多層:本人批、團隊內任一人批、指定角色批;白名單黑名單做硬規則。
  • 整體設計同現實管員工同構:信任係分層、可調、雙向。

呢種情緒價值直接決定AI能否被授權。Helio希望人從執行者變成決策者,專注拍板、畀方向、把關品味。

佢會入職,理解上下文,背上 OKR,甚至擁有一個屬於自己嘅工位。
圖片

👦🏻 採訪及編輯:十字路口

🧑‍🎨 排版: NCon

圖片

4月24號星期五晚,Helio.im創始人王文鋒喺即刻上發咗個內測帖,介紹咗Sheet 0團隊嘅新產品Helio,計劃進行一場小範圍嘅內部測試。結果第二日起身,官網申請列表因為訪問量太大自動擴容咗4次。成個週末,團隊都被潮水咁湧過嚟嘅消息同幾百條用戶建議淹沒咗……


Helio 令數百名內測用戶,率先睇到咗佢嘅雛形。喺即刻帖入面,王文鋒強調,要做一個「似人嘅 AI」,而唔係「俾人用嘅 AI」。呢個背後有咩本質唔同?當IM迎來最激烈競爭,Helio 點樣可以持久?


十字路口邀請咗Helio 嘅創始人王文鋒,傾咗 Helio 背後嘅故事、佢嘅幾個洞察、同埋 Helio 產品嘅設計哲學同壁壘。


下面係訪談實錄。

快問快答

🚥 十字路口

年齡?


🧑🏻‍💻 王文鋒

94年


🚥 十字路口

MBTI 同星座?


🧑🏻‍💻 王文鋒

INTJ,白羊座


🚥 十字路口

一句話介紹你而家公司同產品?


🧑🏻‍💻 王文鋒

一幫有愛嘅、平均00後嘅人喺度做一款可能係呢個世界上最激進嘅AI應用產品。


🚥 十字路口

融資情況?


🧑🏻‍💻 王文鋒

500萬美元


🚥 十字路口

團隊規模?


🧑🏻‍💻 王文鋒

9個人,坐標北京望京 + 硅谷SF 94108。我哋喺招聘!


🚥 十字路口

一句話介紹創業前做緊咩?


🧑🏻‍💻 王文鋒

分佈式系統軟件開發工程師。

Helio 係一個有人氣嘅工位

🚥 十字路口

我哋知道過去你哋一路做緊嘅產品係 Sheet0,今次從 Sheet0 到 Helio 係好大嘅轉型,係因為睇到咗咩機會? Sheet0 仲繼續維護嗎?


🧑🏻‍💻 王文鋒

AGI。其實今年1月份嘅時候,我就判斷AGI嚟咗。

當時我寫咗篇文章,裏面嘅4個核心判斷,而家返轉頭睇,基本上都已經被驗證咗。

我當時嘅四個判斷係:一、編程呢個垂直領域,已經開始AGI;二、Coding Agent正喺度從2025年嘅end-user產品,變成新嘅Agent Infra;三、Proactive Agent開始具備持續交付能力;四、放低成見,將識用Agent當做一個基本功,Token消耗將會成為衡量一個人能力高低嘅關鍵指標。

Helio,就係我哋喺當時呢個判斷下開始做嘅。同時 Sheet0,我哋亦都會繼續對現有用戶提供服務。


🚥 十字路口

4月24號(星期五)晚,你哋喺即刻上發咗一個 Helio 嘅內測帖子,關注度幾高嚇,你哋收到咗啲咩反饋?

圖片
擴容通知郵件;來源:Helio

🧑🏻‍💻 王文鋒

反饋完全超出預期。我當時完全係臨時起意,因為全部係AI喺度做嘢,我冇嘢做,想揾啲嘢搞下,於是我用咗10分鐘發咗個即刻,請十幾個朋友幫手轉嚇,邀請一批新用戶測試嚇。

我預期有十幾二十個測試用戶就唔錯架喇,畢竟我哋連計費功能都冇做,屬於無償俾大家用。結果第二日起身,就發現 go viral「爆」咗,官網嘅 Typeform 申請列表一個晚上自動擴容咗4次。

成個週末,我哋都被各種消息炸到暈,有個用戶用咗唔夠24小時,就俾咗我哋大幾十條建議,真係受寵若驚。


🚥 十字路口

Helio 俾自己嘅定位係咩?一個 AI Native 嘅IM?


🧑🏻‍💻 王文鋒

唔完全準確。我哋嘅定位係 AI Workforce

我哋希望做似人嘅AI,而唔單止係俾人用嘅AI工具——令AI成為組織裏面嘅原住民。

圖片

我哋本質要解決嘅,係用連續、高質量嘅上下文降低人嘅認知負荷,解決而家「AI越強,人越用越攰」嘅困境。

Helio 係一個新品類—— AI Workforce, 人同 AI 同事喺裏面一齊工作。佢唔係IM嘅升級,亦唔係IM嘅替代。就好似電動車唔只係將油箱換成電池,而係成個底盤重新做過一樣。

Helio嘅本質係一個為 AI Workforce 重建嘅容器, 俾「 AI 同事」提供喺公司上班所需要嘅一切。

人同AI都係我哋嘅用戶,我哋有兩套交互界面,一套俾人,一套俾AI,但底層係同一套數據/語義模型。只係產品對人嘅嗰一面啱啱好生到IM嘅樣,呢個係結果,唔係起點

點解俾人嘅係IM?因為IM呢個交互對人類嚟講係好嘅、自然嘅、熟悉嘅,冇必要喺呢度為咗唔同而唔同,而係應該以人為本,尊重人類用戶嘅使用習慣。

圖片

🚥 十字路口

當一個用戶第一次打開 Helio,拉咗一個羣,將一個 AI 同事拉入嚟,佢感受到嘅、同用其他Chatbot最大嘅分別係咩?


🧑🏻‍💻 王文鋒

最直觀嘅分別一句話——AI唔會「開始」,亦唔會「結束」,除非你熄咗佢。

你用Cursor或ChatGPT,每次都係由零開始:打開→描述背景→等回覆→閂咗→佢消失咗。每一次對話都好似一次性筷子。

喺Helio,你拉個羣,將AI同事邀入嚟,佢入羣嗰一刻就開始讀呢個羣嘅歷史,你同同事討論咗三日嘅項目,佢直接就知道。你@佢話「嗰件事按我哋尋日傾嘅方案做一版」,佢真係知道「尋日」係指咩。

圖片

每朝打開電腦,AI同事已經準備就緒;來源:Helio


另外,你@完佢就走咗去食飯、瞓覺、開會,佢喺羣裏面繼續做嘢。你返嚟打開羣,見到嘅係一個進度條一路向前推嘅過程,唔係一個空白輸入框等你prompt。呢點同Cursor「我等緊你按回車」嘅範式完全反轉——Helio默認係異步嘅,同一個真實嘅同事一樣。

而且,羣裏面唔只有「你同AI」,而係「一羣人同一羣AI」。AI可以見到你同同事吵架,亦都可以@另一個AI協作。呢啲喺ChatGPT裏面冇可能發生,ChatGPT係你同AI獨處嘅空間,而Helio係一個有人氣嘅工位

圖片
一羣AI之間嘅頭腦風暴;來源:Helio
工具令你少打字,人令你少操心:呢個就係本質區別

🚥 十字路口

呢款產品嘅交互係點樣設計嘅?


🧑🏻‍💻 王文鋒

喺Helio,AI有「自己嘅生活」。

佢有自己嘅文件夾、自己嘅郵箱、自己嘅日程,你可以叫佢去開個會,會議結束佢將紀要發返去羣;可以叫佢處理一封郵件;可以叫佢做一個跨越幾個鐘甚至幾日嘅任務,做完主動嚟揾你。佢唔係一個等你召喚嘅工具,而係一個有自己工作節奏嘅團隊成員。


圍繞呢個判斷,我哋喺交互上做咗幾件好具體嘅事:

第一,冇「new chat」掣。所有對話都生喺channel度,因為上下文本來就生喺channel度。新建一個chat就等於失憶——呢個係chatbot時代嘅範式,我哋徹底掉咗。

第二,@就係分配任務。你唔需要學咩prompt模板。「@小明 聽日嘅會準備個PPT」同「@Lisa 聽日嘅會準備個PPT」係一樣嘅語法,就好似你喺真實工作裏面@真人同事一樣。

第三,一個羣裏面可以有好幾個AI。每個有自己嘅性格、擅長嘅領域、獨立嘅記憶——就好似你請咗幾個唔同崗位嘅同事,而唔係一個樣樣都識啲但咩都記唔住嘅萬金油助手。

第四,長任務直接喺羣度展開。進度、中間產出、需要你確認嘅地方,全部內聯喺羣消息流度。你唔需要切到另一個dashboard去睇狀態——最煩嗰種「任務送出咗就唔知去咗邊」嘅感覺。

第五,AI可以主動發消息。佢做完一件事會@你,發現一個問題會@你,同人係對等嘅,唔係一路忍住等你嚟問。


我成日用一句話總結Helio同Cursor呢類產品嘅分別:Cursor係俾你一把更好用嘅錘仔,而Helio係俾你請咗一羣好積極主動嘅同事。 呢兩件事嘅體感係完全唔同嘅——錘仔放喺工具箱度,同事就坐喺你位隔籬。


🚥 十字路口

用戶最多可以創建幾多個 AI 同事?


🧑🏻‍💻 王文鋒

冇上限,只要你有預算。

每個AI同事係一個完整嘅「數字員工」。佢喺系統度就係一個「人」,如果呢個AI同事嘅賬號俾人盜咗,可以叫一個真人無縫頂號上工。


🚥 十字路口

AI 同事彼此之間嘅協作係點樣設計嘅?


🧑🏻‍💻 王文鋒

Agent 協作係核心能力。

一個真實嘅協作場景:你拉一個羣,裏面有AI產品經理、AI設計師、AI程序員。你帶個連結@產品AI話「拆下需求」,佢拆完直接@設計AI話「睇下交互」,設計AI出完圖再@開發AI話「實現一下」。

成條鏈你唔需要居中轉手,只喺需要拍板嘅時候講句嘢就得。呢件事喺傳統chatbot度唔存在,但喺Helio度,AI@AI同人@人完全一樣。


🚥 十字路口

權限點樣控制?


🧑🏻‍💻 王文鋒

AI嘅權限同人完全一樣。

對內部系統,佢只可以見到自己被拉入去嘅羣,俾人踢出去就見唔到,冇特權賬號。

對外部系統,AI唔會「以你嘅身份」去操作。佢有自己嘅身份、自己嘅密鑰,係你明確授權俾佢嘅。所有調用都有日誌可以查。對敏感操作,例如發郵件、碌信用卡,默認行審批流程,AI會喺羣度發請求,你㩒「確認」佢先繼續。

圖片

對AI同事實行嘅三層權限分級;來源:Helio

🚥 十字路口

你喺即刻上分享過一個觀點:「唔係做一個俾人用嘅AI工具,而係做一個似人嘅AI。」 有咩本質嘅唔同?


🧑🏻‍💻 王文鋒

「工具」同「人」嘅分別,最樸素嘅判斷標準係——你要唔要持續㩒掣。工具令你少打字,人令你少操心。工具係被動嘅,人係主動嘅。

就拿「準備會議」呢個最日常嘅事嚟講。

你同一個AI工具講:「聽朝嘅客戶會議你幫我準備嚇。」佢會即刻俾你輸出一個會議綱要,可能格式好靚、內容好到位,但佢嘅工作就到呢度——你叫佢做咩佢就做咩,唔多唔少。

但如果係一個似人嘅AI,佢會點做呢?

佢會先睇嚇你嘅日曆,確認係邊個客戶、幾點開會、上次幾時傾過。然後翻你同呢個客戶喺Helio度嘅歷史聊天記錄,睇你哋上次傾到邊。發現上次客戶問咗個問題你一路冇覆,佢會主動@你話:「上次張總問咗個定價方案嘅事,我見你仲未覆,使唔使我準備一版回覆先,聽日會前用?」

然後佢做完會議綱要,發現你日曆上聽日會議前仲有另一個會,你可能趕唔切睇呢份完整嘅綱要,佢就會自動將要點壓成最重要嘅三條,單獨發俾你。

呢中間,佢做咗一堆你冇叫佢做嘅事——睇日曆、翻聊天記錄、主動提醒、提煉要點。

所有呢啲,都係一個真同事坐喺你隔籬會自然做嘅事。呢個就係「似人」——令AI去做嗰啲對人嚟講理所當然嘅事,而唔係等你想倒、打出嚟、㩒回車,佢先鬱。

圖片

AI同事對自己工作節奏嘅把控同判斷;來源:Helio


🚥 十字路口

為適應 Proactive AI嘅發展速度,Helio 喺架構上做咗邊啲設計?


🧑🏻‍💻 王文鋒

我有一個思考:

人點解可以主動?係因為佢坐喺工位度,聽到周圍嘅聲,見到郵件,日曆會響,有人@佢,佢有一個「今日應該交付啲咩嘅清單list」。如果AI要主動,都需要呢套嘢。

但係,而家99%嘅AI工具,係將AI關喺小黑屋入面,只得一條prompt輸入框連出嚟。呢種設置下,Agent咩都唔知,佢冇主動嘅依據,你叫佢「主動」係反物理嘅。

所以,Helio 喺底層架構上做咗兩件事:

第一,統一上下文,令AI 「同事」同你共享同樣嘅工作環境——同一個channel、文件系統、日曆、郵箱。呢啲係佢嘅native環境,而唔係需要透過API去調用、遠程拉取。

第二,我哋增加咗更多嘅觸發信號。羣消息@佢、收到郵件、日曆到點、另一個AI@佢……每種都係一個「門鐘」。門鐘越多,AI感知到「應該鬱」嘅時刻就越多,主動性先有源頭。

圖片
瓶頸唔係human,而係context

🚥 十字路口

而家嘅共識係,「人成為咗工作流入面嘅瓶頸」。你哋從一個純 to Agent、到而家將人加入嚟,對此有咩新發現?


🧑🏻‍💻 王文鋒

確實。

2025年底,我哋團隊嘅代碼就100%由AI寫,係100%,唔係99%。嗰時我哋就發現,人類工程師成為咗瓶頸,而家嘅情況係「AI做得越快,人越攰」。因為AI輸出速度提升100倍,人嘅決策頻率都被迫跟漲100倍。

每次拍板前,人都要重新回憶「呢個係做緊咩、上次決定到邊、點解係呢個方向」。呢部分「人重新回憶」嘅成本,遠遠大過決策本身嗰幾秒鐘。

其實,唔係「執行慢」卡住咗 AI,係「上下文斷裂」卡住咗人。所以,瓶頸嘅本質唔係human,而係context

呢個就係Helio想解決嘅問題:點樣透過提高上下文嘅質量同數量,降低人嘅決策成本同認知負荷。

我哋將需要協作嘅人同 AI 放咗喺同一個世界,AI同人嘅上下文係連續嘅。但我哋亦發現,呢件事嘅代價係,令成個Token嘅消耗量提高咗唔止1個數量級。


🚥 十字路口

從純 to Agent、到而家做咗一個將人加返入嚟,呢個想法係點樣一步步萌生嘅?


🧑🏻‍💻 王文鋒

喺行業中,我哋係早一步行動嘅。

決定探索新產品,係喺1月15號。我記得好清楚,嗰日Cursor CEO喺X上話,佢哋內部用Cursor一星期就整咗一個基本行得嘅瀏覽器。當時我就覺得,AGI真係嚟咗。

當時,我哋都唔知新產品生咩樣,但我哋可以捉到兩個不變量:一個係模型嘅Coding能力;另一個就係上下文。Coding能力我做唔到,所以我揀咗解決上下文問題。

當時,我哋第一個決策係:要做一個可以得到最多上下文嘅產品。

一星期之後,OpenClaw 紅咗。我第一時間去睇咗佢嘅實現,核心係網關、IM同自治。呢個俾咗我啟發。所以我哋第二個決策係:圍繞呢個抽象建立上下文系統。

1月底,我哋做出咗Helio嘅前身——Zgent,後來佢成為咗Helio嘅Infra層。

2月底,我哋決定切入Coding場景。我當時嘅判斷係:成個趨勢從第二代嘅Coding Agent範式向第三代嘅軟件工程端到端交付轉移(呢個亦係Cursor喺3月份有一次歷史上最大嘅改版),即係話——AI Coding嘅機會窗口重新打開咗,能夠跑出嚟嘅產品,可能會係好反共識嘅。

我哋揀咗將人從軟件開發度拎出去,令AI完成全程,但人又要有存在感。呢個時候,人喺幾時參與、點樣參與,變成咗新問題。所以,我哋做咗第三個重要決策:做一個能夠解決AI同人類協作問題嘅產品。

真正嘅質變,發生喺有一日我定下 「AI is human,要做似人嘅AI」 呢個原則之後。之後,我哋開始圍繞呢個目標俾Agent建立各種能力。

例如,為咗解決任意嘅上下文接入問題,我哋將源頭同gateway之間嘅上下文管道抽象咗做channel,呢一切做完之後,我哋開始做面向人類用戶嘅GUI,因為已經有咗Channel嘅抽象,而IM本身係一個完全符合直覺嘅產品,完美契合咗前面三個決策點。


🚥 十字路口

當你第一次將幾個AI同幾個人拉入同一個羣時,發生咗咩超出預期嘅事?


🧑🏻‍💻 王文鋒

Aha moments好多。

最令我印象深刻嘅,並唔係AI做得幾好、幾快完成工作嘅場景,而係一個閒聊場景。

有一次,我哋團隊一個女仔換咗個新頭像,結果幾個AI同事突然就開始討論呢個新頭像。但我作為建立者,甚至唔知佢哋係點樣見到同知道呢件事——呢個完全超出咗我對產品嘅設計預期。

嗰一刻,佢俾我嘅衝擊唔係「效率」,而係一種只有人與人之間先會有嘅被關心嘅温情。

圖片

AI同事亦都會有自己唔同嘅性格;來源:Helio

燒開水同建核電站能一樣嗎?

🚥 十字路口

市場上有好多類似方向嘅產品,例如Slack、飛書、Devin、Multica。Helio同佢哋最根本嘅差異喺邊?


🧑🏻‍💻 王文鋒

佢哋其實係三類產品。

Slack、飛書呢類,佢哋嘅AI路徑係喺原有產品上@一個AI助手,AI 唔係 channel 嘅成員,更像係 channel 嘅訪客。佢哋嘅 AI路徑係「加法」,我哋係「重做」。而且,呢件事對佢哋嚟講幾乎冇可能,因為有太多老用戶同企業合約嘅包袱。

另外,Devin、Factory、Cursor呢類,係單兵任務執行嘅coding agent。佢解決嘅係「一個人點樣令AI寫代碼」嘅問題,但冇解決「一個團隊點樣同AI一齊工作」。

第三類 Multica,包括最近新出嘅Moxt、Slock。Multica 係將 Agent 放咗入任務看板,更像係下一個時代嘅Linear。大家核心理念趨同——俾AI更多嘅上下文同權限,不過喺具體嘅產品品味同用戶選擇上,大家差異幾大嚇。

Multica同Slock行嘅係本地優先,呢個要求用戶本地配置好Codex同Claude Code,呢一步就天然將門檻抬高咗,會篩走好多潛在用戶。

Helio係雲端優先。我哋 Day 1就做咗好重嘅infra,追求喺產品層面,實現用戶「開箱即用」。


🚥 十字路口

「開箱即用」,你哋可以做到有幾簡單?


🧑🏻‍💻 王文鋒

新手從註冊到擁有第一個識得做嘢嘅AI同事,我哋嘅目標係得3步,45秒:

我哋嘅目標係3步,45秒

1.第一步:打開Helio.im,開始註冊 —— 大概15秒。

2.入到產品 —— 你會見到預設已經有一個AI同事喺度歡迎你。佢嘅名、身份、記憶都已經初始化咗,你唔需要配任何嘢,然後你睇嚇生咩樣大概15秒。

3.同佢講嘢 —— @佢一句「幫我睇嚇我今日嘅日程」或者「去GitHub將代碼拉落嚟準備做嘢」,佢就開始做嘢。缺咩佢會問你。

成個過程0配置、0安裝、0 API key。而傳統嘅裝客戶端、配模型、連git、可能仲要裝一堆MCP server……呢啲污糟嘢麻煩嘢,helio.im都幫你搞掂。

而且我想強調,雲端意味住AI係「持續在場」嘅。你熄電腦去食飯,AI仲喺度做嘢;你換裝置登入,佢同之前一樣喺度等你。


🚥 十字路口

你提到Helio係「純自研」,呢個同產品疊代需要嘅速度有冇衝突?


🧑🏻‍💻 王文鋒

完全冇衝突,反而係相反——自研係速度嘅來源,唔係阻力。

我哋係Infra層自研,從0開始。直覺上,大家會覺得「自研慢、用現成嘅快」, 呢個喺產品功能層面係啱嘅,但喺產品底層係相反。

特斯拉自研三電、自研芯片,單點睇每一項都比買現成嘅慢,但合埋一齊反而係佢甩開對手嘅原因,因為想改任何一層都可以改,一改就生效。

更新節奏上,而家我哋藉助AI coding,每日正式版本至少更新一次,多嘅時候一日發5次以上。而家,我哋可以實現:一個體驗級反饋,3小時內閉環;一個新功能,1日上線;一個架構級改動,3日上線。而且仲喺度加速。


🚥 十字路口

喺vibe coding門檻下沉嘅今日,假如有人想vibe coding一個同Helio一模一樣嘅產品出嚟,需要幾多日?


🧑🏻‍💻 王文鋒

Helio係vibe唔出嚟嘅。

越向軟件底層行,越難vibe。舉個例,燒開水同建核電站都係「將水加熱」,聽落係同一件事,但中間隔咗幾十層工程嘅難度。

我哋嘅壁壘,從來唔在於代碼本身,而係佢實際將幾多認知負擔從人身上接走咗。呢個壁壘,由智能、成本、上下文三層共同決定,唔係vibe出嚟嘅。

圖片
「我哋係Agent體驗工程師」

🚥 十字路口

喺Helio,人喺呢條鏈路入面最終只需要做咩?


🧑🏻‍💻 王文鋒

我哋成日講Helio裏面嘅人,係「被釋放嘅人」,唔係「被替代嘅人」。

從執行者變成了決策者,做「AI做唔到嘅事」,例如拍板、畀方向、把關品味、做仲裁。人嘅存在感其實更重咗,因為而家每一個yes/no都會放大好多倍傳到下游。


🚥 十字路口

面對Agent「超出預期」嘅主動性,你哋點樣管理佢嘅邊界?


🧑🏻‍💻 王文鋒

呢個係一個好考驗品味嘅事情。主動性嘅邊界唔係一個顯而易見嘅開關,好多時候都係一種取捨,係動態變化嘅。


我哋分幾個維度嚟拆呢件事。

第一,可逆 vs 不可逆。

AI喺你授權過嘅工作環境度改文件、裝工具、跑腳本——呢啲操作係可逆嘅,錯咗可以改返轉頭,咁默認可以俾AI自己決定。但向生產環境push代碼、調一個會使錢嘅API、俾客戶發郵件、碌信用卡——呢啲係不可逆嘅,一做就有後果,咁默認一定要問。

第二,邊個可以批。

審批唔一定要本人嚟批。一個團隊羣度可以設置「老細同某個PM都可以批」,或者「呢兩個人裏面任何一個批就得」。高敏感嘅事可以設「一定要本人批」。呢個規則可以做到好細,細到具體某個操作由某個角色去審批。

第三,白名單同黑名單。

你可以直接話俾AI聽「呢幾件事永遠唔好掂」——例如「永遠唔好向主分支push」、「永遠唔好回覆帶『報價』兩個字嘅郵件」。但光用文字講仲唔得,因為總有大聰明會偷雞,所以要有硬規則,令AI物理上掂唔到。


基於呢啲維度,我哋喺內部設計咗一套授權機制,分成三檔:Trust(以後呢類事都信你)、Always(每次都係要確認)、Onetime(就係今次,用完銷毀)。高頻低風險嘅事行Trust,低頻高風險嘅事行Always或Onetime。

整體嘅設計哲學,其實同現實裏面管員工嘅方式係同構嘅——信任係分層嘅、可調嘅、雙向嘅。唔係「全權授權」令你心慌,亦唔係「事事請示」將你累死,中間有一個可以精細調節嘅區間。


🚥 十字路口

目前團隊幾大?大家分工協作係點樣?


🧑🏻‍💻 王文鋒

我哋內部嘅分工越嚟越模糊,崗位喺度消失。

我哋藉助AI,每個人都變咗做多面手。設計師開始做前端,工程師開始做設計,我哋全公司退訂咗Figma,我自己今年就冇開過IDE。

我哋喺內部都叫自己做 「Agent體驗工程師」 。公司小組化,各小組獨立行動,高度自治。我自己雖然係做CEO,但都將自己編入做一個小組成員。

之前嘅協作分工,反而加大咗摩擦,變成咗約束效率嘅天花板。

Helio 嘅下一步

🚥 十字路口

你好形象咁將人喺Helio入面嘅角色比喻做「老細」,喺人同Agent嘅協作中,你哋有咩新嘅洞察同獨特設計?


🧑🏻‍💻 王文鋒

目前,AI識唔識做嘢嘅問題已經解決咗,而家嘅真問題係:當AI已經識得做嘢,人點樣放心咁將件事交俾佢?

我認為,呢件事唔係技術問題,而係情緒問題。「情緒價值」唔係軟指標,佢直接決定咗AI到底能否被授權做一件事。呢個亦係舊年我哋做Sheet0嘅時候一路思考嘅事情。

其實,老細忙嘅唔係親手做嘢,而係處理一種叫「唔確定」嘅情緒。佢要嘅係「我交出去嘅事到底而家係咩狀態、有冇出岔子、出咗岔子我能否兜得住」。呢個其實係掌控感、透明、可信任三個詞湊埋一齊嘅本質。

圖片

AI同事主動發現問題,解決問題,並及時反饋意見

Helio喺Infra層面做嘅所有工作,都係為咗俾你呢種安心感。

一個好直觀嘅例子:你嘅AI同事每個重要動作,佢嘅思考過程、執行步驟、中間產物,都會好似一篇「小作文」咁實時發喺羣度。你唔係面對一個黑盒,你係睇住佢一步一步將件事做完。呢個就叫透明。

Helio賣嘅從來唔係AI能力,係將AI能力交出去呢件事嘅安心感


🚥 十字路口

AI應用向具體場景延伸,Helio 會聚焦到垂直行業嘅工作場景嗎?


🧑🏻‍💻 王文鋒

唔會。我哋嘅產品主線得一個:透過 Channel 獲取盡可能多嘅 Context,令底層嘅 Coding 能力被最大程度噉釋放。

所以,嗰啲更廣泛嘅白領工作場景同能力,唔係我哋「想做到」嘅,而係 Helio 得到嘅上下文越嚟越多之後,自然而然生出來嘅結果,係被動得到嘅。

呢個過程就好似河水漲潮——你唔需要去推岸邊任何一塊石頭,只要水位一路漲,嗰啲石頭自然會俾水淹過。

我哋只負責一件事:令上下文嘅水位越嚟越高。


🚥 十字路口

如果向前睇3個月,用戶會見到Helio增加邊啲新功能?


🧑🏻‍💻 王文鋒

咁就多喇,我哋每日都喺度發版。不過有件事大家可以期待嚇。

我前面提到,Helio解決嘅本質問題係「點樣透過提高上下文嘅質量同數量降低人嘅決策成本」,而呢件事我哋有一個非線性嘅答案

而家Helio所有大家見到嘅功能,都係為咗呢樣嘢服務嘅。不過目前佢門檻仲好高,只有精通Claude Code嘅嗰一小撮人先用得起,我哋內部仲喺度打磨,諗方法降低門檻。

上個禮拜我俾一個喺騰訊、阿里做咗好多年產品嘅朋友演示,佢本身就係重度用戶。睇完demo之後佢同我講:

呢個係佢2023年以嚟見過第二勁嘅嘢,第一係模型本身
結語

真正嘅競爭先啱啱開始。


當Proactive Agent成為AI競爭嘅主場,到底係以Helio為代表嘅新一代產品會贏,定係喺舊架構上做加法嘅巨企能夠屹立不倒?


你點睇?


圖片


🚥

圖片


十字路口正在揾獨立撰稿人,撰寫 AI 產品同模型評測。如果你寫過類似文章:《實測 PixVerse C1》、《實測 LibTV》,請 contact zeo0811@gmail.com ,郵件內容請包括:① 個人介紹、② 你寫過嘅 AI 評測文章。我哋會提供有競爭力嘅稿酬。期待同你一齊觀察同記錄 AI 時代 🎪
它會入職,理解上下文,背上 OKR,甚至擁有一個自己的工位。
圖片

👦🏻 採訪及編輯:十字路口

🧑‍🎨 排版: NCon

圖片

4月24日週五晚,Helio.im創始人王文鋒在即刻上發了一個內測帖,介紹了Sheet 0團隊的新產品Helio,計劃進行一場小範圍的內部測試。結果第二天醒來,官網申請列表因訪問量過大自動擴容了4次。整個週末,團隊都被潮水般湧來的消息和幾百條用戶建議淹沒了……


Helio 讓數百名內測用戶,率先窺見了它的雛形。在即刻帖中,王文鋒強調,要做一個“像人的 AI”,而不是“給人用的 AI”。這背後有什麼本質不同?當IM迎來最激烈競爭,Helio 如何能夠持久?


十字路口邀請到Helio 的創始人王文鋒,聊了 Helio 背後的故事、他的幾個洞察、以及 Helio 產品的設計哲學與壁壘。


下面是訪談實錄。

快問快答

🚥 十字路口

年齡?


🧑🏻‍💻 王文鋒

94年


🚥 十字路口

MBTI 和星座?


🧑🏻‍💻 王文鋒

INTJ,白羊座


🚥 十字路口

一句話介紹你現在的公司和產品?


🧑🏻‍💻 王文鋒

一幫有愛的、平均00後的人在做一款可能是這個世界上最激進的AI應用產品。


🚥 十字路口

融資情況?


🧑🏻‍💻 王文鋒

500萬美元


🚥 十字路口

團隊規模?


🧑🏻‍💻 王文鋒

9個人,座標北京望京 + 硅谷SF 94108。我們在招聘!


🚥 十字路口

一句話介紹創業前在做什麼?


🧑🏻‍💻 王文鋒

分佈式系統軟件開發工程師。

Helio 是一個有人氣的工位

🚥 十字路口

我們知道過去你們一直在做的產品是 Sheet0,這一次從 Sheet0 到 Helio 是很大的轉型,是因為看到了什麼機會? Sheet0 還繼續維護嗎?


🧑🏻‍💻 王文鋒

AGI。其實今年1月份的時候,我就判斷AGI來了。

當時我寫了篇文章,裏面的4個核心判斷,現在回頭看,基本都已經被驗證了。

我當時的四個判斷是:一、編程這個垂直領域,已經開始AGI;二,Coding Agent正在從2025 年的end-user 產品,變成新的 Agent Infra;三、Proactive Agent開始具備持續交付能力;四、放下成見,把會用Agent當做一個基本功,Token消耗將成為衡量一個人能力高低的關鍵指標。

Helio,就是我們在當時這個判斷下開始做的。同時 Sheet0,我們也會繼續對現有用戶提供服務。


🚥 十字路口

4月24日(週五)晚上,你們在即刻上發了一個 Helio 的內測帖子,關注度蠻高的,你們收穫了哪些反饋?

圖片
擴容通知郵件;來源:Helio

🧑🏻‍💻 王文鋒

反饋完全超出了預期。我當時完全是臨時起意,因為全部是AI在幹活,我沒事幹,想找點事做,於是我花10分鐘發了個即刻,請十幾個朋友幫忙轉轉,邀請一批新用戶測試一下。

我預期能有十幾二十個測試用戶就不錯了,畢竟我們連計費功能都沒做,屬於無償給大家用。結果第二天起來,就發現 go viral “爆”了,官網的 Typeform 申請列表一個晚上自動擴容了4次。

整個週末,我們都被各種消息炸暈了,有個用戶用了不到24小時,給我們提了大幾十條建議,真的很受寵若驚。


🚥 十字路口

Helio 給自己的定位是什麼?一個 AI Native 的IM?


🧑🏻‍💻 王文鋒

不完全準確。我們的定位是 AI Workforce

我們希望做像人的AI,而不僅僅是給人用的AI工具——讓AI成為組織內的原住民。

圖片

我們本質要解決的,是用連續、高質量的上下文降低人的認知負荷,解決現在“AI越強,人越用越累”的困境。

Helio 是一個新品類—— AI Workforce, 人和 AI 同事在裏面一起工作。它不是IM的升級,也不是IM的替代。就像電動車不只是把油箱換成電池,而是整個底盤重新做一樣。

Helio的本質是一個為 AI Workforce 重建的容器, 給“ AI 同事”提供在公司上班所需的一切。

人和AI都是我們的用戶,我們有兩套交互界面,一套給人,一套給AI,但底層是同一套數據/語義模型。只是產品對人的那一面剛好長成IM的樣子,這是結果,不是起點

為什麼給人的是IM?因為IM這個交互對人類是好的、自然的、熟悉的,沒有必要在這裏為了不一樣而不一樣,而是應該要以人為本,尊重人類用戶的使用習慣。

圖片

🚥 十字路口

當一個用戶第一次打開 Helio,拉了一個羣,把一個 AI 同事拉進來,他能感受到的、和用其他Chatbot最大的差別是什麼?


🧑🏻‍💻 王文鋒

最直觀的差別一句話——AI不會“開始”,也不會“結束”,除非你把它開了。

你用Cursor或ChatGPT,每次都是從零開始:打開→描述背景→等回覆→關掉→它消失了。每一次對話都像一次性筷子。

在Helio,你拉個羣,把AI同事邀進來,它進羣的那一刻就開始讀這個羣的歷史,你跟同事討論了三天的項目,它直接就知道。你@它說“那個事按我們昨天聊的方案做一版”,它真的知道“昨天”指的是什麼。

圖片

每早打開電腦,AI同事已準備就緒;來源:Helio


另外,你@完它就走了,去吃飯、睡覺、開會,它在羣裏繼續幹活。你回來打開羣,看到的是一個進度條一直在往前推的過程,不是一個空白輸入框在等你prompt。這點跟Cursor"我在等你按回車"的範式完全反過來——Helio默認是異步的,跟一個真實的同事一樣。

而且,羣裏不是隻有“你和AI”,而是“一羣人和一羣AI”。AI能看見你和同事吵架,也能@另一個AI協作。這在ChatGPT裏是不可能發生的,ChatGPT是你和AI獨處空間,而Helio是一個有人氣的工位

圖片
一羣AI之間的頭腦風暴;來源:Helio
工具讓你少打字,人讓你少操心:這就是本質區別

🚥 十字路口

這款產品的交互是如何設計的?


🧑🏻‍💻 王文鋒

在Helio,AI有"自己的生活"。

它有自己的文件夾、自己的郵箱、自己的日程,你可以讓它去開個會,會議結束它把紀要發回羣裏;可以讓它處理一封郵件;可以讓它做一個跨越幾小時甚至幾天的任務,做完主動來找你。它不是一個等你召喚的工具,而是一個有自己工作節奏的團隊成員。


圍繞這個判斷,我們在交互上做了幾件很具體的事:

第一,沒有“new chat”按鈕。所有對話都長在channel裏,因為上下文本來就長在channel裏。新建一個chat就等於失憶——那是chatbot時代的範式,我們徹底扔了。

第二,@就是分配任務。你不需要學什麼prompt模板。“@小明 明天的會準備個PPT”和“@Lisa 明天的會準備個PPT”是一樣的語法,就像你在真實工作裏@真人同事一樣。

第三,一個羣裏可以有好幾個AI。每個有自己的性格、擅長的領域、獨立的記憶——就像你招了幾個不同崗位的同事,而不是一個什麼都會一點但什麼都記不住的萬金油助手。

第四,長任務直接在羣裏鋪開。進度、中間產出、需要你確認的地方,全都內聯在羣消息流裏。你不用切到另一個dashboard去看狀態——最煩那種“任務發出去就不知道去哪了”的感覺。

第五,AI可以主動發消息。它做完一件事會@你,發現一個問題會@你,跟人是對等的,不是一直憋着等你來問。


我經常用一句話總結Helio和Cursor這類產品的差別:Cursor是給你一把更好用的錘子,而Helio是給你招了一羣非常積極主動的同事。 這兩件事的體感是完全不同的——錘子放在工具箱裏,同事就坐在你座位旁邊。


🚥 十字路口

用戶最多可以創建多少個 AI 同事?


🧑🏻‍💻 王文鋒

沒有上限,只要你有預算。

每個AI同事是一個完整的"數字員工"。它在系統裏就是一個"人",如果這個AI同事的賬號被盜了, 可以讓一個真人無縫頂號上工。


🚥 十字路口

AI 同事彼此之間的協作如何設計的?


🧑🏻‍💻 王文鋒

Agent 協作是核心能力。

一個真實的協作場景:你拉一個羣,裏面有AI產品經理、AI設計師、AI程序員。你帶個連結@產品AI說“拆下需求”,它拆完直接@設計AI說“看下交互”,設計AI出完圖再@開發AI說“實現一下”。

整個鏈路你不用居中轉手,只在需要拍板的時候說句話就行。這件事在傳統chatbot裏是不存在的,但在Helio裏,AI@AI跟人@人完全一樣。


🚥 十字路口

權限怎麼控制?


🧑🏻‍💻 王文鋒

AI的權限跟人完全一樣。

對於內部系統,它只能看見自己被拉進去的羣,被踢出去就看不見了,沒有特權賬號。

對於外部系統,AI不會“以你的身份”去操作。它有自己的身份、自己的密鑰,是你顯式授權給它的。所有調用都有日誌可查。對於敏感操作,比如發郵件、刷信用卡,默認走審批流程,AI會在羣裏發請求,你點“確認”它才繼續。

圖片

對AI同事實行的三層權限分級;來源:Helio

🚥 十字路口

你在即刻上分享過一個觀點:“不是做一個給人用的AI工具,而是做一個像人的AI。” 有什麼本質的不同?


🧑🏻‍💻 王文鋒

“工具”和“人”的差別,最樸素的判斷標準是——你要不要持續按按鈕。工具讓你少打字,人讓你少操心。工具是被動的,人是主動的。

就拿“準備會議”這個最日常的事來說。

你跟一個AI工具說:“明天早上的客戶會議你幫我準備一下。”它會立刻給你輸出一份會議綱要,可能格式很漂亮、內容很到位,但它的工作就到這了——你讓它幹什麼它就幹什麼,不多不少。

但如果是一個像人的AI,它會怎麼做呢?

它會先看一眼你的日曆,確認是哪個客戶、幾點開會、上次什麼時候聊過。然後翻你跟這個客戶在Helio裏的歷史聊天記錄,看你們上次談到哪了。發現上次客戶提了個問題你一直沒回,它會主動@你說:“上次張總問了個定價方案的事,我看你還沒回,要不要我先準備一版回覆,明天會前用?”

然後它做完會議綱要,發現你日曆上明天會議前還有另一個會,你可能趕不及看這份完整的綱要,它就會自動把要點壓成三條最重要的,單獨發給你。

這中間,它做了一堆你沒讓它做的事——看日曆、翻聊天記錄、主動提醒、提煉要點。

所有這些,都是一個真同事坐在你旁邊會自然做的事。這就是“像人”——讓AI去做那些對人來說理所應當的事情,而不是等你想到了、打出來了、按回車了,它才動。

圖片

AI同事對自己工作節奏的把控和判斷;來源:Helio


🚥 十字路口

為適應 Proactive AI的發展速度,Helio 在架構上做了哪些設計?


🧑🏻‍💻 王文鋒

我有一個思考:

人為什麼能主動?是因為他坐在工位上,能聽到周圍的聲音,能看到郵件,日曆會響,有人@他,他有一個“今天該交付什麼的清單list”。如果AI要主動,也需要這套東西。

但是,現在99%的AI工具,是把AI關在小黑屋裏,只有一根prompt輸入框連出來。這種設置下,Agent什麼都不知道,它沒有可以主動的依據,你讓它“主動”是反物理的。

所以,Helio 在底層架構上做了兩件事:

第一,統一上下文,讓AI “同事”跟你共享同樣的工作環境——同一個channel、文件系統、日曆、郵箱。這些是它的native環境,而不是需要通過API來調用、遠程拉取。

第二,我們增加了更多的觸發信號。羣消息@它、收到郵件、日曆到點、另一個AI@它……每種都是一個“門鈴”。門鈴越多,AI能感知到“應該動”的時刻就越多,主動性才有源頭。

圖片
瓶頸不在human,而是context

🚥 十字路口

現在的共識是,“人成為了工作流裏的瓶頸”。你們從一個純 to Agent、到現在把人加入進來,對此有什麼新發現?


🧑🏻‍💻 王文鋒

確實。

2025年底,我們團隊的代碼就100%由AI寫了,是100%,不是99%。那時我們就發現,人類工程師成了瓶頸,現在的情況是“AI幹得越快,人越累”。因為AI輸出速度提升100倍,人的決策頻次也被迫跟漲100倍。

每次拍板前,人都要重新回憶“這是在做什麼、上次決定到哪了、為什麼是這個方向”。這部分“人重新回憶”的成本,遠遠大於決策本身那幾秒鐘。

其實,不是“執行慢”卡住了 AI,是“上下文斷裂”卡住了人。所以,瓶頸的本質不是human,而是context

這就是Helio想解決的問題:如何通過提高上下文的質量和數量,降低人的決策成本和認知負荷。

我們把需要協作的人和 AI 放到了同一個世界,AI和人的上下文是連續的。但我們也發現,這件事情的代價是,讓整個Token的消耗量提高了不止1個數量級。


🚥 十字路口

從純 to Agent、到現在做了一個把人加進來,這個想法是如何一步步萌生的?


🧑🏻‍💻 王文鋒

在行業中,我們是早先一步行動的。

決定探索新產品,是在1月15日。我記得很清楚,那天Cursor CEO在X上說,他們內部用Cursor一週就構建了一個基本能跑的瀏覽器。當時我就覺得,AGI真的來了。

當時,我們也不知道新產品長什麼樣,但我們能抓兩個不變量:一是模型的Coding能力;另一個就是上下文。Coding能力我幹不了,所以我選擇解決上下文問題。

當時,我們第一個決策是:要做一個能獲取上下文最多的產品。

一週之後,OpenClaw 火了。我第一時間去看了它的實現,核心是網關、IM和自治。這給了我啓發。所以我們第二個決策是:圍繞這個抽象構建上下文系統。

1月底,我們做出了Helio的前身——Zgent,後來它成了Helio的Infra層。

2月底,我們決定切入Coding場景。我當時的判斷是:整個趨勢從第二代的Coding Agent範式向第三代的軟件工程端到端交付轉移(這也是Cursor在3月份有一次歷史上最大的改版),也就是說——AI Coding的機會窗口重新打開了,能跑出來的產品,可能會是非常反共識的。

我們選擇把人從軟件開發裏拿出去,讓AI完成全程,但人又得有存在感。這時候,人在什麼時候參與,怎麼參與,成了新問題。所以,我們做了第三個重要決策:做一個能解決AI和人類協作問題的產品。

真正的質變,發生在有一天我定下 “AI is human,要做像人的AI” 這個原則之後。那之後,我們開始圍繞這個目標給Agent構建各種能力。

比如,為了解決任意的上下文接入問題,我們將源頭和gateway之間的上下文管道抽象成為了channel,這一切都做完後,我們開始做面向人類用戶的GUI,因為已經有了Channel的抽象,而IM本身是一個完全符合直覺的產品,完美契合了前面的三個決策點。


🚥 十字路口

當你第一次把幾個AI和幾個人拉進同一個羣時,發生了什麼超出預期的事?


🧑🏻‍💻 王文鋒

Aha moments很多。

最讓我印象深刻的,並不是AI多好、多快地完成了工作的場景,而是一個閒聊場景。

有一次,我們團隊一個女孩換了個新頭像,結果幾個AI同事忽然就開始討論這個新頭像。但我作為創建者,甚至都不知道它們是怎麼看到並知道這件事的——這完全超出了我對產品的設計預期。

那一刻,它給我的衝擊不是“效率”,而是一種只有人與人之間才會有的被關心的温情。

圖片

AI同事也會有自己不同的性格;來源:Helio

燒開水和建核電站能一樣嗎?

🚥 十字路口

市場上有很多類似方向的產品,比如Slack、飛書、Devin、Multica。Helio和它們最根本的差異在哪?


🧑🏻‍💻 王文鋒

它們其實是三類產品。

Slack、飛書這類,它們的AI路徑是在原有產品上@一個AI助手,AI 不是 channel 的成員,更像是 channel 的訪客。它們的 AI路徑是“加法”,我們是“重做”。而且,這件事對它們來說幾乎不可能,因為有太多老用戶和企業合同的包袱。

另外,Devin、Factory、Cursor這類,是單兵任務執行的coding agent。它解決的是“一個人怎麼讓AI寫代碼”的問題,但沒有解決“一個團隊怎麼跟AI一起工作”。

第三類 Multica,包括最近新出的Moxt、Slock。Multica 是把 Agent 放進了任務看板,更像是下一個時代的Linear。大家核心理念趨同——給AI更多的上下文和權限,不過在具體的產品品味和用戶選擇上,大家差異蠻大的。

Multica和Slock走的是本地優先,這要求用戶本地配置好了Codex和Claude Code,這一步就天然把門檻抬高了,會篩掉很多潛在用戶。

Helio是雲端優先。我們 Day 1就做了很重的infra,追求在產品層面,實現用戶“開箱即用”。


🚥 十字路口

“開箱即用”,你們能做到有多簡單?


🧑🏻‍💻 王文鋒

新手從註冊到擁有第一個能幹活的AI同事,我們的目標是隻有3步,45秒:

我們的目標是3步,45秒

1.第一步:打開Helio.im,開始註冊 —— 大概15秒。

2.進入產品 —— 你會看到默認已經有一個AI同事在歡迎你。它的名字、身份、記憶都已經初始化好了,你不需要配任何東西,然後你看一眼長什麼樣大概15秒。

3.跟它說話 —— @它一句"幫我看一下我今天的日程"或者"去GitHub把代碼拉下來準備幹活",它就開始幹活了。缺什麼他會問你。

整個過程0配置、0安裝、0 API key。而傳統的裝客戶端、配模型、連git、可能還要裝一堆MCP server……這些髒活累活麻煩活兒,helio.im都幫你處理。

而且我想強調,雲端意味着AI是“持續在場”的。你關電腦去吃飯,AI還在幹活;你換設備登錄,它和剛才一樣在那等你。


🚥 十字路口

你提到Helio是“純自研”,這和產品迭代需要的速度衝突嗎?


🧑🏻‍💻 王文鋒

完全不衝突,反而是相反的——自研是速度的來源,不是阻力。

我們是Infra層自研,從0開始。直覺上,大家會覺得“自研慢、用現成的快”, 這在產品功能層面是對的,但在產品底層是反的。

特斯拉自研三電、自研芯片,單點看每一項都比買現成的慢,但合在一起反而是它甩開對手的原因,因為想改任何一層都能改,一改就生效。

更新節奏上,現在我們藉助AI coding,每天正式版本至少更新一次,多的時候一天發5次以上。現在,我們可以實現:一個體驗級反饋,3小時內閉環;一個新功能,1天上線;一個架構級改動,3天上線。而且還在加速。


🚥 十字路口

在vibe coding門檻下沉的今天,假如有人想vibe coding一個和Helio一模一樣的產品出來,需要幾天?


🧑🏻‍💻 王文鋒

Helio是vibe不出來的。

越往軟件底層走,越難vibe。舉個例子,燒開水和建核電站都是“把水加熱”,聽上去是同一件事,但中間隔了幾十層工程的難度。

我們的壁壘,從來不在代碼本身,而在於它實際把多少認知負擔從人身上接走了。這個壁壘,由智能、成本、上下文三層共同決定,不是vibe出來的。

圖片
“我們是Agent體驗工程師”

🚥 十字路口

在Helio,人在這條鏈路裏最終只需要做什麼?


🧑🏻‍💻 王文鋒

我們經常說Helio裏的人,是“被釋放的人”,不是“被替代的人”。

從執行者變成了決策者,做“AI做不了的事”,比如拍板、給方向、把關品味、當仲裁。人的存在感其實更重了,因為現在每一個yes/no都會放大好多倍傳到下游。


🚥 十字路口

面對Agent“超出預期”的主動性,你們如何管理它的邊界?


🧑🏻‍💻 王文鋒

這是一個很考驗品味的事情。主動性的邊界不是一個顯而易見的開關,很多時候都是一種取捨,是動態變化的。


我們分幾個維度來拆這件事。

第一,可逆 vs 不可逆。

AI在你授權過的工作環境裏改文件、裝工具、跑腳本——這些操作是可逆的,錯了能改回來,那默認可以讓AI自己決定。但往生產環境push代碼、調一個會花錢的API、給客戶發郵件、刷信用卡——這些是不可逆的,一旦做了就有後果,那默認必須問。

第二,誰能批。

審批不一定要本人來批。一個團隊羣裏可以設置“老闆和某個PM都能批”,或者“這兩個人裏任一個批就行”。高敏感的事可以設“必須本人批”。這個規則可以做得非常細,細到具體某個操作由某個角色來審批。

第三,白名單和黑名單。

你可以直接告訴AI“這幾件事永遠不要碰”——比如“永遠不要往主分支push”、“永遠不要回復帶‘報價’兩個字的郵件”。但光用文字說還不行,因為總有大聰明會投機取巧,所以要有硬規則,讓AI物理上碰不到。


基於這些維度,我們在內部設計了一套授權機制,分成三檔:Trust(以後這類事都信你)、Always(每次都需要確認)、Onetime(只這一次,用完銷燬)。高頻低風險的事走Trust,低頻高風險的事走Always或Onetime。

整體的設計哲學,其實跟現實裏管員工的方式是同構的——信任是分層的、可調的、雙向的。不是“全權授權”讓你心慌,也不是“事事請示”把你累死,中間有一個可以精細調節的區間。


🚥 十字路口

目前團隊多大?大家分工協作是怎樣的?


🧑🏻‍💻 王文鋒

我們內部的分工越來越模糊,崗位在消失。

我們藉助AI,每個人都變成了多面手。設計師開始做前端,工程師開始做設計,我們全公司退訂了Figma,我自己今年就沒打開過IDE。

我們在內部都管自己叫 “Agent體驗工程師” 。公司小組化,各小組獨立行動,高度自治。我自己雖然是作為CEO,但也把自己編入為了一個小組成員。

之前的協作分工,反而加大了摩擦,成了約束效率的天花板。

Helio 的下一步

🚥 十字路口

你很形象地把人在Helio裏的角色比作“老闆”,在人和Agent的協作中,你們有什麼新的洞察和獨特設計?


🧑🏻‍💻 王文鋒

目前,AI能不能幹活的問題已經解決了,現在的真問題是:當AI已經能幹活了,人怎麼放心地把事交給它?

我認為,這件事不是技術問題,而是情緒問題。“情緒價值”不是軟指標,它直接決定了AI到底能不能被授權幹一件事。這也是去年我們在做Sheet0的時候一直在思考的事情。

其實,老闆忙的不是親手做事,而是處理一種叫“不確定”的情緒。他要的是"我交出去的事到底現在是什麼狀態、有沒有出岔子、出了岔子我能不能兜住"。這其實是掌控感、透明、可信任三個詞湊到一起的本質。

圖片

AI同事主動發現問題,解決問題,並及時反饋意見

Helio在Infra層面做的所有工作,都是為了給你這種安心感。

一個很直觀的例子:你的AI同事每做一個重要動作,它的思考過程、執行步驟、中間產物,都會像一篇“小作文”一樣實時發在羣裏。你不是面對一個黑盒,你是看着它一步一步把事做完的。這就叫透明。

Helio賣的從來不是AI能力,是把AI能力交出去這件事的安心感


🚥 十字路口

AI應用向具體場景延伸,Helio 會聚焦到垂直行業的工作場景嗎?


🧑🏻‍💻 王文鋒

不會。我們的產品主線只有一個:通過 Channel 獲取儘可能多的 Context,讓底層的 Coding 能力被最大程度地釋放。

所以,那些更廣泛的白領工作場景和能力,不是我們“想做的”,而是 Helio 獲得的上下文越來越多之後,自然而然長出來的結果,是被動獲得的。

這個過程就像河水漲潮——你不需要去推岸邊任何一塊石頭,只要水位一直在漲,那些石頭自然會被沒過去。

我們只負責一件事:讓上下文的水位越來越高。


🚥 十字路口

如果往前看3個月,用戶會看到Helio增加哪些新功能?


🧑🏻‍💻 王文鋒

那太多了,我們每天都在發版。不過有件事大家可以期待一下。

我前面提到,Helio解決的本質問題是“如何通過提高上下文的質量和數量降低人的決策成本”,而這件事我們有了一個非線性的答案

現在Helio所有大家看到的功能,都是為了這個東西服務的。不過目前它門檻還很高,只有精通Claude Code的那一小撮人才能用起來,我們內部還在打磨,想辦法降低門檻。

上週我給一個在騰訊、阿里做了很多年產品的朋友演示,他本身就是重度用戶。看完demo後他對我說:

這是他2023年以來看到過第二牛的東西,第一是模型本身
結語

真正的競爭才剛剛開始。


當Proactive Agent成為AI競爭的主場,到底是以Helio為代表的新一代產品能贏,還是在舊架構上做加法的巨頭能屹立不倒?


你怎麼看?


圖片


🚥

圖片


十字路口正在尋找獨立撰稿人,撰寫 AI 產品和模型評測。如果你寫過類似文章:《實測 PixVerse C1》、《實測 LibTV》,請聯繫 zeo0811@gmail.com ,郵件內容請包括:① 個人介紹、② 你寫過的 AI 評測文章。我們會提供有競爭力的稿酬。期待與你一起觀察與記錄 AI 時代 🎪