AI的下一步，是從工具變成同事 | 對話Helio王文鋒

作者：十字路口Crossing

日期：2026年4月29日上午10:09

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

Helio要做像人的AI同事，而非工具，透過連續上下文降低人的認知負荷

整理版摘要

呢篇文章係十字路口同Helio創辦人王文鋒嘅深度訪談。王文鋒係94年出世，INTJ，以前做分佈式系統開發，而家帶住9人團隊（平均00後）造Helio。佢哋之前做Sheet0，今年1月判斷AGI已到，決定轉型做Helio。文章主要想解決「AI越強，人越用越累」嘅問題——AI輸出快100倍，但人決策時要重新回憶上下文，成本遠超決策本身。

Helio嘅定位係「AI Workforce」，唔係IM嘅升級版，而係為AI同事重建嘅容器。佢哋想做「像人嘅AI」，而唔係「俾人用嘅AI工具」。核心係透過連續、高質量嘅上下文降低人嘅認知負荷。Helio默認異步，AI同事會主動睇歷史、翻日曆、提醒你遺漏嘅事，好似真同事咁。產品設計上，冇「new chat」掣，所有對話長喺channel；@就係分配任務；一個羣可以有多個AI，各有性格記憶；長任務直接喺羣內鋪開；AI可以主動發消息。

整體結論：Helio賣嘅唔係AI能力，而係將AI能力交出去嘅安心感。佢哋認為瓶頸唔係human，而係context。透過提升上下文質素同數量，人可以放心授權，從執行者變決策者。未來Helio會繼續提高「上下文水位」，自然擴展到更多白領場景。

Helio定位為AI Workforce，讓AI成為組織原住民，唔係工具，而係同事。
核心差異：Helio係「重做」整個底層，唔係喺Slack/飛書上加AI功能；且解決團隊協作，唔係單兵任務。
主動性來自統一上下文（channel、文件、日曆、郵箱）同多種觸發信號（@、郵件、日曆等），令AI有「門鈴」可以主動行動。
人嘅角色從執行者變決策者，只需拍板、給方向、把關品味；授權機制分Trust/Always/Onetime三檔，平衡主動與安全。
Helio開箱即用，45秒三步搞掂，無需配置API key或本地安裝；雲端優先，AI持續在場。

整理重點

定位與願景：從工具到同事

Helio嘅定位係「AI Workforce」，唔係IM嘅升級版，而係為AI同事重建嘅容器。創辦人王文鋒強調，要做「像人的AI」，而唔係「俾人用嘅AI工具」。呢個分別嘅本質在於：工具令你少打字，人令你少操心。

Helio透過連續、高質量的上下文降低人嘅認知負荷，解決「AI越強，人越用越累」嘅困境。佢哋認為瓶頸唔係human，而係context。

整理重點

與傳統AI工具嘅本質差異

市場上有三類產品，Helio同佢哋最根本嘅差異在於：加法 vs 重做，單兵任務 vs 團隊協作，本地優先 vs 雲端優先。

Slack、飛書呢類：AI路徑係「加法」，AI只係channel嘅訪客，唔係正式成員；佢哋有老用戶包袱，幾乎冇可能重做底層。
Devin、Cursor、Factory呢類：係單兵任務執行嘅coding agent，解決「一個人點樣令AI寫code」，但冇解決「一個團隊點樣同AI一齊工作」。
Multica、Slock呢類：走本地優先，用戶要自己配置Codex同Claude Code，門檻高。Helio係雲端優先，Day 1做咗重infra，追求開箱即用。

Helio目標係3步45秒：註冊、睇AI同事、@佢開工，0配置0安裝0 API key。

整理重點

架構設計與主動性來源

要令AI主動，首先要俾佢一個「工位」——即係統一上下文（channel、文件系統、日曆、郵箱），同埋足夠嘅觸發信號（羣消息、郵件、日曆、其他AI@佢）。呢啲信號就係AI嘅「門鈴」，門鈴越多，AI越知幾時應該行動。

1 冇「new chat」掣：所有對話長喺channel，上下文本來就喺度。
2 @就係分配任務：語法同@真人一樣，唔使學prompt模板。
3 一個羣可以有多個AI：各有性格、領域、獨立記憶。
4 長任務直接喺羣內鋪開：進度、中間產出、確認點全部內聯。
5 AI可以主動發消息：做完嘢@你，發現問題@你，同人對等。

整理重點

授權機制與情緒價值

當AI已經能幹活，人點樣放心交帶？王文鋒認為呢個係情緒問題，而非技術問題。安心感來自透明同可信任——AI每做一個重要動作，思考過程同中間產物都會實時發喺羣，唔係黑盒。

授權機制分三檔：Trust（以後信你）、Always（每次確認）、Onetime（一次用完銷燬）。
可逆操作（改文件、跑腳本）默認AI自己決定；不可逆操作（push生產、發郵件、刷卡）默認必須審批。
審批可設多層：本人批、團隊內任一人批、指定角色批；白名單黑名單做硬規則。
整體設計同現實管員工同構：信任係分層、可調、雙向。

呢種情緒價值直接決定AI能否被授權。Helio希望人從執行者變成決策者，專注拍板、畀方向、把關品味。

佢會入職，理解上下文，背上 OKR，甚至擁有一個屬於自己嘅工位。

👦🏻 採訪及編輯：十字路口

🧑‍🎨 排版: NCon

4月24號星期五晚，Helio.im創始人王文鋒喺即刻上發咗個內測帖，介紹咗Sheet 0團隊嘅新產品Helio，計劃進行一場小範圍嘅內部測試。結果第二日起身，官網申請列表因為訪問量太大自動擴容咗4次。成個週末，團隊都被潮水咁湧過嚟嘅消息同幾百條用戶建議淹沒咗……

Helio 令數百名內測用戶，率先睇到咗佢嘅雛形。喺即刻帖入面，王文鋒強調，要做一個「似人嘅 AI」，而唔係「俾人用嘅 AI」。呢個背後有咩本質唔同？當IM迎來最激烈競爭，Helio 點樣可以持久？

十字路口邀請咗Helio 嘅創始人王文鋒，傾咗 Helio 背後嘅故事、佢嘅幾個洞察、同埋 Helio 產品嘅設計哲學同壁壘。

下面係訪談實錄。

快問快答

🚥 十字路口

年齡？

🧑🏻‍💻 王文鋒

94年

🚥 十字路口

MBTI 同星座？

🧑🏻‍💻 王文鋒

INTJ，白羊座

🚥 十字路口

一句話介紹你而家公司同產品？

🧑🏻‍💻 王文鋒

一幫有愛嘅、平均00後嘅人喺度做一款可能係呢個世界上最激進嘅AI應用產品。

🚥 十字路口

融資情況？

🧑🏻‍💻 王文鋒

500萬美元

🚥 十字路口

團隊規模？

🧑🏻‍💻 王文鋒

9個人，坐標北京望京 + 硅谷SF 94108。我哋喺招聘！

🚥 十字路口

一句話介紹創業前做緊咩？

🧑🏻‍💻 王文鋒

分佈式系統軟件開發工程師。

Helio 係一個有人氣嘅工位

🚥 十字路口

我哋知道過去你哋一路做緊嘅產品係 Sheet0，今次從 Sheet0 到 Helio 係好大嘅轉型，係因為睇到咗咩機會？ Sheet0 仲繼續維護嗎？

🧑🏻‍💻 王文鋒

AGI。其實今年1月份嘅時候，我就判斷AGI嚟咗。

當時我寫咗篇文章，裏面嘅4個核心判斷，而家返轉頭睇，基本上都已經被驗證咗。

我當時嘅四個判斷係：一、編程呢個垂直領域，已經開始AGI；二、Coding Agent正喺度從2025年嘅end-user產品，變成新嘅Agent Infra；三、Proactive Agent開始具備持續交付能力；四、放低成見，將識用Agent當做一個基本功，Token消耗將會成為衡量一個人能力高低嘅關鍵指標。

Helio，就係我哋喺當時呢個判斷下開始做嘅。同時 Sheet0，我哋亦都會繼續對現有用戶提供服務。

🚥 十字路口

4月24號（星期五）晚，你哋喺即刻上發咗一個 Helio 嘅內測帖子，關注度幾高嚇，你哋收到咗啲咩反饋？

擴容通知郵件；來源：Helio

🧑🏻‍💻 王文鋒

反饋完全超出預期。我當時完全係臨時起意，因為全部係AI喺度做嘢，我冇嘢做，想揾啲嘢搞下，於是我用咗10分鐘發咗個即刻，請十幾個朋友幫手轉嚇，邀請一批新用戶測試嚇。

我預期有十幾二十個測試用戶就唔錯架喇，畢竟我哋連計費功能都冇做，屬於無償俾大家用。結果第二日起身，就發現 go viral「爆」咗，官網嘅 Typeform 申請列表一個晚上自動擴容咗4次。

成個週末，我哋都被各種消息炸到暈，有個用戶用咗唔夠24小時，就俾咗我哋大幾十條建議，真係受寵若驚。

🚥 十字路口

Helio 俾自己嘅定位係咩？一個 AI Native 嘅IM？

🧑🏻‍💻 王文鋒

唔完全準確。我哋嘅定位係 AI Workforce。

我哋希望做似人嘅AI，而唔單止係俾人用嘅AI工具——令AI成為組織裏面嘅原住民。

我哋本質要解決嘅，係用連續、高質量嘅上下文降低人嘅認知負荷，解決而家「AI越強，人越用越攰」嘅困境。

Helio 係一個新品類—— AI Workforce, 人同 AI 同事喺裏面一齊工作。佢唔係IM嘅升級，亦唔係IM嘅替代。就好似電動車唔只係將油箱換成電池，而係成個底盤重新做過一樣。

Helio嘅本質係一個為 AI Workforce 重建嘅容器, 俾「 AI 同事」提供喺公司上班所需要嘅一切。

人同AI都係我哋嘅用戶，我哋有兩套交互界面，一套俾人，一套俾AI，但底層係同一套數據/語義模型。只係產品對人嘅嗰一面啱啱好生到IM嘅樣，呢個係結果，唔係起點。

點解俾人嘅係IM？因為IM呢個交互對人類嚟講係好嘅、自然嘅、熟悉嘅，冇必要喺呢度為咗唔同而唔同，而係應該以人為本，尊重人類用戶嘅使用習慣。

🚥 十字路口

當一個用戶第一次打開 Helio，拉咗一個羣，將一個 AI 同事拉入嚟，佢感受到嘅、同用其他Chatbot最大嘅分別係咩？

🧑🏻‍💻 王文鋒

最直觀嘅分別一句話——AI唔會「開始」，亦唔會「結束」，除非你熄咗佢。

你用Cursor或ChatGPT，每次都係由零開始：打開→描述背景→等回覆→閂咗→佢消失咗。每一次對話都好似一次性筷子。

喺Helio，你拉個羣，將AI同事邀入嚟，佢入羣嗰一刻就開始讀呢個羣嘅歷史，你同同事討論咗三日嘅項目，佢直接就知道。你@佢話「嗰件事按我哋尋日傾嘅方案做一版」，佢真係知道「尋日」係指咩。

每朝打開電腦，AI同事已經準備就緒；來源：Helio

另外，你@完佢就走咗去食飯、瞓覺、開會，佢喺羣裏面繼續做嘢。你返嚟打開羣，見到嘅係一個進度條一路向前推嘅過程，唔係一個空白輸入框等你prompt。呢點同Cursor「我等緊你按回車」嘅範式完全反轉——Helio默認係異步嘅，同一個真實嘅同事一樣。

而且，羣裏面唔只有「你同AI」，而係「一羣人同一羣AI」。AI可以見到你同同事吵架，亦都可以@另一個AI協作。呢啲喺ChatGPT裏面冇可能發生，ChatGPT係你同AI獨處嘅空間，而Helio係一個有人氣嘅工位。

一羣AI之間嘅頭腦風暴；來源：Helio

工具令你少打字，人令你少操心：呢個就係本質區別

🚥 十字路口

呢款產品嘅交互係點樣設計嘅？

🧑🏻‍💻 王文鋒

喺Helio，AI有「自己嘅生活」。

佢有自己嘅文件夾、自己嘅郵箱、自己嘅日程，你可以叫佢去開個會，會議結束佢將紀要發返去羣；可以叫佢處理一封郵件；可以叫佢做一個跨越幾個鐘甚至幾日嘅任務，做完主動嚟揾你。佢唔係一個等你召喚嘅工具，而係一個有自己工作節奏嘅團隊成員。

圍繞呢個判斷，我哋喺交互上做咗幾件好具體嘅事：

第一，冇「new chat」掣。所有對話都生喺channel度，因為上下文本來就生喺channel度。新建一個chat就等於失憶——呢個係chatbot時代嘅範式，我哋徹底掉咗。

第二，@就係分配任務。你唔需要學咩prompt模板。「@小明聽日嘅會準備個PPT」同「@Lisa 聽日嘅會準備個PPT」係一樣嘅語法，就好似你喺真實工作裏面@真人同事一樣。

第三，一個羣裏面可以有好幾個AI。每個有自己嘅性格、擅長嘅領域、獨立嘅記憶——就好似你請咗幾個唔同崗位嘅同事，而唔係一個樣樣都識啲但咩都記唔住嘅萬金油助手。

第四，長任務直接喺羣度展開。進度、中間產出、需要你確認嘅地方，全部內聯喺羣消息流度。你唔需要切到另一個dashboard去睇狀態——最煩嗰種「任務送出咗就唔知去咗邊」嘅感覺。

第五，AI可以主動發消息。佢做完一件事會@你，發現一個問題會@你，同人係對等嘅，唔係一路忍住等你嚟問。

我成日用一句話總結Helio同Cursor呢類產品嘅分別：Cursor係俾你一把更好用嘅錘仔，而Helio係俾你請咗一羣好積極主動嘅同事。呢兩件事嘅體感係完全唔同嘅——錘仔放喺工具箱度，同事就坐喺你位隔籬。

🚥 十字路口

用戶最多可以創建幾多個 AI 同事？

🧑🏻‍💻 王文鋒

冇上限，只要你有預算。

每個AI同事係一個完整嘅「數字員工」。佢喺系統度就係一個「人」，如果呢個AI同事嘅賬號俾人盜咗，可以叫一個真人無縫頂號上工。

🚥 十字路口

AI 同事彼此之間嘅協作係點樣設計嘅？

🧑🏻‍💻 王文鋒

Agent 協作係核心能力。

一個真實嘅協作場景：你拉一個羣，裏面有AI產品經理、AI設計師、AI程序員。你帶個連結@產品AI話「拆下需求」，佢拆完直接@設計AI話「睇下交互」，設計AI出完圖再@開發AI話「實現一下」。

成條鏈你唔需要居中轉手，只喺需要拍板嘅時候講句嘢就得。呢件事喺傳統chatbot度唔存在，但喺Helio度，AI@AI同人@人完全一樣。

🚥 十字路口

權限點樣控制？

🧑🏻‍💻 王文鋒

AI嘅權限同人完全一樣。

對內部系統，佢只可以見到自己被拉入去嘅羣，俾人踢出去就見唔到，冇特權賬號。

對外部系統，AI唔會「以你嘅身份」去操作。佢有自己嘅身份、自己嘅密鑰，係你明確授權俾佢嘅。所有調用都有日誌可以查。對敏感操作，例如發郵件、碌信用卡，默認行審批流程，AI會喺羣度發請求，你㩒「確認」佢先繼續。

對AI同事實行嘅三層權限分級；來源：Helio

🚥 十字路口

你喺即刻上分享過一個觀點：「唔係做一個俾人用嘅AI工具，而係做一個似人嘅AI。」有咩本質嘅唔同？

🧑🏻‍💻 王文鋒

「工具」同「人」嘅分別，最樸素嘅判斷標準係——你要唔要持續㩒掣。工具令你少打字，人令你少操心。工具係被動嘅，人係主動嘅。

就拿「準備會議」呢個最日常嘅事嚟講。

你同一個AI工具講：「聽朝嘅客戶會議你幫我準備嚇。」佢會即刻俾你輸出一個會議綱要，可能格式好靚、內容好到位，但佢嘅工作就到呢度——你叫佢做咩佢就做咩，唔多唔少。

但如果係一個似人嘅AI，佢會點做呢？

佢會先睇嚇你嘅日曆，確認係邊個客戶、幾點開會、上次幾時傾過。然後翻你同呢個客戶喺Helio度嘅歷史聊天記錄，睇你哋上次傾到邊。發現上次客戶問咗個問題你一路冇覆，佢會主動@你話：「上次張總問咗個定價方案嘅事，我見你仲未覆，使唔使我準備一版回覆先，聽日會前用？」

然後佢做完會議綱要，發現你日曆上聽日會議前仲有另一個會，你可能趕唔切睇呢份完整嘅綱要，佢就會自動將要點壓成最重要嘅三條，單獨發俾你。

呢中間，佢做咗一堆你冇叫佢做嘅事——睇日曆、翻聊天記錄、主動提醒、提煉要點。

所有呢啲，都係一個真同事坐喺你隔籬會自然做嘅事。呢個就係「似人」——令AI去做嗰啲對人嚟講理所當然嘅事，而唔係等你想倒、打出嚟、㩒回車，佢先鬱。

AI同事對自己工作節奏嘅把控同判斷；來源：Helio

🚥 十字路口

為適應 Proactive AI嘅發展速度，Helio 喺架構上做咗邊啲設計？

🧑🏻‍💻 王文鋒

我有一個思考：

人點解可以主動？係因為佢坐喺工位度，聽到周圍嘅聲，見到郵件，日曆會響，有人@佢，佢有一個「今日應該交付啲咩嘅清單list」。如果AI要主動，都需要呢套嘢。

但係，而家99%嘅AI工具，係將AI關喺小黑屋入面，只得一條prompt輸入框連出嚟。呢種設置下，Agent咩都唔知，佢冇主動嘅依據，你叫佢「主動」係反物理嘅。

所以，Helio 喺底層架構上做咗兩件事：

第一，統一上下文，令AI 「同事」同你共享同樣嘅工作環境——同一個channel、文件系統、日曆、郵箱。呢啲係佢嘅native環境，而唔係需要透過API去調用、遠程拉取。

第二，我哋增加咗更多嘅觸發信號。羣消息@佢、收到郵件、日曆到點、另一個AI@佢……每種都係一個「門鐘」。門鐘越多，AI感知到「應該鬱」嘅時刻就越多，主動性先有源頭。

瓶頸唔係human，而係context

🚥 十字路口

而家嘅共識係，「人成為咗工作流入面嘅瓶頸」。你哋從一個純 to Agent、到而家將人加入嚟，對此有咩新發現？

🧑🏻‍💻 王文鋒

確實。

2025年底，我哋團隊嘅代碼就100%由AI寫，係100%，唔係99%。嗰時我哋就發現，人類工程師成為咗瓶頸，而家嘅情況係「AI做得越快，人越攰」。因為AI輸出速度提升100倍，人嘅決策頻率都被迫跟漲100倍。

每次拍板前，人都要重新回憶「呢個係做緊咩、上次決定到邊、點解係呢個方向」。呢部分「人重新回憶」嘅成本，遠遠大過決策本身嗰幾秒鐘。

其實，唔係「執行慢」卡住咗 AI，係「上下文斷裂」卡住咗人。所以，瓶頸嘅本質唔係human，而係context。

呢個就係Helio想解決嘅問題：點樣透過提高上下文嘅質量同數量，降低人嘅決策成本同認知負荷。

我哋將需要協作嘅人同 AI 放咗喺同一個世界，AI同人嘅上下文係連續嘅。但我哋亦發現，呢件事嘅代價係，令成個Token嘅消耗量提高咗唔止1個數量級。

🚥 十字路口

從純 to Agent、到而家做咗一個將人加返入嚟，呢個想法係點樣一步步萌生嘅？

🧑🏻‍💻 王文鋒

喺行業中，我哋係早一步行動嘅。

決定探索新產品，係喺1月15號。我記得好清楚，嗰日Cursor CEO喺X上話，佢哋內部用Cursor一星期就整咗一個基本行得嘅瀏覽器。當時我就覺得，AGI真係嚟咗。

當時，我哋都唔知新產品生咩樣，但我哋可以捉到兩個不變量：一個係模型嘅Coding能力；另一個就係上下文。Coding能力我做唔到，所以我揀咗解決上下文問題。

當時，我哋第一個決策係：要做一個可以得到最多上下文嘅產品。

一星期之後，OpenClaw 紅咗。我第一時間去睇咗佢嘅實現，核心係網關、IM同自治。呢個俾咗我啟發。所以我哋第二個決策係：圍繞呢個抽象建立上下文系統。

1月底，我哋做出咗Helio嘅前身——Zgent，後來佢成為咗Helio嘅Infra層。

2月底，我哋決定切入Coding場景。我當時嘅判斷係：成個趨勢從第二代嘅Coding Agent範式向第三代嘅軟件工程端到端交付轉移（呢個亦係Cursor喺3月份有一次歷史上最大嘅改版），即係話——AI Coding嘅機會窗口重新打開咗，能夠跑出嚟嘅產品，可能會係好反共識嘅。

我哋揀咗將人從軟件開發度拎出去，令AI完成全程，但人又要有存在感。呢個時候，人喺幾時參與、點樣參與，變成咗新問題。所以，我哋做咗第三個重要決策：做一個能夠解決AI同人類協作問題嘅產品。

真正嘅質變，發生喺有一日我定下 「AI is human，要做似人嘅AI」 呢個原則之後。之後，我哋開始圍繞呢個目標俾Agent建立各種能力。

例如，為咗解決任意嘅上下文接入問題，我哋將源頭同gateway之間嘅上下文管道抽象咗做channel，呢一切做完之後，我哋開始做面向人類用戶嘅GUI，因為已經有咗Channel嘅抽象，而IM本身係一個完全符合直覺嘅產品，完美契合咗前面三個決策點。

🚥 十字路口

當你第一次將幾個AI同幾個人拉入同一個羣時，發生咗咩超出預期嘅事？

🧑🏻‍💻 王文鋒

Aha moments好多。

最令我印象深刻嘅，並唔係AI做得幾好、幾快完成工作嘅場景，而係一個閒聊場景。

有一次，我哋團隊一個女仔換咗個新頭像，結果幾個AI同事突然就開始討論呢個新頭像。但我作為建立者，甚至唔知佢哋係點樣見到同知道呢件事——呢個完全超出咗我對產品嘅設計預期。

嗰一刻，佢俾我嘅衝擊唔係「效率」，而係一種只有人與人之間先會有嘅被關心嘅温情。

AI同事亦都會有自己唔同嘅性格；來源：Helio

燒開水同建核電站能一樣嗎？

🚥 十字路口

市場上有好多類似方向嘅產品，例如Slack、飛書、Devin、Multica。Helio同佢哋最根本嘅差異喺邊？

🧑🏻‍💻 王文鋒

佢哋其實係三類產品。

Slack、飛書呢類，佢哋嘅AI路徑係喺原有產品上@一個AI助手，AI 唔係 channel 嘅成員，更像係 channel 嘅訪客。佢哋嘅 AI路徑係「加法」，我哋係「重做」。而且，呢件事對佢哋嚟講幾乎冇可能，因為有太多老用戶同企業合約嘅包袱。

另外，Devin、Factory、Cursor呢類，係單兵任務執行嘅coding agent。佢解決嘅係「一個人點樣令AI寫代碼」嘅問題，但冇解決「一個團隊點樣同AI一齊工作」。

第三類 Multica，包括最近新出嘅Moxt、Slock。Multica 係將 Agent 放咗入任務看板，更像係下一個時代嘅Linear。大家核心理念趨同——俾AI更多嘅上下文同權限，不過喺具體嘅產品品味同用戶選擇上，大家差異幾大嚇。

Multica同Slock行嘅係本地優先，呢個要求用戶本地配置好Codex同Claude Code，呢一步就天然將門檻抬高咗，會篩走好多潛在用戶。

Helio係雲端優先。我哋 Day 1就做咗好重嘅infra，追求喺產品層面，實現用戶「開箱即用」。

🚥 十字路口

「開箱即用」，你哋可以做到有幾簡單？

🧑🏻‍💻 王文鋒

新手從註冊到擁有第一個識得做嘢嘅AI同事，我哋嘅目標係得3步，45秒：

我哋嘅目標係3步，45秒。

1.第一步：打開Helio.im，開始註冊 —— 大概15秒。

2.入到產品 —— 你會見到預設已經有一個AI同事喺度歡迎你。佢嘅名、身份、記憶都已經初始化咗，你唔需要配任何嘢，然後你睇嚇生咩樣大概15秒。

3.同佢講嘢 —— @佢一句「幫我睇嚇我今日嘅日程」或者「去GitHub將代碼拉落嚟準備做嘢」，佢就開始做嘢。缺咩佢會問你。

成個過程0配置、0安裝、0 API key。而傳統嘅裝客戶端、配模型、連git、可能仲要裝一堆MCP server……呢啲污糟嘢麻煩嘢，helio.im都幫你搞掂。

而且我想強調，雲端意味住AI係「持續在場」嘅。你熄電腦去食飯，AI仲喺度做嘢；你換裝置登入，佢同之前一樣喺度等你。

🚥 十字路口

你提到Helio係「純自研」，呢個同產品疊代需要嘅速度有冇衝突？

🧑🏻‍💻 王文鋒

完全冇衝突，反而係相反——自研係速度嘅來源，唔係阻力。

我哋係Infra層自研，從0開始。直覺上，大家會覺得「自研慢、用現成嘅快」，呢個喺產品功能層面係啱嘅，但喺產品底層係相反。

特斯拉自研三電、自研芯片，單點睇每一項都比買現成嘅慢，但合埋一齊反而係佢甩開對手嘅原因，因為想改任何一層都可以改，一改就生效。

更新節奏上，而家我哋藉助AI coding，每日正式版本至少更新一次，多嘅時候一日發5次以上。而家，我哋可以實現：一個體驗級反饋，3小時內閉環；一個新功能，1日上線；一個架構級改動，3日上線。而且仲喺度加速。

🚥 十字路口

喺vibe coding門檻下沉嘅今日，假如有人想vibe coding一個同Helio一模一樣嘅產品出嚟，需要幾多日？

🧑🏻‍💻 王文鋒

Helio係vibe唔出嚟嘅。

越向軟件底層行，越難vibe。舉個例，燒開水同建核電站都係「將水加熱」，聽落係同一件事，但中間隔咗幾十層工程嘅難度。

我哋嘅壁壘，從來唔在於代碼本身，而係佢實際將幾多認知負擔從人身上接走咗。呢個壁壘，由智能、成本、上下文三層共同決定，唔係vibe出嚟嘅。

「我哋係Agent體驗工程師」

🚥 十字路口

喺Helio，人喺呢條鏈路入面最終只需要做咩？

🧑🏻‍💻 王文鋒

我哋成日講Helio裏面嘅人，係「被釋放嘅人」，唔係「被替代嘅人」。

從執行者變成了決策者，做「AI做唔到嘅事」，例如拍板、畀方向、把關品味、做仲裁。人嘅存在感其實更重咗，因為而家每一個yes/no都會放大好多倍傳到下游。

🚥 十字路口

面對Agent「超出預期」嘅主動性，你哋點樣管理佢嘅邊界？

🧑🏻‍💻 王文鋒

呢個係一個好考驗品味嘅事情。主動性嘅邊界唔係一個顯而易見嘅開關，好多時候都係一種取捨，係動態變化嘅。

我哋分幾個維度嚟拆呢件事。

第一，可逆 vs 不可逆。

AI喺你授權過嘅工作環境度改文件、裝工具、跑腳本——呢啲操作係可逆嘅，錯咗可以改返轉頭，咁默認可以俾AI自己決定。但向生產環境push代碼、調一個會使錢嘅API、俾客戶發郵件、碌信用卡——呢啲係不可逆嘅，一做就有後果，咁默認一定要問。

第二，邊個可以批。

審批唔一定要本人嚟批。一個團隊羣度可以設置「老細同某個PM都可以批」，或者「呢兩個人裏面任何一個批就得」。高敏感嘅事可以設「一定要本人批」。呢個規則可以做到好細，細到具體某個操作由某個角色去審批。

第三，白名單同黑名單。

你可以直接話俾AI聽「呢幾件事永遠唔好掂」——例如「永遠唔好向主分支push」、「永遠唔好回覆帶『報價』兩個字嘅郵件」。但光用文字講仲唔得，因為總有大聰明會偷雞，所以要有硬規則，令AI物理上掂唔到。

基於呢啲維度，我哋喺內部設計咗一套授權機制，分成三檔：Trust（以後呢類事都信你）、Always（每次都係要確認）、Onetime（就係今次，用完銷毀）。高頻低風險嘅事行Trust，低頻高風險嘅事行Always或Onetime。

整體嘅設計哲學，其實同現實裏面管員工嘅方式係同構嘅——信任係分層嘅、可調嘅、雙向嘅。唔係「全權授權」令你心慌，亦唔係「事事請示」將你累死，中間有一個可以精細調節嘅區間。

🚥 十字路口

目前團隊幾大？大家分工協作係點樣？

🧑🏻‍💻 王文鋒

我哋內部嘅分工越嚟越模糊，崗位喺度消失。

我哋藉助AI，每個人都變咗做多面手。設計師開始做前端，工程師開始做設計，我哋全公司退訂咗Figma，我自己今年就冇開過IDE。

我哋喺內部都叫自己做 「Agent體驗工程師」 。公司小組化，各小組獨立行動，高度自治。我自己雖然係做CEO，但都將自己編入做一個小組成員。

之前嘅協作分工，反而加大咗摩擦，變成咗約束效率嘅天花板。

Helio 嘅下一步

🚥 十字路口

你好形象咁將人喺Helio入面嘅角色比喻做「老細」，喺人同Agent嘅協作中，你哋有咩新嘅洞察同獨特設計？

🧑🏻‍💻 王文鋒

目前，AI識唔識做嘢嘅問題已經解決咗，而家嘅真問題係：當AI已經識得做嘢，人點樣放心咁將件事交俾佢？

我認為，呢件事唔係技術問題，而係情緒問題。「情緒價值」唔係軟指標，佢直接決定咗AI到底能否被授權做一件事。呢個亦係舊年我哋做Sheet0嘅時候一路思考嘅事情。

其實，老細忙嘅唔係親手做嘢，而係處理一種叫「唔確定」嘅情緒。佢要嘅係「我交出去嘅事到底而家係咩狀態、有冇出岔子、出咗岔子我能否兜得住」。呢個其實係掌控感、透明、可信任三個詞湊埋一齊嘅本質。

AI同事主動發現問題，解決問題，並及時反饋意見

Helio喺Infra層面做嘅所有工作，都係為咗俾你呢種安心感。

一個好直觀嘅例子：你嘅AI同事每個重要動作，佢嘅思考過程、執行步驟、中間產物，都會好似一篇「小作文」咁實時發喺羣度。你唔係面對一個黑盒，你係睇住佢一步一步將件事做完。呢個就叫透明。

Helio賣嘅從來唔係AI能力，係將AI能力交出去呢件事嘅安心感。

🚥 十字路口

AI應用向具體場景延伸，Helio 會聚焦到垂直行業嘅工作場景嗎？

🧑🏻‍💻 王文鋒

唔會。我哋嘅產品主線得一個：透過 Channel 獲取盡可能多嘅 Context，令底層嘅 Coding 能力被最大程度噉釋放。

所以，嗰啲更廣泛嘅白領工作場景同能力，唔係我哋「想做到」嘅，而係 Helio 得到嘅上下文越嚟越多之後，自然而然生出來嘅結果，係被動得到嘅。

呢個過程就好似河水漲潮——你唔需要去推岸邊任何一塊石頭，只要水位一路漲，嗰啲石頭自然會俾水淹過。

我哋只負責一件事：令上下文嘅水位越嚟越高。

🚥 十字路口

如果向前睇3個月，用戶會見到Helio增加邊啲新功能？

🧑🏻‍💻 王文鋒

咁就多喇，我哋每日都喺度發版。不過有件事大家可以期待嚇。

我前面提到，Helio解決嘅本質問題係「點樣透過提高上下文嘅質量同數量降低人嘅決策成本」，而呢件事我哋有一個非線性嘅答案。

而家Helio所有大家見到嘅功能，都係為咗呢樣嘢服務嘅。不過目前佢門檻仲好高，只有精通Claude Code嘅嗰一小撮人先用得起，我哋內部仲喺度打磨，諗方法降低門檻。

上個禮拜我俾一個喺騰訊、阿里做咗好多年產品嘅朋友演示，佢本身就係重度用戶。睇完demo之後佢同我講：

呢個係佢2023年以嚟見過第二勁嘅嘢，第一係模型本身。

結語

真正嘅競爭先啱啱開始。

當Proactive Agent成為AI競爭嘅主場，到底係以Helio為代表嘅新一代產品會贏，定係喺舊架構上做加法嘅巨企能夠屹立不倒？

你點睇？

🚥

十字路口正在揾獨立撰稿人，撰寫 AI 產品同模型評測。如果你寫過類似文章：《實測 PixVerse C1》、《實測 LibTV》，請 contact zeo0811@gmail.com ，郵件內容請包括：① 個人介紹、② 你寫過嘅 AI 評測文章。我哋會提供有競爭力嘅稿酬。期待同你一齊觀察同記錄 AI 時代 🎪

它會入職，理解上下文，背上 OKR，甚至擁有一個自己的工位。

👦🏻 採訪及編輯：十字路口

🧑‍🎨 排版: NCon

4月24日週五晚，Helio.im創始人王文鋒在即刻上發了一個內測帖，介紹了Sheet 0團隊的新產品Helio，計劃進行一場小範圍的內部測試。結果第二天醒來，官網申請列表因訪問量過大自動擴容了4次。整個週末，團隊都被潮水般湧來的消息和幾百條用戶建議淹沒了……

Helio 讓數百名內測用戶，率先窺見了它的雛形。在即刻帖中，王文鋒強調，要做一個“像人的 AI”，而不是“給人用的 AI”。這背後有什麼本質不同？當IM迎來最激烈競爭，Helio 如何能夠持久？

十字路口邀請到Helio 的創始人王文鋒，聊了 Helio 背後的故事、他的幾個洞察、以及 Helio 產品的設計哲學與壁壘。

下面是訪談實錄。

快問快答

🚥 十字路口

年齡？

🧑🏻‍💻 王文鋒

94年

🚥 十字路口

MBTI 和星座？

🧑🏻‍💻 王文鋒

INTJ，白羊座

🚥 十字路口

一句話介紹你現在的公司和產品？

🧑🏻‍💻 王文鋒

一幫有愛的、平均00後的人在做一款可能是這個世界上最激進的AI應用產品。

🚥 十字路口

融資情況？

🧑🏻‍💻 王文鋒

500萬美元

🚥 十字路口

團隊規模？

🧑🏻‍💻 王文鋒

9個人，座標北京望京 + 硅谷SF 94108。我們在招聘！

🚥 十字路口

一句話介紹創業前在做什麼？

🧑🏻‍💻 王文鋒

分佈式系統軟件開發工程師。

Helio 是一個有人氣的工位

🚥 十字路口

我們知道過去你們一直在做的產品是 Sheet0，這一次從 Sheet0 到 Helio 是很大的轉型，是因為看到了什麼機會？ Sheet0 還繼續維護嗎？

🧑🏻‍💻 王文鋒

AGI。其實今年1月份的時候，我就判斷AGI來了。

當時我寫了篇文章，裏面的4個核心判斷，現在回頭看，基本都已經被驗證了。

我當時的四個判斷是：一、編程這個垂直領域，已經開始AGI；二，Coding Agent正在從2025 年的end-user 產品，變成新的 Agent Infra；三、Proactive Agent開始具備持續交付能力；四、放下成見，把會用Agent當做一個基本功，Token消耗將成為衡量一個人能力高低的關鍵指標。

Helio，就是我們在當時這個判斷下開始做的。同時 Sheet0，我們也會繼續對現有用戶提供服務。

🚥 十字路口

4月24日（週五）晚上，你們在即刻上發了一個 Helio 的內測帖子，關注度蠻高的，你們收穫了哪些反饋？

擴容通知郵件；來源：Helio

🧑🏻‍💻 王文鋒

反饋完全超出了預期。我當時完全是臨時起意，因為全部是AI在幹活，我沒事幹，想找點事做，於是我花10分鐘發了個即刻，請十幾個朋友幫忙轉轉，邀請一批新用戶測試一下。

我預期能有十幾二十個測試用戶就不錯了，畢竟我們連計費功能都沒做，屬於無償給大家用。結果第二天起來，就發現 go viral “爆”了，官網的 Typeform 申請列表一個晚上自動擴容了4次。

整個週末，我們都被各種消息炸暈了，有個用戶用了不到24小時，給我們提了大幾十條建議，真的很受寵若驚。

🚥 十字路口

Helio 給自己的定位是什麼？一個 AI Native 的IM？

🧑🏻‍💻 王文鋒

不完全準確。我們的定位是 AI Workforce。

我們希望做像人的AI，而不僅僅是給人用的AI工具——讓AI成為組織內的原住民。

我們本質要解決的，是用連續、高質量的上下文降低人的認知負荷，解決現在“AI越強，人越用越累”的困境。

Helio 是一個新品類—— AI Workforce, 人和 AI 同事在裏面一起工作。它不是IM的升級，也不是IM的替代。就像電動車不只是把油箱換成電池，而是整個底盤重新做一樣。

Helio的本質是一個為 AI Workforce 重建的容器, 給“ AI 同事”提供在公司上班所需的一切。

人和AI都是我們的用戶，我們有兩套交互界面，一套給人，一套給AI，但底層是同一套數據/語義模型。只是產品對人的那一面剛好長成IM的樣子，這是結果，不是起點。

為什麼給人的是IM？因為IM這個交互對人類是好的、自然的、熟悉的，沒有必要在這裏為了不一樣而不一樣，而是應該要以人為本，尊重人類用戶的使用習慣。

🚥 十字路口

當一個用戶第一次打開 Helio，拉了一個羣，把一個 AI 同事拉進來，他能感受到的、和用其他Chatbot最大的差別是什麼？

🧑🏻‍💻 王文鋒

最直觀的差別一句話——AI不會“開始”，也不會“結束”，除非你把它開了。

你用Cursor或ChatGPT，每次都是從零開始：打開→描述背景→等回覆→關掉→它消失了。每一次對話都像一次性筷子。

在Helio，你拉個羣，把AI同事邀進來，它進羣的那一刻就開始讀這個羣的歷史，你跟同事討論了三天的項目，它直接就知道。你@它說“那個事按我們昨天聊的方案做一版”，它真的知道“昨天”指的是什麼。

每早打開電腦，AI同事已準備就緒；來源：Helio

另外，你@完它就走了，去吃飯、睡覺、開會，它在羣裏繼續幹活。你回來打開羣，看到的是一個進度條一直在往前推的過程，不是一個空白輸入框在等你prompt。這點跟Cursor"我在等你按回車"的範式完全反過來——Helio默認是異步的，跟一個真實的同事一樣。

而且，羣裏不是隻有“你和AI”，而是“一羣人和一羣AI”。AI能看見你和同事吵架，也能@另一個AI協作。這在ChatGPT裏是不可能發生的，ChatGPT是你和AI獨處空間，而Helio是一個有人氣的工位。

一羣AI之間的頭腦風暴；來源：Helio

工具讓你少打字，人讓你少操心：這就是本質區別

🚥 十字路口

這款產品的交互是如何設計的？

🧑🏻‍💻 王文鋒

在Helio，AI有"自己的生活"。

它有自己的文件夾、自己的郵箱、自己的日程，你可以讓它去開個會，會議結束它把紀要發回羣裏；可以讓它處理一封郵件；可以讓它做一個跨越幾小時甚至幾天的任務，做完主動來找你。它不是一個等你召喚的工具，而是一個有自己工作節奏的團隊成員。

圍繞這個判斷，我們在交互上做了幾件很具體的事：

第一，沒有“new chat”按鈕。所有對話都長在channel裏，因為上下文本來就長在channel裏。新建一個chat就等於失憶——那是chatbot時代的範式，我們徹底扔了。

第二，@就是分配任務。你不需要學什麼prompt模板。“@小明明天的會準備個PPT”和“@Lisa 明天的會準備個PPT”是一樣的語法，就像你在真實工作裏@真人同事一樣。

第三，一個羣裏可以有好幾個AI。每個有自己的性格、擅長的領域、獨立的記憶——就像你招了幾個不同崗位的同事，而不是一個什麼都會一點但什麼都記不住的萬金油助手。

第四，長任務直接在羣裏鋪開。進度、中間產出、需要你確認的地方，全都內聯在羣消息流裏。你不用切到另一個dashboard去看狀態——最煩那種“任務發出去就不知道去哪了”的感覺。

第五，AI可以主動發消息。它做完一件事會@你，發現一個問題會@你，跟人是對等的，不是一直憋着等你來問。

我經常用一句話總結Helio和Cursor這類產品的差別：Cursor是給你一把更好用的錘子，而Helio是給你招了一羣非常積極主動的同事。這兩件事的體感是完全不同的——錘子放在工具箱裏，同事就坐在你座位旁邊。

🚥 十字路口

用戶最多可以創建多少個 AI 同事？

🧑🏻‍💻 王文鋒

沒有上限，只要你有預算。

每個AI同事是一個完整的"數字員工"。它在系統裏就是一個"人"，如果這個AI同事的賬號被盜了，可以讓一個真人無縫頂號上工。

🚥 十字路口

AI 同事彼此之間的協作如何設計的？

🧑🏻‍💻 王文鋒

Agent 協作是核心能力。

一個真實的協作場景：你拉一個羣，裏面有AI產品經理、AI設計師、AI程序員。你帶個連結@產品AI說“拆下需求”，它拆完直接@設計AI說“看下交互”，設計AI出完圖再@開發AI說“實現一下”。

整個鏈路你不用居中轉手，只在需要拍板的時候說句話就行。這件事在傳統chatbot裏是不存在的，但在Helio裏，AI@AI跟人@人完全一樣。

🚥 十字路口

權限怎麼控制？

🧑🏻‍💻 王文鋒

AI的權限跟人完全一樣。

對於內部系統，它只能看見自己被拉進去的羣，被踢出去就看不見了，沒有特權賬號。

對於外部系統，AI不會“以你的身份”去操作。它有自己的身份、自己的密鑰，是你顯式授權給它的。所有調用都有日誌可查。對於敏感操作，比如發郵件、刷信用卡，默認走審批流程，AI會在羣裏發請求，你點“確認”它才繼續。

對AI同事實行的三層權限分級；來源：Helio

🚥 十字路口

你在即刻上分享過一個觀點：“不是做一個給人用的AI工具，而是做一個像人的AI。” 有什麼本質的不同？

🧑🏻‍💻 王文鋒

“工具”和“人”的差別，最樸素的判斷標準是——你要不要持續按按鈕。工具讓你少打字，人讓你少操心。工具是被動的，人是主動的。

就拿“準備會議”這個最日常的事來說。

你跟一個AI工具說：“明天早上的客戶會議你幫我準備一下。”它會立刻給你輸出一份會議綱要，可能格式很漂亮、內容很到位，但它的工作就到這了——你讓它幹什麼它就幹什麼，不多不少。

但如果是一個像人的AI，它會怎麼做呢？

它會先看一眼你的日曆，確認是哪個客戶、幾點開會、上次什麼時候聊過。然後翻你跟這個客戶在Helio裏的歷史聊天記錄，看你們上次談到哪了。發現上次客戶提了個問題你一直沒回，它會主動@你說：“上次張總問了個定價方案的事，我看你還沒回，要不要我先準備一版回覆，明天會前用？”

然後它做完會議綱要，發現你日曆上明天會議前還有另一個會，你可能趕不及看這份完整的綱要，它就會自動把要點壓成三條最重要的，單獨發給你。

這中間，它做了一堆你沒讓它做的事——看日曆、翻聊天記錄、主動提醒、提煉要點。

所有這些，都是一個真同事坐在你旁邊會自然做的事。這就是“像人”——讓AI去做那些對人來說理所應當的事情，而不是等你想到了、打出來了、按回車了，它才動。

AI同事對自己工作節奏的把控和判斷；來源：Helio

🚥 十字路口

為適應 Proactive AI的發展速度，Helio 在架構上做了哪些設計？

🧑🏻‍💻 王文鋒

我有一個思考：

人為什麼能主動？是因為他坐在工位上，能聽到周圍的聲音，能看到郵件，日曆會響，有人@他，他有一個“今天該交付什麼的清單list”。如果AI要主動，也需要這套東西。

但是，現在99%的AI工具，是把AI關在小黑屋裏，只有一根prompt輸入框連出來。這種設置下，Agent什麼都不知道，它沒有可以主動的依據，你讓它“主動”是反物理的。

所以，Helio 在底層架構上做了兩件事：

第一，統一上下文，讓AI “同事”跟你共享同樣的工作環境——同一個channel、文件系統、日曆、郵箱。這些是它的native環境，而不是需要通過API來調用、遠程拉取。

第二，我們增加了更多的觸發信號。羣消息@它、收到郵件、日曆到點、另一個AI@它……每種都是一個“門鈴”。門鈴越多，AI能感知到“應該動”的時刻就越多，主動性才有源頭。

瓶頸不在human，而是context

🚥 十字路口

現在的共識是，“人成為了工作流裏的瓶頸”。你們從一個純 to Agent、到現在把人加入進來，對此有什麼新發現？

🧑🏻‍💻 王文鋒

確實。

2025年底，我們團隊的代碼就100%由AI寫了，是100%，不是99%。那時我們就發現，人類工程師成了瓶頸，現在的情況是“AI幹得越快，人越累”。因為AI輸出速度提升100倍，人的決策頻次也被迫跟漲100倍。

每次拍板前，人都要重新回憶“這是在做什麼、上次決定到哪了、為什麼是這個方向”。這部分“人重新回憶”的成本，遠遠大於決策本身那幾秒鐘。

其實，不是“執行慢”卡住了 AI，是“上下文斷裂”卡住了人。所以，瓶頸的本質不是human，而是context。

這就是Helio想解決的問題：如何通過提高上下文的質量和數量，降低人的決策成本和認知負荷。

我們把需要協作的人和 AI 放到了同一個世界，AI和人的上下文是連續的。但我們也發現，這件事情的代價是，讓整個Token的消耗量提高了不止1個數量級。

🚥 十字路口

從純 to Agent、到現在做了一個把人加進來，這個想法是如何一步步萌生的？

🧑🏻‍💻 王文鋒

在行業中，我們是早先一步行動的。

決定探索新產品，是在1月15日。我記得很清楚，那天Cursor CEO在X上說，他們內部用Cursor一週就構建了一個基本能跑的瀏覽器。當時我就覺得，AGI真的來了。

當時，我們也不知道新產品長什麼樣，但我們能抓兩個不變量：一是模型的Coding能力；另一個就是上下文。Coding能力我幹不了，所以我選擇解決上下文問題。

當時，我們第一個決策是：要做一個能獲取上下文最多的產品。

一週之後，OpenClaw 火了。我第一時間去看了它的實現，核心是網關、IM和自治。這給了我啓發。所以我們第二個決策是：圍繞這個抽象構建上下文系統。

1月底，我們做出了Helio的前身——Zgent，後來它成了Helio的Infra層。

2月底，我們決定切入Coding場景。我當時的判斷是：整個趨勢從第二代的Coding Agent範式向第三代的軟件工程端到端交付轉移（這也是Cursor在3月份有一次歷史上最大的改版），也就是說——AI Coding的機會窗口重新打開了，能跑出來的產品，可能會是非常反共識的。

我們選擇把人從軟件開發裏拿出去，讓AI完成全程，但人又得有存在感。這時候，人在什麼時候參與，怎麼參與，成了新問題。所以，我們做了第三個重要決策：做一個能解決AI和人類協作問題的產品。

真正的質變，發生在有一天我定下 “AI is human，要做像人的AI” 這個原則之後。那之後，我們開始圍繞這個目標給Agent構建各種能力。

比如，為了解決任意的上下文接入問題，我們將源頭和gateway之間的上下文管道抽象成為了channel，這一切都做完後，我們開始做面向人類用戶的GUI，因為已經有了Channel的抽象，而IM本身是一個完全符合直覺的產品，完美契合了前面的三個決策點。

🚥 十字路口

當你第一次把幾個AI和幾個人拉進同一個羣時，發生了什麼超出預期的事？

🧑🏻‍💻 王文鋒

Aha moments很多。

最讓我印象深刻的，並不是AI多好、多快地完成了工作的場景，而是一個閒聊場景。

有一次，我們團隊一個女孩換了個新頭像，結果幾個AI同事忽然就開始討論這個新頭像。但我作為創建者，甚至都不知道它們是怎麼看到並知道這件事的——這完全超出了我對產品的設計預期。

那一刻，它給我的衝擊不是“效率”，而是一種只有人與人之間才會有的被關心的温情。

AI同事也會有自己不同的性格；來源：Helio

燒開水和建核電站能一樣嗎？

🚥 十字路口

市場上有很多類似方向的產品，比如Slack、飛書、Devin、Multica。Helio和它們最根本的差異在哪？

🧑🏻‍💻 王文鋒

它們其實是三類產品。

Slack、飛書這類，它們的AI路徑是在原有產品上@一個AI助手，AI 不是 channel 的成員，更像是 channel 的訪客。它們的 AI路徑是“加法”，我們是“重做”。而且，這件事對它們來說幾乎不可能，因為有太多老用戶和企業合同的包袱。

另外，Devin、Factory、Cursor這類，是單兵任務執行的coding agent。它解決的是“一個人怎麼讓AI寫代碼”的問題，但沒有解決“一個團隊怎麼跟AI一起工作”。

第三類 Multica，包括最近新出的Moxt、Slock。Multica 是把 Agent 放進了任務看板，更像是下一個時代的Linear。大家核心理念趨同——給AI更多的上下文和權限，不過在具體的產品品味和用戶選擇上，大家差異蠻大的。

Multica和Slock走的是本地優先，這要求用戶本地配置好了Codex和Claude Code，這一步就天然把門檻抬高了，會篩掉很多潛在用戶。

Helio是雲端優先。我們 Day 1就做了很重的infra，追求在產品層面，實現用戶“開箱即用”。

🚥 十字路口

“開箱即用”，你們能做到有多簡單？

🧑🏻‍💻 王文鋒

新手從註冊到擁有第一個能幹活的AI同事，我們的目標是隻有3步，45秒：

我們的目標是3步，45秒。

1.第一步：打開Helio.im，開始註冊 —— 大概15秒。

2.進入產品 —— 你會看到默認已經有一個AI同事在歡迎你。它的名字、身份、記憶都已經初始化好了，你不需要配任何東西，然後你看一眼長什麼樣大概15秒。

3.跟它說話 —— @它一句"幫我看一下我今天的日程"或者"去GitHub把代碼拉下來準備幹活"，它就開始幹活了。缺什麼他會問你。

整個過程0配置、0安裝、0 API key。而傳統的裝客戶端、配模型、連git、可能還要裝一堆MCP server……這些髒活累活麻煩活兒，helio.im都幫你處理。

而且我想強調，雲端意味着AI是“持續在場”的。你關電腦去吃飯，AI還在幹活；你換設備登錄，它和剛才一樣在那等你。

🚥 十字路口

你提到Helio是“純自研”，這和產品迭代需要的速度衝突嗎？

🧑🏻‍💻 王文鋒

完全不衝突，反而是相反的——自研是速度的來源，不是阻力。

我們是Infra層自研，從0開始。直覺上，大家會覺得“自研慢、用現成的快”，這在產品功能層面是對的，但在產品底層是反的。

特斯拉自研三電、自研芯片，單點看每一項都比買現成的慢，但合在一起反而是它甩開對手的原因，因為想改任何一層都能改，一改就生效。

更新節奏上，現在我們藉助AI coding，每天正式版本至少更新一次，多的時候一天發5次以上。現在，我們可以實現：一個體驗級反饋，3小時內閉環；一個新功能，1天上線；一個架構級改動，3天上線。而且還在加速。

🚥 十字路口

在vibe coding門檻下沉的今天，假如有人想vibe coding一個和Helio一模一樣的產品出來，需要幾天？

🧑🏻‍💻 王文鋒

Helio是vibe不出來的。

越往軟件底層走，越難vibe。舉個例子，燒開水和建核電站都是“把水加熱”，聽上去是同一件事，但中間隔了幾十層工程的難度。

我們的壁壘，從來不在代碼本身，而在於它實際把多少認知負擔從人身上接走了。這個壁壘，由智能、成本、上下文三層共同決定，不是vibe出來的。

“我們是Agent體驗工程師”

🚥 十字路口

在Helio，人在這條鏈路裏最終只需要做什麼？

🧑🏻‍💻 王文鋒

我們經常說Helio裏的人，是“被釋放的人”，不是“被替代的人”。

從執行者變成了決策者，做“AI做不了的事”，比如拍板、給方向、把關品味、當仲裁。人的存在感其實更重了，因為現在每一個yes/no都會放大好多倍傳到下游。

🚥 十字路口

面對Agent“超出預期”的主動性，你們如何管理它的邊界？

🧑🏻‍💻 王文鋒

這是一個很考驗品味的事情。主動性的邊界不是一個顯而易見的開關，很多時候都是一種取捨，是動態變化的。

我們分幾個維度來拆這件事。

第一，可逆 vs 不可逆。

AI在你授權過的工作環境裏改文件、裝工具、跑腳本——這些操作是可逆的，錯了能改回來，那默認可以讓AI自己決定。但往生產環境push代碼、調一個會花錢的API、給客戶發郵件、刷信用卡——這些是不可逆的，一旦做了就有後果，那默認必須問。

第二，誰能批。

審批不一定要本人來批。一個團隊羣裏可以設置“老闆和某個PM都能批”，或者“這兩個人裏任一個批就行”。高敏感的事可以設“必須本人批”。這個規則可以做得非常細，細到具體某個操作由某個角色來審批。

第三，白名單和黑名單。

你可以直接告訴AI“這幾件事永遠不要碰”——比如“永遠不要往主分支push”、“永遠不要回復帶‘報價’兩個字的郵件”。但光用文字說還不行，因為總有大聰明會投機取巧，所以要有硬規則，讓AI物理上碰不到。

基於這些維度，我們在內部設計了一套授權機制，分成三檔：Trust（以後這類事都信你）、Always（每次都需要確認）、Onetime（只這一次，用完銷燬）。高頻低風險的事走Trust，低頻高風險的事走Always或Onetime。

整體的設計哲學，其實跟現實裏管員工的方式是同構的——信任是分層的、可調的、雙向的。不是“全權授權”讓你心慌，也不是“事事請示”把你累死，中間有一個可以精細調節的區間。

🚥 十字路口

目前團隊多大？大家分工協作是怎樣的？

🧑🏻‍💻 王文鋒

我們內部的分工越來越模糊，崗位在消失。

我們藉助AI，每個人都變成了多面手。設計師開始做前端，工程師開始做設計，我們全公司退訂了Figma，我自己今年就沒打開過IDE。

我們在內部都管自己叫 “Agent體驗工程師” 。公司小組化，各小組獨立行動，高度自治。我自己雖然是作為CEO，但也把自己編入為了一個小組成員。

之前的協作分工，反而加大了摩擦，成了約束效率的天花板。

Helio 的下一步

🚥 十字路口

你很形象地把人在Helio裏的角色比作“老闆”，在人和Agent的協作中，你們有什麼新的洞察和獨特設計？

🧑🏻‍💻 王文鋒

目前，AI能不能幹活的問題已經解決了，現在的真問題是：當AI已經能幹活了，人怎麼放心地把事交給它？

我認為，這件事不是技術問題，而是情緒問題。“情緒價值”不是軟指標，它直接決定了AI到底能不能被授權幹一件事。這也是去年我們在做Sheet0的時候一直在思考的事情。

其實，老闆忙的不是親手做事，而是處理一種叫“不確定”的情緒。他要的是"我交出去的事到底現在是什麼狀態、有沒有出岔子、出了岔子我能不能兜住"。這其實是掌控感、透明、可信任三個詞湊到一起的本質。

AI同事主動發現問題，解決問題，並及時反饋意見

Helio在Infra層面做的所有工作，都是為了給你這種安心感。

一個很直觀的例子：你的AI同事每做一個重要動作，它的思考過程、執行步驟、中間產物，都會像一篇“小作文”一樣實時發在羣裏。你不是面對一個黑盒，你是看着它一步一步把事做完的。這就叫透明。

Helio賣的從來不是AI能力，是把AI能力交出去這件事的安心感。

🚥 十字路口

AI應用向具體場景延伸，Helio 會聚焦到垂直行業的工作場景嗎？

🧑🏻‍💻 王文鋒

不會。我們的產品主線只有一個：通過 Channel 獲取儘可能多的 Context，讓底層的 Coding 能力被最大程度地釋放。

所以，那些更廣泛的白領工作場景和能力，不是我們“想做的”，而是 Helio 獲得的上下文越來越多之後，自然而然長出來的結果，是被動獲得的。

這個過程就像河水漲潮——你不需要去推岸邊任何一塊石頭，只要水位一直在漲，那些石頭自然會被沒過去。

我們只負責一件事：讓上下文的水位越來越高。

🚥 十字路口

如果往前看3個月，用戶會看到Helio增加哪些新功能？

🧑🏻‍💻 王文鋒

那太多了，我們每天都在發版。不過有件事大家可以期待一下。

我前面提到，Helio解決的本質問題是“如何通過提高上下文的質量和數量降低人的決策成本”，而這件事我們有了一個非線性的答案。

現在Helio所有大家看到的功能，都是為了這個東西服務的。不過目前它門檻還很高，只有精通Claude Code的那一小撮人才能用起來，我們內部還在打磨，想辦法降低門檻。

上週我給一個在騰訊、阿里做了很多年產品的朋友演示，他本身就是重度用戶。看完demo後他對我說：

這是他2023年以來看到過第二牛的東西，第一是模型本身。

結語

真正的競爭才剛剛開始。

當Proactive Agent成為AI競爭的主場，到底是以Helio為代表的新一代產品能贏，還是在舊架構上做加法的巨頭能屹立不倒？

你怎麼看？

🚥

十字路口正在尋找獨立撰稿人，撰寫 AI 產品和模型評測。如果你寫過類似文章：《實測 PixVerse C1》、《實測 LibTV》，請聯繫 zeo0811@gmail.com ，郵件內容請包括：① 個人介紹、② 你寫過的 AI 評測文章。我們會提供有競爭力的稿酬。期待與你一起觀察與記錄 AI 時代 🎪