這個封裝了我3年自媒體經驗的AI熱點網站,今天向所有人免費開放。

作者:數字生命卡茲克
日期:2026年5月7日 上午2:09
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

作者公開咗自己用嚟監控AI熱點嘅網站,背後係三年自媒體經驗同11版評分策略嘅迭代。

整理版摘要

呢篇文章係由自媒體創作者卡茲克寫嘅,佢本身做咗差唔多十年用戶體驗設計,後嚟全職做AI相關嘅內容創作。佢發現喺資訊爆炸嘅時代,最困擾嘅唔係執行,而係點樣從海量資訊入面揀出值得睇嘅嘢。為咗保護自己嘅創作精力,佢自己整咗一個叫AIHOT嘅網站,用嚟監控AI相關資訊,仲用自己設計嘅精選機制幫手篩選。原本呢個網站係閉門自用嘅,但係佢最後決定開放俾所有人免費使用,原因係佢想為互聯網貢獻一啲自己嘅嘢,同埋享受有人用佢產品嘅成就感。

網站嘅核心係一套精選系統,由168個經過人手挑選嘅信源出發,每日大概有幾百條資訊入庫。作者用咗DeepSeek V3.2做預篩,篩走同AI無關嘅內容,再用DeepSeek V4 Pro打五個維度分,最後由代碼根據信源權重同公式計出最終質量分,決定係咪值得精選。成個過程迭代咗11版,初期靠大模型一條龍打分嘅做法搞到一塌糊塗,後來佢醒起自己寫過「能用腳本就別用Agent」,於是推倒重來,將所有能用代碼處理嘅邏輯抽返出嚟,先至做到而家穩定可控嘅結果。

總括嚟講,作者嘅結論係:處理資訊海嘅關鍵係先篩信源,再用掂當嘅流程分拆任務,唔好迷信大模型可以一手包辦。佢分享咗自己喺信源分級、評分機制、事件聚類、AI日報等各方面嘅設計取捨,仲提醒讀者要保護自己嘅注意力。文章最後佢呼籲大家去試用網站,並歡迎俾反饋。

  • 作者公開咗佢自己做嘅AI熱點監控網站AIHOT,免費俾所有人用,背後係三年自媒體經驗同11版評分策略迭代。
  • 網站精選168個信源,分T1/T1.5/T2三級,優先採用一手官方資訊,避免二手消息。
  • 評分機制初期用大模型一條龍打分,結果亂曬龍;後來改為只用模型打五維分,其餘用代碼公式計最終分,先至穩定可控。
  • 事件聚類系統用embedding將同一事件嘅多篇報道摺疊,揀最權威嘅做主條,避免重複。
  • AI日報每日早上自動整合過去24小時精選,分五個版塊,唔使大模型生成,只需從已處理數據拎出嚟排序。
整理重點

點解要開放呢個網站

作者卡茲克本身係一位AI自媒體創作者,佢話呢個網站原本係公司內部用嚟監控AI熱點嘅工具,目的係保護自己嘅創作精力。但係佢有產品夢,見到有人用自己嘅產品係最大嘅成就感來源,所以最後決定免費開放俾所有人。

謝謝你看我的文章。」呢句說話嚟自電影《頭號玩家》,係佢每次文章結尾都會寫嘅嘢,代表佢想自己創造嘅嘢被人看見同喜歡。

佢強調呢個網站域名係用公司域名,所以有啲難記,但係網址係 https://aihot.virxact.com/。

整理重點

AIHOT嘅核心功能

AIHOT嘅作用係幫人用乾淨嘅時間線監控全球AI資訊,再將值得關注嘅嘢精選出嚟。作者認為而家嘅工作唔再係執行,而係資訊處理,分三步:獲取資訊 → 分析資訊 → 基於資訊做決策。而AIHOT主要解決第一步。

  1. 1 T1OpenAI官方BlogAnthropic工程Blog、Sam Altman個人Blog、CMU Blog等。
  2. 2 T1.5OpenAI官方X等,因為發文更雜,權重低啲。
  3. 3 T2:其他大佬個人號、KOL、媒體、綜合資訊站。
整理重點

開發過程嘅教訓:唔好咩都交俾大模型

初期作者以為寫個Prompt俾大模型打分就得,結果問題多多:硬核論文成日高分但根本冇人睇得明;Sam Altman轉發雞湯文居然都有87分;同一事件被報導多次就全部入精選。佢不斷加規則,Prompt加到300行,仲引入人類反饋同自動評估,點知越搞越差。

能用腳本就別用Agent」呢句佢自己寫過嘅話,最後令佢推倒重來。

重構之後,大模型淨係負責打五個維度分,其餘嘅權重計算、精選判斷、事件聚類全部用代碼搞。Prompt由600行減到200行,分數由DeepSeek V4 Pro打,公式由佢用代碼寫,再用量化回測調整閾值。

用代碼管控嘅好處係極度可控、可調,改條公式或者閾值幾秒就搞掂。

整理重點

其他得意功能:事件聚類同AI日報

為咗避免同一事件出現七八次,佢用embedding將語義相近嘅條目聚類,揀最權威嘅做主條,其他摺疊。官方源優先,官網>官方X>KOL

AI日報每日早上8點自動生成,分五個版塊:模型發佈/更新、產品發佈/更新、行業動態、論文研究、技巧與觀點。

呢個日報唔使大模型再生成,因為精選、分類、翻譯喺入庫時已經做曬,日報只需要按類型分桶再按分數排序,1秒就出到。

整理重點

未來計劃同開放態度

作者話未來會繼續開發,包括趨勢預測、關聯資訊檢索、AIHOT熱度指數等,但呢啲功能可能只開放俾公司同事同MCN簽約博主。佢盡量平衡,希望更多人可以用到。

任何建議或反饋都可以喺網站留言,會直接推送到佢飛書,佢話一定會第一時間睇。

最後佢再次多謝讀者同用家,網址係 https://aihot.virxact.com/。

今日,我決定將我自己整嘅、用嚟幫我監控AI熱點、輔助揾選題嘅網站,免費開放畀所有人。
佢幾乎裝咗我做咗三年AI自媒體嘅獲取資訊經驗。
我將佢叫做AIHOT。
好多朋友可能喺我之前好多篇文章入面,都見過佢嘅身影。
圖片
呢個嘢嘅作用其實好簡單,一句說話就講得清:
幫你以乾淨嘅時間線形式,監控呢個世界上同AI有關嘅資訊,然後用我自己對內容挑選嘅策略,將值得你留意嘅嘢揀出嚟,對資訊海進行降維,從而保護我哋有限嘅注意力。
呢個嘢本身其實係畀我哋公司內部用嘅,創造佢嘅目的,其實就係為咗保護我自己嘅創作精力,我一開始真係冇打算將佢開放畀所有人。
因為對於一個自媒體嚟講,資訊獲取嘅及時性,有時就係命根。
但,可能係產品心理作怪啦,我做咗咁多年嘢,一路喺度設計產品,一路做產品,做咗好多好多年。
我仲係有產品夢嘅,我仲係想為呢個美好嘅互聯網貢獻返少少自己嘅嘢,而我好多時候最大嘅成就感來源,其實就係大家鍾意睇我嘅文章,鍾意用我做嘅產品。
我喺每次文章嘅底部,都會寫一句說話,叫做「多謝你睇我嘅文章」。
呢句說話來源於我最鍾意嘅戲,《挑戰者1號》。
這是綠洲遊戲嘅創造者哈利迪喺最後消失嘅時候,同身為玩家嘅主角講嘅一句說話,亦都係我認為成套戲最正嘅收尾。
圖片
我都想我創造嘅嘢,被人見到,被大家鍾意,就係咁簡單。
所以喺4月初某個夜晚,我甚至冇說服自己嘅過程,就突然間起咗個念,覺得,不如開放畀大家啦,一齊用啦。
如果幫到大家,我就真係好開心。
網址喺度:https://aihot.virxact.com/
因為真係冇乜錢買域名,所以仲係用公司域名嚟做開發,所以可能域名有啲難記。
接下來,我都想用少少篇幅,好好介紹一下呢個嘢,仲有喺開發過程中遇到嘅一啲坑同經驗分享。
先講下AIHOT呢個產品。
我覺得喺呢個時代,好多工作其實已經唔係執行,執行呢方面Agent已經做得幾好,而家更多嘅工作變成咗資訊處理,我自己一般分三個流程:
獲取資訊 - 對資訊進行分析 - 基於資訊做決策。
對我嚟講做內容創作,獲取資訊就係從資訊海入面揾值得我留意嘅,而分析就係基於資訊,睇下有啲咩選題角度可以切入,最後嘅決策,就係呢個選題到底值唔值得寫。
目前嚟講,AIHOT解決嘅就係獲取資訊嘅問題,呢個亦都係我自己過去嘅痛點,呢個世界已經係資訊海,而且AI時代,垃圾資訊周圍飛,為咗保護我哋自己嘅注意力,我哋只能做資訊嘅篩選。
而且基於AI時代嘅資訊黑暗森林法則,喺而家,信源比資訊重要。
所以第一步,一定係篩選信源。
圖片
PS:呢度我要先好坦白咁講嚇,上面嘅界面係我嘅AIHOT界面,公司內部同事同大家見到嘅界面功能係唔同嘅,因為有啲嘢,真係唔係咁方便全部公開,我仲係要保護返自己嘅一啲底層策略。
上面嗰個截圖係公司同事同我哋MCN簽約博主用企業飛書認證登錄之後先見到嘅。
而畀大家見到嘅係下面呢個冇得登錄嘅版本,喺Tab上會少好多,好多底層策略同資訊係睇唔到嘅,呢個真係暫時冇辦法公開,希望大家體諒,叩頭。
圖片
講返信源嘅部分。
我而家持續監控嘅信源係168個,監控嘅手段就比較雜,有RSS訂閲、有直接爬人哋HTML嘅、有調用對方公開API接口嘅、有我自己畀錢買嘅第三方數據接口等等。
所有信源都係我自己逐個精選過,抱住寧缺毋濫同一手資訊優先嘅原則,大概調整咗一個月,真係慢慢累積出嚟。
然後信源等級我自己分咗三類,同後續嘅精選策略權重有關,分別係T1、T1.5、T2。
圖片
好似OpenAI嘅官方博客、Anthropic嘅工程博客、Sam Altman嘅Blog、CMU嘅博客等等,呢啲就屬於最值得睇嘅官方一手資訊,即係T1。
而呢啲官方嘅X賬號,一般發嘅嘢會比官方網站更多更雜,冇用消息都多啲,所以我設為T1.5,權重會低啲,例如OpenAI嘅官方Twitter。
圖片
而其他所有大佬個人號(例如Sam Altman、Dario等等)、KOL、媒體、仲有啲綜合資訊站,都統一劃咗入T2。
信源揀完之後,先係我覺得成個系統最複雜嘅地方。
就係資訊嘅處理。
呢一百幾個信源,其實已經唔多,但係每日抓返嚟嘅資訊,仲有幾百條咁多,例如尋日一日,就抓咗563條。
圖片
你信我,咁多條,冇可能有人會睇得曬,呢個係資訊爆炸,毫無意義。
而且入面其實有好多,係同AI冇關嘅,睇我上面嘅漏鬥就知,有一半同AI冇關。
例如蘋果嘅Newsroom,佢大部分內容其實就係一啲亂七八糟嘅公告之類,你唔可以因為蘋果做咗Apple Intelligence就將蘋果所有新聞都當AI新聞。
圖片
所以,呢個就係我最核心嘅精選機制。
點樣從抓返嚟嘅可靠信源入面,再揀出值得留意嘅資訊,推送畀我,就係精選Tab入面呢啲被精選嘅資訊。
可以見到,每個被精選嘅資訊,喺資訊卡片上都被打咗標籤同分數,呢啲資訊你亦都可以點擊標題跳去原文。
圖片
展示出嚟睇落好簡單,係咪?其實二月份啱開始做嘅時候,我都以為好簡單。
當時我就諗,呢樣嘢有幾複雜,寫個Prompt俾大模型判斷咪得囉,大模型直接俾個分,然後設定個閾值,過咗閾值嘅就值得被精選出嚟,搞掂。
但係越做到後面,發現越唔係咁,我想得太簡單,實際情況複雜好多。
呢個評分策略,我整整迭代咗11版。
圖片
詳細嘅Prompt、多維度評分機制仲有最終嘅數值設計,我真係唔方便公開,但係整體嘅架構處理流程,我覺得仲可以同大家分享嚇。
圖片
抓完之後,DeepSeek V3.2會進行預篩,判斷呢條資訊同AI有冇關,如果有關就推下一步,冇關就直接落庫,唔做後續評分。
圖片
點解要預篩呢?原因好簡單,就係控制成本,先用平嘅模型預篩嚇,通過咗嘅先交畀後面智力高啲嘅模型評分,咁樣慳錢。
至於點解用DeepSeek V3.2,純粹係因為呢個任務好簡單,DeepSeek V3.2呢個智力水平嘅模型夠用,而且我用DeepSeek V3.2約等於免費,因為我舊年過年DeepSeek嗰陣推咗一下硅基流動,邀請獎勵搞咗差唔多10萬人民幣嘅Token量,到而家都未用完。
預篩過咗之後,就係大模型進行評分同翻譯加摘要並行。
圖片
呢個AI評分,其實係我遇到最大嘅坑。
最開始二月我開始做嘅時候,心諗,

模型咁勁,我直接寫個prompt叫佢幫每條新聞打分就得。判斷重唔重要佢得、判斷分類佢得、判斷讀者鍾唔鍾意睇都得,全部交曬俾佢。

寫咗第一版prompt跑咗一個星期。

結果一塌糊塗,一啲好硬核嘅論文成日90分,我點開三秒就睇唔落去。Sam Altman轉發咗一個OpenAI實習生嘅雞湯推文,模型俾87分。

同一件事俾官方、X、IT之家等各種媒體報道咗七次,七次全部入精選。

太亂嚟喇。

然後,我開始喺prompt入面加規則。

大佬轉發要降分,同一事件已經報道過要降分,營銷軟文降到50以下,國內大公司發模型唔好因為唔係英文環境就低估。

加嚇加嚇,prompt加到300幾行。

到咗三月,我做咗一件我當時以為係里程碑嘅事,我引入咗人類反饋標註機制,我同同事每日點幾條精選得唔得,系統將反饋餵返畀佢持續迭代。

圖片

我仲為呢個迭代配咗一個內部評估機制,每次AI評分規則升級,我會用佢重新評估過去500條新聞,睇新版本同舊版本邊個揀得準。

圖片

聽落好勁,係咪?模型加人類反饋加自動評估加持續迭代,標準嘅AI產品做法。

跑咗一個星期之後,我幾乎崩潰,因為你要知道,規則加得越多,模型泛化能力越差,反而越蠢,我又加咗更多規則,於是揀得更差。

為瞭解決呢啲問題,我又加咗雙維度評分同實體熱度感知(俾模型知道邊間公司最近好紅),但結果直接廢咗。

V7到V8策略嘅迭代,當時係純粹嘅負向優化。

我直接全面回滾,推倒重來。

嗰一刻,我先諗起,我自己寫過嘅一篇文章。

用腳本的話就唔好用Agent。

你絕對唔可以將所有嘢都交俾模型,打分係佢、權重計算係佢、打標係佢、判斷係咪精選都係佢。

所以直接推倒重構,重新梳理咗我嘅流程同機制,用得代碼處理嘅,一律唔用模型處理。

而家,大模型評分淨係做一件事,就係根據我嘅Prompt,對每一條資訊打五個維度分,唔需要打最終分,咁樣會更加準確同客觀。

圖片

而其他,咩都唔需要理,Prompt直接由600行縮到200行。

我而家用嘅打分模型,係DeepSeek V4 Pro,世界知識好強,喺呢啲需要世界知識判斷嘅任務下,再加埋折扣,真係抵到爛。

打完分之後,所有根據信源重要程度、類型、公司等等嘅權重重計算,都唔需要模型嚟做,我直接用代碼寫好明確嘅計算公式,拎住大模型對嗰條資訊打嘅五維分,然後用公式直接重新計算,得到最終嘅質量分。

而家首頁展示嘅,就係計算完嘅最終分。

而係咪值得精選,都唔由模型判斷,而係根據質量分,再由代碼判斷係咪過咗每個類別嘅精選閾值。

例如OpenAI官網發嘅嘢,60分嘅重要性已經值得睇,但一個好似我咁嘅AI博主嘅轉發評測,其實講道理係二手消息,60分可能只係普通水平,咁你就未必一定要睇。

所以,如果過咗,就精選,如果唔過,就唔展示。

圖片

用代碼管控最好嘅結果,就係極度可控、可調。

而家嘅數值設計,係我直接用量化嘅方式跑咗上百個數值回測調出嚟,暫時我自己仲滿意,如果之後覺得唔好,都好簡單,公式入面調嚇權重或者某個數值,又或者改嚇閾值嘅門檻分,幾秒搞掂。

呢個機制,其實就係模擬我自己作為一個內容創作者,每日刷資訊時個腦入面嗰套隱性嘅過濾機制。

評分同精選之外,仲有一套嘢,我叫佢做事件聚類系統。

例如尋日,GPT-5.5 Instant發佈,除咗OpenAI官方報道之外,其實仲有一班人一齊報道。

圖片

如果唔做聚類,精選頁上就可能同一件事出現七八條甚至十幾條,個體驗肯定係災難。

所以喺設計AIHOT嘅時候,我會用embedding將語義相近嘅條目聚到一個事件簇入面,然後喺簇入面揀一條最權威嘅做主條,其他摺疊埋。

精選頁上同一件事淨係展示一條,點開就見到所有相關報道。

官方源發嘅永遠優先做主條,官網比官方Twitter優先,官方Twitter比KOL優先。

仲有一個AI日報功能,呢個係前段時間順手做嘅小功能。

圖片

大約係每日早上北京時間8點,系統會自動將過去24小時嘅精選內容,再揀多少少,按版塊整理成一份日報。

版塊分五個,模型發佈/更新、產品發佈/更新、行業動態、論文研究、技巧與觀點。

你每日起身,打開日報頁,一份乾乾淨淨嘅AI世界昨日要聞就喺度。

而呢份日報,亦都唔需要任何大模型嚟生成,因為所有精選、分類、翻譯,喺資訊入庫嗰陣已經全部做完,日報只需要將已經處理好嘅條目按類型分個桶,按分數排個序,就得。

我睇咗下速度,每日早上只需要1秒,日報就整到出嚟畀大家睇,而且質量我覺得都還OK。

AIHOT仲有一堆體驗方面嘅嘢,受限於篇幅,我就唔提喇,我雖然唔係開發同程序員,呢個網站上可能真係有啲我唔知嘅奇怪BUG,但係畢竟我做咗差唔多十年嘅用戶體驗設計師。

打磨體驗,執啲細節,令大家用得爽啲,我覺得我仲係擅長嘅。

至於未來AIHOT嘅計劃,我一定會繼續開發落去,因為有好多好多嘢受限於我嘅業餘時間,我仲未做。

例如趨勢預測,可以抓到加速曲線爆發初期仲未好紅嘅事件。

例如幫每個資訊拉返過去1個月嘅相關資訊。

例如我自己做一個AIHOT熱度指數等等。

不過未來呢啲功能,真係可能冇辦法全量開放,可能係公司員工同我哋MCN簽約博主專屬。

但我盡量平衡,畢竟,我都希望有更多人用到我嘅產品。

如果有任何建議或者反饋,都可以喺AIHOT嘅網頁上留言,會直接推送到我嘅飛書,我一定會第一時間睇到。

希望幫到大家,對大家有用。

網址唔好唔記得:

https://aihot.virxact.com/

大概就係咁啦。

多謝你睇我嘅文章。

亦都多謝,你用我嘅產品。

以上,既然睇到呢度,如果覺得唔錯,順手畀個讚、睇、轉發三連啦,如果想第一時間收到推送,都可以畀我個星標⭐~多謝你睇我嘅文章,我哋,下次再見。

> / 作者:卡茲克

> / 投稿或爆料,請聯絡電郵:wzglyay@virxact.com

今天,我決定把我自己做的,幫助我自己監控AI熱點、輔助找選題的網站,向所有人免費開放了。
它幾乎承載了我三年做AI自媒體獲取信息的經驗。
我把它稱為,AIHOT。
很多小夥伴可能在過去我很多篇文章中,都見過它的身影了。
圖片
這個東西的作用其實巨簡單,一段話就能描述清楚:
幫助你以乾淨的時間線的形式,監控這個世界上跟AI相關的信息,然後用我自己對內容挑選的策略,將值得你關注的東西精選出來,對信息海進行降維,從而保護我們的為數不多的注意力。
這玩意其實本身是給我們公司內部用的,創造它的目的,其實就是為了保護我自己的創作精力,我一開始真的沒打算把它開放給所有人。
因為對於一個自媒體來說,信息的獲取的及時性,有的時候就是命根子。
但,可能是產品心理作祟吧,我工作這麼多年,一直在設計產品,一直在做產品,做了好多好多年。
我還是有產品夢的,我還是想為這個美好的互聯網貢獻一點我自己的東西的,而我很多時候最大的成就感的來源,其實就是大家喜歡看我的文章,喜歡用我做的產品。
我在每次文章的底部,都會寫上一句話,叫做“謝謝你看我的文章。”
這句話來源於我最喜歡的一部電影,《頭號玩家》。
這是綠洲遊戲的創造者哈利迪在最後消逝的時候,對身為玩家的主角所說的一句話,也是我認為整部電影,最棒的落筆。
圖片
我也想我創造的東西,被人看見,被大家喜歡,僅此而已。
所以在4月初的某個夜晚,我甚至都沒有說服自己的過程,就突然間起心動念,就覺得,不如給大家開放了吧,大家一起用吧。
如果能幫助到大家,那我就真的很開心了。
網址在此:https://aihot.virxact.com/
因為確實沒啥錢買域名,所以還是用的公司域名來做開發的,所以可能域名會有一點難記。
接下來,我也想再花一點篇幅,好好介紹一下這個東西,還有我在開發過程中,遇到的一些坑和經驗的分享。
先聊聊AIHOT這個產品。
我覺得在這個時代,很多的工作其實已經不是執行了,執行這塊Agent已經可以乾的很好了,現在更多的工作成了信息的處理,我自己一般分為三個流程:
獲取信息 - 對信息進行分析 - 基於信息做決策。
對於我做內容創作來說,獲取信息就是從信息海中找到值得我關注的,而進行分析,其實就是基於信息,看看有什麼選題角度可以切入,最後的決策,其實就是這個選題到底值不值得寫。
目前來說,AIHOT解決的就是獲取信息的問題,這個也是我自己過去的痛點,這個世界已經是信息海了,而且AI時代,垃圾信息滿天飛,為了保護我們自己的注意力,我們只能做信息的篩選。
並且基於AI時代的信息黑暗森林法則,在如今,信源比信息重要。
所以第一步,肯定是篩選信源。
圖片
PS:這裏我得先非常坦誠的說一下,上面的界面是我的AIHOT界面,公司內部同事和大家看到的界面的功能是不一樣的,因為有些東西,確實不太方便全部公開,我還是得保護一下自己的一些底層策略。
上面那個截圖是公司同事和我們MCN簽約博主在進行企業飛書認證登錄以後能看到的。
而給大家能看到的是下面這個無法登錄的版本,在Tab上會少了很多,很多的底層策略和信息是看不多的,這個確實目前是沒辦法公開,希望大家可以諒解一下,磕頭。
圖片
說回信源的部分。
我目前在持續監控的信源是168個,監控的手段就比較亂了,有RSS訂閲、有對着別人HTML直接爬的、有調用對方公開API接口的、有我自己花錢買的三方數據接口的等等。
所有的信源都是我自己挨個精選過的,秉持着寧缺毋濫和一手信息優先的原則,大概調了一個月,真的就是慢慢的累加。
然後信源等級我自己分了3類,這個跟後續的精選策略權重有關,分別是T1、T1.5、T2。
圖片
像比如OpenAI的官方博客、Anthropic的工程博客、奧特曼的Blog、CMU的博客等等,這種就屬於最值得看的官方一手信息,也就是T1。
而這些官方的X賬號,一般發的東西會比官方網站更多更雜,無用消息也更多,所以我設為了T1.5,權重會低一點,比如OpenAI的官推。
圖片
而其他的所有大佬個人號(比如奧特曼、達里奧等等)、KOL、媒體、還有一些綜合資訊站,都被統一劃在了T2裏。
信源挑選完之後,才是我覺得,我整套系統最複雜的地方了。
也就是信息的處理。
這一百多個信源,其實已經不多了,但是每天抓取來的信息,還是有幾百條之多,比如昨天一天,其實就抓了563條。
圖片
你相信我,這麼多條,不可能會有任何一個人會看完的,這是信息爆炸,毫無意義。
而且裏面其實有非常多,是跟AI無關的,看我上面的漏斗就知道,有一半是跟AI無關的。
比如蘋果的Newsroom,它大部分內容其實就是一些亂七八糟的公告啥的,你不能因為蘋果做了Apple Intelligence就把蘋果的所有新聞都當AI新聞。
圖片
所以,這就是我最核心的,精選機制了。
如何從抓取的靠譜的信源中,再挑選出值得關注的信息,推送到我的面前,也就是,精選tab中的這些,被精選的信息。
可以看到,每一個被精選的信息,都在信息卡片上被打了標和分數,這些信息你也可以點擊標題跳轉到原文。
圖片
展示出來的看着非常簡單對吧,其實2月份剛開始做的時候,我也以為這事非常簡單。
當時我就想着,這玩意能有多複雜,寫個Prompt讓大模型判斷不就完事了嗎,大模型直接給個分,然後設定個閾值,過了閾值的就值得被精選出來,不就完事了嗎。
但是真的越做到後面,發現越不是這樣,我想的太簡單了,實際情況比這複雜多了。
這個評分策略,我整整迭代了11版。
圖片
詳細的Prompt、多維度評分機制還有最終的數值設計,我確實不太好公開,但是整體的架構處理流程,我覺得還是可以給大家分享一下的。
圖片
抓取完了以後,DeepSeek V3.2會進行預篩,判斷這條信息是否跟AI有關,如果有關,則推進到下一步,如果無關,直接落庫,不進行後續的評分了。
圖片
為啥要預篩呢,原因很簡單,就是管控成本,先用便宜的模型來預篩一下,通過的再交給後面智力更高的模型去進行評分,這樣省錢。。。
至於為啥用DeepSeek V3.2,單純是因為這個任務非常的簡單,DeepSeek V3.2這個智力水平的模型足夠了,而且我用DeepSeek V3.2約等於免費,因為我去年過年DeepSeek那一波推了一下硅基流動,邀請獎勵搞了有將近10萬人民幣的Token量,現在還沒花完。。。
預篩過了以後,就是大模型進行評分和翻譯+摘要並行。
圖片
這個AI評分,其實是我經歷的最大的坑。
最開始2月我開始做的時候,心裏想着,

模型這麼強,我直接寫個prompt讓它給每條新聞打分就行了。判重要不重要它行、判分類它行、判讀者愛不愛看也行,全交給它。

寫了第一版prompt跑了一週。

結果一塌糊塗,一些究極硬核的論文動不動90分,我點開三秒看不下去。Sam Altman轉發了一個 OpenAI 實習生的雞湯推文,模型給87分。

同一件事被官方、X、IT之家各種媒體報道了七遍,七遍全部進精選。

太特麼扯淡了。

然後,我開始往prompt里加規則。

大佬轉發要降分,同一事件已被報道過要降分,營銷軟文降到50以下,國內大公司發模型不要因為不是英文環境就低估。。。

加着加着,prompt漲到300多行。

到了3月,我做了一件我當時自認為覺得是里程碑的事,我引入了人類反饋標註機制,我跟我的同事每天點幾條這條精選得對/不對,系統把反饋喂回讓它持續迭代。

圖片

我還給這個迭代配了一個內部評估機制,每次AI評分規則升級,我會用它去重新評估過去500條新聞,看新版本和老版本誰選得更準。

圖片

聽着非常酷對吧?模型 + 人類反饋 + 自動評估 + 持續迭代,標準的AI產品做法。

跑了一週以後,我幾乎崩潰了,因為你要知道,規則加的越多,模型泛化能力越差,反而越來越笨,我又加了更多的規則,於是選的更差了。

為了解決這些問題,我又加了雙維度評分還有實體熱度感知(讓模型知道哪個公司最近很火),但結果直接廢了。

V7到V8策略的迭代,當時是純粹的負向優化。

我直接全面回滾,推倒重來了。

那一刻,我才想起來,我自己寫過的一篇文章。

能用腳本就別用Agent。

你絕不能,把所有的事情都交給模型,打分是他、權重計算是他、打標是它、判斷是否精選還是它。

所以直接推倒重構了,重新了梳理了我的流程和機制,能用代碼處理的,一律不用模型處理。

現在,大模型評分只做一件事,就是根據我的Prompt,對每一條信息,打5個維度分,不需要打最終分了,這樣會更加準確和客觀。

圖片

而其他的,什麼都不需要管了,Prompt直接也從600行直接縮減到了200行。

我目前用的打分模型,是DeepSeek V4 Pro,世界知識極強,在這種需要世界知識判斷的任務下,再加上打折,真的香麻了。

打完分以後,所有的根據信源的重要程度、類型、公司等等的權重重計算,也不需要模型來了,我直接用代碼寫好了明確的計算公式,拿着大模型對那條信息大的五維分,然後使用公式直接重新計算,得到最終的質量分。

現在首頁上展示的,就是計算完畢的最終分。

而是否值得精選,也不由模型判斷,而是根據質量分,再由代碼判斷是否過了每個類別的精選閾值。

比如OpenAI官網發的東西,60分的重要性已經挺值得看了,但一個像我這樣的AI博主的轉發評測,其實講道理,屬於二手消息,60分可能只是普通水平,那你就不一定需要看到它。

所以,如果過了,就精選,如果不過,就不展示。

圖片

用代碼管控的最好的結果,就是極度的可控、可調。

現在的數值設計,是我直接用量化的方式跑了上百個數值回測調出來的,目前我自己還比較滿意,如果後續我覺得不好,那也很簡單,公式裏調一下權重或者某個數值,又或者改一下閾值的門檻分,幾秒的事。

這個機制,其實就是模擬的我自己作為一個內容創作者,每天刷信息時腦子裏那套隱性的過濾機制。

評分和精選之外,還有一套東西,我把它稱為事件聚類系統。

就是比如昨天,GPT-5.5 Instant發佈了,除了OpenAI官方會報道之外,其實還有一堆人也會一起報道。

圖片

如果不做聚類,精選頁上就可能同一件事會出現七八條甚至十幾條,那體驗絕逼是災難。

所以我在設計AIHOT的時候,會用embedding把語義相近的條目聚到一個事件簇裏,然後在簇裏選一條最權威的當主條,其他的摺疊進去。

精選頁上同一件事只展示一條,點開能看到所有相關報道。

官方源發的永遠優先當主條,官網比官方推特優先,官方推特比KOL優先。

然後還有一個AI日報功能,這個是前段時間隨手做的一個小功能。

圖片

大概就是每天早上北京時間8點,系統會自動把過去24小時的精選內容,再稍微挑選一下,按版塊整理成一份報日報。

版塊分五塊,模型發佈/更新、產品發佈/更新、行業動態、論文研究、技巧與觀點。

你每天早上起來,打開日報頁,一份乾乾淨淨的AI世界昨日要聞就在那了。

而這個日報,也不需要任何大模型來生成,因為所有的精選、分類、翻譯,在信息入庫的時候就已經全部做完了,日報只需要把已經處理好的條目按類型分個桶,按分數排個序,就完事了。

我看了下速度,每天早上只需要1秒鐘,日報就能做出來給大家看,而且質量我覺得也還湊合。

AIHOT還有一堆體驗方面的東西,受制於篇幅,我就不提了,我雖然不是開發和程序員,這個網站上可能確實有一些我不知道的詭異的BUG,但是我畢竟做了快十年的用戶體驗設計師。

打磨體驗,扣各種細節,讓大家用的更爽,我覺得我還是擅長的。

至於未來AIHOT的計劃,我肯定還是會繼續開發下去,因為有好多好多東西受制於我的業餘時間,我還沒有做呢。

比如趨勢預測,可以抓到加速曲線爆發初期還沒有特別火的事件。

比如給每個信息拽出過去1個月的相關信息。

比如我自己做一個AIHOT熱度指數等等。

不過未來的這些功能,確實可能沒辦法給大家全量開放,可能就是公司員工還有我們MCN簽約的博主專屬了。

但是我儘量去平衡,畢竟,我也希望,有更多人能用上我的產品。

如果有任何建議或者反饋,都可以在AIHOT的網頁上進行留言,會直接推送到我的飛書上,我絕對會第一時間看到的。

希望能幫助到大家,對大家有用。

網址不要忘了:

https://aihot.virxact.com/

大概就是這樣啦。

謝謝你看我的文章。

也謝謝,你用我的產品。

以上,既然看到這裏了,如果覺得不錯,隨手點個贊、在看、轉發三連吧,如果想第一時間收到推送,也可以給我個星標⭐~謝謝你看我的文章,我們,下次再見。

>/ 作者:卡茲克

>/ 投稿或爆料,請聯繫郵箱:wzglyay@virxact.com