小紅書數據採集神器!一鍵抓取筆記、評論、用戶信息

作者:小禿僧
日期:2026年4月14日 上午12:01
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Spider_XHS 係一個開源免費嘅小紅書數據採集工具,可以一鍵抓取筆記、評論、用戶信息,大幅提升運營效率。

整理版摘要

呢篇文章係由一位小紅書運營者分享嘅,佢成日要手動採集數據,覺得好痛苦,所以介紹咗一個叫 Spider_XHS 嘅開源工具。呢個工具喺 GitHub 有 5.1k+ Star,好多運營同數據分析師都用緊。文章指出,傳統手動採集效率低,而 Spider_XHS 功能全面、接口穩定、支援 AI 整合,仲要係免費嘅,可以一次過解決呢啲問題。整體結論係:呢個工具好實用,但一定要小心使用,唔好亂嚟。

Spider_XHS 可以幫你抓取公開嘅筆記內容、評論、用戶資料、搜尋結果等,基本上小紅書上見到嘅公開數據都得。文章仲列咗好多實際應用場景,例如競品分析、熱門話題挖掘、用戶畫像、批量下載同 AI 自動化運營。使用步驟都好簡單,只要 clone 個 repo、安裝依賴、設定好 Cookie 就可以開始採集。

不過,作者都提醒咗幾個注意點:採集太密可能會被封號,Cookie 會過期,私密內容係拎唔到嘅,而且數據唔可以用喺商業用途。總括嚟講,Spider_XHS 係一個好強大嘅工具,但要用得啱,尊重平台規則同用戶私隱。

  • Spider_XHS 係開源免費小紅書數據採集工具,GitHub 5.1k+ Star,可抓筆記、評論、用戶信息等公開數據。
  • 安裝簡單:git clone、pip install、設定 Cookie 就得;支援批量採集、定時任務同 AI Agent 整合。
  • 主要場景:競品分析、熱門話題挖掘、用戶畫像、批量下載素材、AI 自動化內容生成。
  • 注意風險:控制頻率避免封號、Cookie 會過期、只能採公開內容、不可商用。
  • 相比其他付費工具,Spider_XHS 最大優勢係免費開源、可二次開發,而且持續更新適配小紅書接口。
值得記低
連結 github.com

Spider_XHS GitHub 專案

小紅書數據採集工具,開源免費,支援筆記、評論、用戶信息等數據抓取。

整理重點

小紅書運營嘅痛,呢個工具幫到手

做小紅書運營嘅各位,有冇試過要逐個點開筆記手動記低數據?想收集熱門話題,見到眼花都未搞掂?Spider_XHS 就係為咗解決呢啲問題而嚟嘅。

  • 功能全面:筆記、評論、用戶信息、搜尋結果通通得
  • 接口穩定:成日跟小紅書更新,唔怕用用下失效
  • AI 友好:可以接入 AI Agent,做到自動化運營
  • 開源免費:成個源碼公開,你可以自己改裝
整理重點

可以採集啲咩數據?

呢個工具可以幫你一次過拎曬小紅書上公開嘅數據,唔使自己慢慢 copy。

筆記詳情包括標題、正文、圖片、影片、讚好數、收藏數、評論數

評論數據可以拎到評論內容、評論者、讚好數、回覆數

用戶信息有暱稱、粉絲數、關注數、獲讚數、簡介

搜尋結果 keyword 搜尋後嘅筆記列表

話題筆記:指定話題下嘅所有筆記,用戶筆記:指定用戶全部筆記

一句講曬:小紅書上面你見到嘅公開數據,基本上都用呢個工具拎到,唔使自己逐個記。

整理重點

實際應用場景,幫你慳時間

Spider_XHS 唔單止係一個數據採集工具,仲可以配合好多運營需要。以下係幾個常見嘅用法:

  1. 1 競品分析:輸入對手用戶 ID,一鍵拎曬佢啲筆記,分析標題規律、內容風格、發佈時間,仲可以統計讚好收藏評論,找出爆款路數。
  2. 2 熱門話題挖掘:搜尋關鍵詞,拎返相關筆記,分析高頻詞同標籤,幫你揾出潛在爆款話題。
  3. 3 用戶畫像:抓目標用戶嘅評論數據,分析佢哋關心嘅話題同興趣點,內容創作方向就清晰曬。
  4. 4 批量下載素材:需要大量圖片影片做二次創作?一鍵批量下載,慳返好多時間。
  5. 5 AI 自動化運營:將競品數據餵畀 AI,等 AI 學習爆款規律,再生成新內容,甚至可以配合自動發佈(要自己開發)。
整理重點

點樣用?一步一步嚟

成個流程好簡單,只要你有基本嘅 Python 知識就可以搞掂。

第一步:git clone 個專案

第二步:pip install -r requirements.txt 裝依賴

第三步:設定 Cookie,呢步最關鍵

程式內容 python
# 克隆專案
git clone https://github.com/cv-cat/Spider_XHS.git
cd Spider_XHS

# 安裝依賴
pip install -r requirements.txt

# 喺 .env 檔案寫入 Cookie
COOKIE=你的小紅書Cookie

# 採集單個筆記
from xhs_utils import XHS
xhs = XHS()
note = xhs.get_note('筆記ID')
print(note)

之後你可以用 Python 腳本批量採集用戶筆記、搜尋關鍵詞、拎評論,仲可以將數據 save 做 JSON 或者 CSV

進階玩法包括批量採集多個用戶、用 crontab 定時自動採集、同埋接入 AI Agent

整理重點

常見問題同注意事項

用呢個工具之前,呢啲嘢你一定要知,唔係好易出事。

採集會唔會封號?有風險,建議控制頻率、用分身號、唔好用主號

Cookie 會過期,一般幾日到幾星期,過期要重新拎

私密內容採集唔到,只能拎公開可見嘅

數據唔可以商用,呢個項目只供學習交流,否則有法律風險

總之,Spider_XHS 係一個好強大嘅工具,但一定要用得啱,尊重平台規則同用戶私隱,先至係長遠之計。


做小紅書營運?呢個工具令你效率提升一倍

前言:小紅書營運嘅痛,邊個明啊

圖片

兄弟們,做小紅書營運嘅有冇咁嘅經歷:

  • 想分析競品賬號,要一個一個撳開筆記手動記錄
  • 想收集熱門話題,翻咗幾百條筆記眼都花埋
  • 想統計評論數據,複製貼上到手軟
  • 想批量下載圖片影片,一張張右鍵儲存

最痛苦嘅係:

  • 手動採集效率太低,一日採唔到幾多數據
  • 想寫個腳本啦,小紅書反爬機制又複雜
  • 網上揾嘅爬蟲工具,一係收費貴,一係唔好用

今日同大家介紹一個神器 —— Spider_XHS,一個開源嘅小紅書數據採集工具,令你一鍵抓取筆記、評論、用戶資訊!

圖片



Spider_XHS 係咩嘢?

簡單嚟講,呢個係一個開源免費嘅小紅書數據採集工具

GitHub 上 5.1k+ Star,好多小紅書營運、數據分析師都用緊。

核心特點:

  • ✅ 功能全面:筆記、評論、用戶資訊、搜尋都抓到
  • ✅ 接口穩定:持續維護更新,適配小紅書最新接口
  • ✅ AI 友好:支援接入 AI Agent,實現自動化營運
  • ✅ 開源免費:代碼全面公開,可以二次開發

可以採集啲咩數據?

數據類型
說明
筆記詳情
標題、正文、圖片、影片、讚好數、收藏數、評論數
評論數據
評論內容、評論者、讚好數、回覆數
用戶資訊
暱稱、粉絲數、關注數、獲讚數、簡介
搜尋結果
關鍵詞搜尋嘅筆記列表
話題筆記
指定話題底下嘅所有筆記
用戶筆記
指定用戶發布嘅所有筆記

一句講曬:小紅書上面嘅公開數據,基本上都抓得到


有咩用?

場景一:競品分析

想知道競品賬號發咗啲咩內容、數據點樣。

用 Spider_XHS 之後

  • 輸入競品用戶 ID,一鍵抓取所有筆記
  • 分析標題規律、內容風格、發布時間
  • 統計讚好/收藏/評論數據,找出爆款規律

場景二:熱門話題挖掘

想揾熱門話題蹭流量,但係唔知咩嘢火。

用 Spider_XHS 之後

  • 搜尋關鍵詞,抓取相關筆記
  • 分析高頻詞、熱門標籤
  • 揾到潛在爆款話題

場景三:用戶畫像分析

想了解目標用戶鍾意啲咩內容。

用 Spider_XHS 之後

  • 抓取目標用戶嘅評論數據
  • 分析用戶關注嘅話題、興趣點
  • 為內容創作提供方向

場景四:批量下載素材

需要大量圖片影片素材做二次創作。

用 Spider_XHS 之後

  • 批量下載筆記圖片、影片
  • 自動儲存到本地
  • 大大提高素材收集效率

場景五:AI 自動化營運

想用 AI 批量生成內容、自動發布。

用 Spider_XHS 之後

  • 採集競品數據餵俾 AI
  • AI 學習爆款規律,生成新內容
  • 自動發布到小紅書

點樣用?一步一步教你

第一步:下載代碼

# 克隆項目
git clone https://github.com/cv-cat/Spider_XHS.git
cd Spider_XHS

第二步:安裝依賴

# 安裝 Python 依賴
pip install -r requirements.txt

第三步:配置 Cookie

小紅書需要登入之後先至可以採集數據。

  1. 打開瀏覽器,登入小紅書網頁版
  2. 按 F12 打開開發者工具
  3. 揾到 Network(網絡)標籤
  4. 重新整理頁面,揾到任意一個 request
  5. 複製 Cookie 字段

將 Cookie 貼上到 .env 檔案入面:

COOKIE=你的小紅書Cookie

第四步:執行採集

採集單個筆記

from xhs_utils import XHS

xhs = XHS()
note = xhs.get_note('筆記ID')
print(note)

採集用戶所有筆記

user_notes = xhs.get_user_notes('用戶ID')
for note in user_notes:
    print(note['title'])

搜尋關鍵詞

results = xhs.search('穿搭', num=100)
for note in results:
    print(note['title'], note['likes'])

採集評論

comments = xhs.get_comments('筆記ID')
for comment in comments:
    print(comment['content'])

第五步:儲存數據

採集嘅數據可以儲存做 JSON、CSV 等格式:

import json

# 保存為 JSON
with open('notes.json''w', encoding='utf-8'as f:
    json.dump(user_notes, f, ensure_ascii=False, indent=2)

進階玩法

批量採集多個用戶

user_ids = ['用戶ID1''用戶ID2''用戶ID3']

for user_id in user_ids:
    notes = xhs.get_user_notes(user_id)
    # 保存數據...

定時自動採集

用定時任務(crontab)每日自動採集:

# 每天凌晨 2 點執行
0 2 * * * cd /path/to/Spider_XHS && python main.py

接入 AI Agent

將採集嘅數據餵俾 AI,實現自動化營運:

# 採集爆款筆記
hot_notes = xhs.search('熱門關鍵詞', num=50)

# 發給 AI 分析
ai_analysis = ai_agent.analyze(hot_notes)

# AI 生成新內容
new_content = ai_agent.generate(ai_analysis)

# 自動發佈(需要額外開發)

常見問題

Q:採集會被封號嗎?

有一定風險,建議:

  • 控制採集頻率,唔好頻繁請求
  • 使用小號採集,唔好用主號
  • 唔好採集得過於頻繁

Q:Cookie 會過期嗎?

會,一般幾日到幾星期不等。過期之後要重新獲取 Cookie。

Q:可以採集私密內容嗎?

唔得,只可以採集公開可見嘅內容。私密筆記、需要登入先睇到嘅內容冇辦法採集。

Q:數據可以商用嗎?

呢個項目僅供學習交流使用,採集嘅數據請唔好用喺商業用途,避免法律風險。

Q:點解有啲數據採集唔到?

小紅書有反爬機制,可能會:

  • 限制請求頻率
  • 返回驗證碼
  • 封鎖賬號

建議降低採集頻率,或者使用代理 IP。


寫喺最後

Spider_XHS 係小紅書營運、數據分析嘅利器,可以大大提高數據採集效率。

但係請記住:

  • 僅供學習交流使用
  • 尊重用戶私隱
  • 遵守平台規則
  • 唔好用喺非法用途

合理使用,令工具為創作服務,而唔係成為數據嘅搬運工。


項目地址

  • GitHub:https://github.com/cv-cat/Spider_XHS
圖片

⚠️ 呢個項目僅供學習交流使用,禁止任何商業化行為


如果呢篇文章對你有幫助 

歡迎讚好、在看、轉發三連!



做小紅書運營?這個工具讓你效率翻倍

前言:小紅書運營的痛,誰懂啊

圖片

兄弟們,做小紅書運營的有沒有這樣的經歷:

  • 想分析競品賬號,得一個個點開筆記手動記錄
  • 想收集熱門話題,翻了幾百條筆記眼睛都花了
  • 想統計評論數據,複製粘貼到手軟
  • 想批量下載圖片視頻,一張張右鍵保存

最痛苦的是:

  • 手動採集效率太低,一天採不了多少數據
  • 想寫個腳本吧,小紅書反爬機制又複雜
  • 網上找的爬蟲工具,要麼收費貴,要麼不好用

今天給大家介紹一個神器 —— Spider_XHS,一個開源的小紅書數據採集工具,讓你一鍵抓取筆記、評論、用戶信息!

圖片



Spider_XHS 是什麼?

簡單說,這是一個開源免費的小紅書數據採集工具

GitHub 上 5.1k+ Star,很多小紅書運營、數據分析師都在用。

核心特點:

  • ✅ 功能全面:筆記、評論、用戶信息、搜索都能抓
  • ✅ 接口穩定:持續維護更新,適配小紅書最新接口
  • ✅ AI 友好:支持接入 AI Agent,實現自動化運營
  • ✅ 開源免費:代碼全公開,可二次開發

能採集什麼數據?

數據類型
說明
筆記詳情
標題、正文、圖片、視頻、點贊數、收藏數、評論數
評論數據
評論內容、評論者、點贊數、回覆數
用戶信息
暱稱、粉絲數、關注數、獲贊數、簡介
搜索結果
關鍵詞搜索的筆記列表
話題筆記
指定話題下的所有筆記
用戶筆記
指定用戶發佈的所有筆記

一句話:小紅書上的公開數據,基本上都能抓


有什麼用?

場景一:競品分析

想知道競品賬號發了什麼內容、數據怎麼樣。

用 Spider_XHS 後

  • 輸入競品用戶 ID,一鍵抓取所有筆記
  • 分析標題規律、內容風格、發佈時間
  • 統計點贊/收藏/評論數據,找出爆款規律

場景二:熱門話題挖掘

想找熱門話題蹭流量,但不知道什麼火。

用 Spider_XHS 後

  • 搜索關鍵詞,抓取相關筆記
  • 分析高頻詞、熱門標籤
  • 找到潛在爆款話題

場景三:用戶畫像分析

想了解目標用戶喜歡什麼內容。

用 Spider_XHS 後

  • 抓取目標用戶的評論數據
  • 分析用戶關注的話題、興趣點
  • 為內容創作提供方向

場景四:批量下載素材

需要大量圖片視頻素材做二次創作。

用 Spider_XHS 後

  • 批量下載筆記圖片、視頻
  • 自動保存到本地
  • 大大提高素材收集效率

場景五:AI 自動化運營

想用 AI 批量生成內容、自動發佈。

用 Spider_XHS 後

  • 採集競品數據餵給 AI
  • AI 學習爆款規律,生成新內容
  • 自動發佈到小紅書

怎麼用?一步一步教你

第一步:下載代碼

# 克隆項目
git clone https://github.com/cv-cat/Spider_XHS.git
cd Spider_XHS

第二步:安裝依賴

# 安裝 Python 依賴
pip install -r requirements.txt

第三步:配置 Cookie

小紅書需要登錄後才能採集數據。

  1. 打開瀏覽器,登錄小紅書網頁版
  2. 按 F12 打開開發者工具
  3. 找到 Network(網絡)標籤
  4. 刷新頁面,找到任意一個請求
  5. 複製 Cookie 字段

把 Cookie 粘貼到 .env 文件中:

COOKIE=你的小紅書Cookie

第四步:運行採集

採集單個筆記

from xhs_utils import XHS

xhs = XHS()
note = xhs.get_note('筆記ID')
print(note)

採集用戶所有筆記

user_notes = xhs.get_user_notes('用戶ID')
for note in user_notes:
    print(note['title'])

搜索關鍵詞

results = xhs.search('穿搭', num=100)
for note in results:
    print(note['title'], note['likes'])

採集評論

comments = xhs.get_comments('筆記ID')
for comment in comments:
    print(comment['content'])

第五步:保存數據

採集的數據可以保存為 JSON、CSV 等格式:

import json

# 保存為 JSON
with open('notes.json''w', encoding='utf-8'as f:
    json.dump(user_notes, f, ensure_ascii=False, indent=2)

進階玩法

批量採集多個用戶

user_ids = ['用戶ID1''用戶ID2''用戶ID3']

for user_id in user_ids:
    notes = xhs.get_user_notes(user_id)
    # 保存數據...

定時自動採集

用定時任務(crontab)每天自動採集:

# 每天凌晨 2 點執行
0 2 * * * cd /path/to/Spider_XHS && python main.py

接入 AI Agent

把採集的數據餵給 AI,實現自動化運營:

# 採集爆款筆記
hot_notes = xhs.search('熱門關鍵詞', num=50)

# 發給 AI 分析
ai_analysis = ai_agent.analyze(hot_notes)

# AI 生成新內容
new_content = ai_agent.generate(ai_analysis)

# 自動發佈(需要額外開發)

常見問題

Q:採集會被封號嗎?

有一定風險,建議:

  • 控制採集頻率,不要頻繁請求
  • 使用小號採集,不要用主號
  • 不要採集過於頻繁

Q:Cookie 會過期嗎?

會,一般幾天到幾周不等。過期後需要重新獲取 Cookie。

Q:能採集私密內容嗎?

不能,只能採集公開可見的內容。私密筆記、需要登錄才能看的內容無法採集。

Q:數據可以商用嗎?

本項目僅供學習交流使用,採集的數據請勿用於商業用途,避免法律風險。

Q:為什麼有些數據採不到?

小紅書有反爬機制,可能會:

  • 限制請求頻率
  • 返回驗證碼
  • 封禁賬號

建議降低採集頻率,或使用代理 IP。


寫在最後

Spider_XHS 是小紅書運營、數據分析的利器,能大大提高數據採集效率。

但請記住:

  • 僅供學習交流使用
  • 尊重用戶隱私
  • 遵守平台規則
  • 不要用於非法用途

合理使用,讓工具為創作服務,而不是成為數據的搬運工。


項目地址

  • GitHub:https://github.com/cv-cat/Spider_XHS
圖片

⚠️ 本項目僅供學習交流使用,禁止任何商業化行為


如果這篇文章對你有幫助 

歡迎點贊、在看、轉發三連!