小紅書數據採集神器！一鍵抓取筆記、評論、用戶信息

作者：小禿僧

日期：2026年4月14日上午12:01

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

Spider_XHS 係一個開源免費嘅小紅書數據採集工具，可以一鍵抓取筆記、評論、用戶信息，大幅提升運營效率。

整理版摘要

呢篇文章係由一位小紅書運營者分享嘅，佢成日要手動採集數據，覺得好痛苦，所以介紹咗一個叫 Spider_XHS 嘅開源工具。呢個工具喺 GitHub 有 5.1k+ Star，好多運營同數據分析師都用緊。文章指出，傳統手動採集效率低，而 Spider_XHS 功能全面、接口穩定、支援 AI 整合，仲要係免費嘅，可以一次過解決呢啲問題。整體結論係：呢個工具好實用，但一定要小心使用，唔好亂嚟。

Spider_XHS 可以幫你抓取公開嘅筆記內容、評論、用戶資料、搜尋結果等，基本上小紅書上見到嘅公開數據都得。文章仲列咗好多實際應用場景，例如競品分析、熱門話題挖掘、用戶畫像、批量下載同 AI 自動化運營。使用步驟都好簡單，只要 clone 個 repo、安裝依賴、設定好 Cookie 就可以開始採集。

不過，作者都提醒咗幾個注意點：採集太密可能會被封號，Cookie 會過期，私密內容係拎唔到嘅，而且數據唔可以用喺商業用途。總括嚟講，Spider_XHS 係一個好強大嘅工具，但要用得啱，尊重平台規則同用戶私隱。

Spider_XHS 係開源免費小紅書數據採集工具，GitHub 5.1k+ Star，可抓筆記、評論、用戶信息等公開數據。
安裝簡單：git clone、pip install、設定 Cookie 就得；支援批量採集、定時任務同 AI Agent 整合。
主要場景：競品分析、熱門話題挖掘、用戶畫像、批量下載素材、AI 自動化內容生成。
注意風險：控制頻率避免封號、Cookie 會過期、只能採公開內容、不可商用。
相比其他付費工具，Spider_XHS 最大優勢係免費開源、可二次開發，而且持續更新適配小紅書接口。

值得記低

連結 github.com

Spider_XHS GitHub 專案

小紅書數據採集工具，開源免費，支援筆記、評論、用戶信息等數據抓取。

整理重點

小紅書運營嘅痛，呢個工具幫到手

做小紅書運營嘅各位，有冇試過要逐個點開筆記手動記低數據？想收集熱門話題，見到眼花都未搞掂？Spider_XHS 就係為咗解決呢啲問題而嚟嘅。

功能全面：筆記、評論、用戶信息、搜尋結果通通得
接口穩定：成日跟小紅書更新，唔怕用用下失效
AI 友好：可以接入 AI Agent，做到自動化運營
開源免費：成個源碼公開，你可以自己改裝

整理重點

可以採集啲咩數據？

呢個工具可以幫你一次過拎曬小紅書上公開嘅數據，唔使自己慢慢 copy。

筆記詳情包括標題、正文、圖片、影片、讚好數、收藏數、評論數

評論數據可以拎到評論內容、評論者、讚好數、回覆數

用戶信息有暱稱、粉絲數、關注數、獲讚數、簡介

搜尋結果 keyword 搜尋後嘅筆記列表

話題筆記：指定話題下嘅所有筆記，用戶筆記：指定用戶全部筆記

一句講曬：小紅書上面你見到嘅公開數據，基本上都用呢個工具拎到，唔使自己逐個記。

整理重點

實際應用場景，幫你慳時間

Spider_XHS 唔單止係一個數據採集工具，仲可以配合好多運營需要。以下係幾個常見嘅用法：

1 競品分析：輸入對手用戶 ID，一鍵拎曬佢啲筆記，分析標題規律、內容風格、發佈時間，仲可以統計讚好收藏評論，找出爆款路數。
2 熱門話題挖掘：搜尋關鍵詞，拎返相關筆記，分析高頻詞同標籤，幫你揾出潛在爆款話題。
3 用戶畫像：抓目標用戶嘅評論數據，分析佢哋關心嘅話題同興趣點，內容創作方向就清晰曬。
4 批量下載素材：需要大量圖片影片做二次創作？一鍵批量下載，慳返好多時間。
5 AI 自動化運營：將競品數據餵畀 AI，等 AI 學習爆款規律，再生成新內容，甚至可以配合自動發佈（要自己開發）。

整理重點

點樣用？一步一步嚟

成個流程好簡單，只要你有基本嘅 Python 知識就可以搞掂。

第一步：git clone 個專案

第二步：pip install -r requirements.txt 裝依賴

第三步：設定 Cookie，呢步最關鍵

程式內容 python

# 克隆專案
git clone https://github.com/cv-cat/Spider_XHS.git
cd Spider_XHS

# 安裝依賴
pip install -r requirements.txt

# 喺 .env 檔案寫入 Cookie
COOKIE=你的小紅書Cookie

# 採集單個筆記
from xhs_utils import XHS
xhs = XHS()
note = xhs.get_note('筆記ID')
print(note)

之後你可以用 Python 腳本批量採集用戶筆記、搜尋關鍵詞、拎評論，仲可以將數據 save 做 JSON 或者 CSV。

進階玩法包括批量採集多個用戶、用 crontab 定時自動採集、同埋接入 AI Agent

整理重點

常見問題同注意事項

用呢個工具之前，呢啲嘢你一定要知，唔係好易出事。

採集會唔會封號？有風險，建議控制頻率、用分身號、唔好用主號

Cookie 會過期，一般幾日到幾星期，過期要重新拎

私密內容採集唔到，只能拎公開可見嘅

數據唔可以商用，呢個項目只供學習交流，否則有法律風險

總之，Spider_XHS 係一個好強大嘅工具，但一定要用得啱，尊重平台規則同用戶私隱，先至係長遠之計。

做小紅書營運？呢個工具令你效率提升一倍

前言：小紅書營運嘅痛，邊個明啊

兄弟們，做小紅書營運嘅有冇咁嘅經歷：

想分析競品賬號，要一個一個撳開筆記手動記錄
想收集熱門話題，翻咗幾百條筆記眼都花埋
想統計評論數據，複製貼上到手軟
想批量下載圖片影片，一張張右鍵儲存

最痛苦嘅係：

手動採集效率太低，一日採唔到幾多數據
想寫個腳本啦，小紅書反爬機制又複雜
網上揾嘅爬蟲工具，一係收費貴，一係唔好用

今日同大家介紹一個神器 —— Spider_XHS，一個開源嘅小紅書數據採集工具，令你一鍵抓取筆記、評論、用戶資訊！

Spider_XHS 係咩嘢？

簡單嚟講，呢個係一個開源免費嘅小紅書數據採集工具。

GitHub 上 5.1k+ Star，好多小紅書營運、數據分析師都用緊。

核心特點：

✅ 功能全面：筆記、評論、用戶資訊、搜尋都抓到
✅ 接口穩定：持續維護更新，適配小紅書最新接口
✅ AI 友好：支援接入 AI Agent，實現自動化營運
✅ 開源免費：代碼全面公開，可以二次開發

可以採集啲咩數據？

數據類型	說明
筆記詳情	標題、正文、圖片、影片、讚好數、收藏數、評論數
評論數據	評論內容、評論者、讚好數、回覆數
用戶資訊	暱稱、粉絲數、關注數、獲讚數、簡介
搜尋結果	關鍵詞搜尋嘅筆記列表
話題筆記	指定話題底下嘅所有筆記
用戶筆記	指定用戶發布嘅所有筆記

一句講曬：小紅書上面嘅公開數據，基本上都抓得到。

有咩用？

場景一：競品分析

想知道競品賬號發咗啲咩內容、數據點樣。

用 Spider_XHS 之後：

輸入競品用戶 ID，一鍵抓取所有筆記
分析標題規律、內容風格、發布時間
統計讚好/收藏/評論數據，找出爆款規律

場景二：熱門話題挖掘

想揾熱門話題蹭流量，但係唔知咩嘢火。

用 Spider_XHS 之後：

搜尋關鍵詞，抓取相關筆記
分析高頻詞、熱門標籤
揾到潛在爆款話題

場景三：用戶畫像分析

想了解目標用戶鍾意啲咩內容。

用 Spider_XHS 之後：

抓取目標用戶嘅評論數據
分析用戶關注嘅話題、興趣點
為內容創作提供方向

場景四：批量下載素材

需要大量圖片影片素材做二次創作。

用 Spider_XHS 之後：

批量下載筆記圖片、影片
自動儲存到本地
大大提高素材收集效率

場景五：AI 自動化營運

想用 AI 批量生成內容、自動發布。

用 Spider_XHS 之後：

採集競品數據餵俾 AI
AI 學習爆款規律，生成新內容
自動發布到小紅書

點樣用？一步一步教你

第一步：下載代碼

# 克隆項目
git clone https://github.com/cv-cat/Spider_XHS.git
cd Spider_XHS

第二步：安裝依賴

# 安裝 Python 依賴
pip install -r requirements.txt

第三步：配置 Cookie

小紅書需要登入之後先至可以採集數據。

打開瀏覽器，登入小紅書網頁版
按 F12 打開開發者工具
揾到 Network（網絡）標籤
重新整理頁面，揾到任意一個 request
複製 Cookie 字段

將 Cookie 貼上到 .env 檔案入面：

COOKIE=你的小紅書Cookie

第四步：執行採集

採集單個筆記：

from xhs_utils import XHS

xhs = XHS()
note = xhs.get_note('筆記ID')
print(note)

採集用戶所有筆記：

user_notes = xhs.get_user_notes('用戶ID')
for note in user_notes:
    print(note['title'])

搜尋關鍵詞：

results = xhs.search('穿搭', num=100)
for note in results:
    print(note['title'], note['likes'])

採集評論：

comments = xhs.get_comments('筆記ID')
for comment in comments:
    print(comment['content'])

第五步：儲存數據

採集嘅數據可以儲存做 JSON、CSV 等格式：

import json

# 保存為 JSON
with open('notes.json', 'w', encoding='utf-8') as f:
    json.dump(user_notes, f, ensure_ascii=False, indent=2)

進階玩法

批量採集多個用戶

user_ids = ['用戶ID1', '用戶ID2', '用戶ID3']

for user_id in user_ids:
    notes = xhs.get_user_notes(user_id)
    # 保存數據...

定時自動採集

用定時任務（crontab）每日自動採集：

# 每天凌晨 2 點執行
0 2 * * * cd /path/to/Spider_XHS && python main.py

接入 AI Agent

將採集嘅數據餵俾 AI，實現自動化營運：

# 採集爆款筆記
hot_notes = xhs.search('熱門關鍵詞', num=50)

# 發給 AI 分析
ai_analysis = ai_agent.analyze(hot_notes)

# AI 生成新內容
new_content = ai_agent.generate(ai_analysis)

# 自動發佈（需要額外開發）

常見問題

Q：採集會被封號嗎？

有一定風險，建議：

控制採集頻率，唔好頻繁請求
使用小號採集，唔好用主號
唔好採集得過於頻繁

Q：Cookie 會過期嗎？

會，一般幾日到幾星期不等。過期之後要重新獲取 Cookie。

Q：可以採集私密內容嗎？

唔得，只可以採集公開可見嘅內容。私密筆記、需要登入先睇到嘅內容冇辦法採集。

Q：數據可以商用嗎？

呢個項目僅供學習交流使用，採集嘅數據請唔好用喺商業用途，避免法律風險。

Q：點解有啲數據採集唔到？

小紅書有反爬機制，可能會：

限制請求頻率
返回驗證碼
封鎖賬號

建議降低採集頻率，或者使用代理 IP。

寫喺最後

Spider_XHS 係小紅書營運、數據分析嘅利器，可以大大提高數據採集效率。

但係請記住：

僅供學習交流使用
尊重用戶私隱
遵守平台規則
唔好用喺非法用途

合理使用，令工具為創作服務，而唔係成為數據嘅搬運工。

項目地址

GitHub：https://github.com/cv-cat/Spider_XHS

⚠️ 呢個項目僅供學習交流使用，禁止任何商業化行為

如果呢篇文章對你有幫助

歡迎讚好、在看、轉發三連！

做小紅書運營？這個工具讓你效率翻倍

前言：小紅書運營的痛，誰懂啊

兄弟們，做小紅書運營的有沒有這樣的經歷：

想分析競品賬號，得一個個點開筆記手動記錄
想收集熱門話題，翻了幾百條筆記眼睛都花了
想統計評論數據，複製粘貼到手軟
想批量下載圖片視頻，一張張右鍵保存

最痛苦的是：

手動採集效率太低，一天採不了多少數據
想寫個腳本吧，小紅書反爬機制又複雜
網上找的爬蟲工具，要麼收費貴，要麼不好用

今天給大家介紹一個神器 —— Spider_XHS，一個開源的小紅書數據採集工具，讓你一鍵抓取筆記、評論、用戶信息！

Spider_XHS 是什麼？

簡單說，這是一個開源免費的小紅書數據採集工具。

GitHub 上 5.1k+ Star，很多小紅書運營、數據分析師都在用。

核心特點：

✅ 功能全面：筆記、評論、用戶信息、搜索都能抓
✅ 接口穩定：持續維護更新，適配小紅書最新接口
✅ AI 友好：支持接入 AI Agent，實現自動化運營
✅ 開源免費：代碼全公開，可二次開發

能採集什麼數據？

數據類型	說明
筆記詳情	標題、正文、圖片、視頻、點贊數、收藏數、評論數
評論數據	評論內容、評論者、點贊數、回覆數
用戶信息	暱稱、粉絲數、關注數、獲贊數、簡介
搜索結果	關鍵詞搜索的筆記列表
話題筆記	指定話題下的所有筆記
用戶筆記	指定用戶發佈的所有筆記

一句話：小紅書上的公開數據，基本上都能抓。

有什麼用？

場景一：競品分析

想知道競品賬號發了什麼內容、數據怎麼樣。

用 Spider_XHS 後：

輸入競品用戶 ID，一鍵抓取所有筆記
分析標題規律、內容風格、發佈時間
統計點贊/收藏/評論數據，找出爆款規律

場景二：熱門話題挖掘

想找熱門話題蹭流量，但不知道什麼火。

用 Spider_XHS 後：

搜索關鍵詞，抓取相關筆記
分析高頻詞、熱門標籤
找到潛在爆款話題

場景三：用戶畫像分析

想了解目標用戶喜歡什麼內容。

用 Spider_XHS 後：

抓取目標用戶的評論數據
分析用戶關注的話題、興趣點
為內容創作提供方向

場景四：批量下載素材

需要大量圖片視頻素材做二次創作。

用 Spider_XHS 後：

批量下載筆記圖片、視頻
自動保存到本地
大大提高素材收集效率

場景五：AI 自動化運營

想用 AI 批量生成內容、自動發佈。

用 Spider_XHS 後：

採集競品數據餵給 AI
AI 學習爆款規律，生成新內容
自動發佈到小紅書

怎麼用？一步一步教你

第一步：下載代碼

# 克隆項目
git clone https://github.com/cv-cat/Spider_XHS.git
cd Spider_XHS

第二步：安裝依賴

# 安裝 Python 依賴
pip install -r requirements.txt

第三步：配置 Cookie

小紅書需要登錄後才能採集數據。

打開瀏覽器，登錄小紅書網頁版
按 F12 打開開發者工具
找到 Network（網絡）標籤
刷新頁面，找到任意一個請求
複製 Cookie 字段

把 Cookie 粘貼到 .env 文件中：

COOKIE=你的小紅書Cookie

第四步：運行採集

採集單個筆記：

from xhs_utils import XHS

xhs = XHS()
note = xhs.get_note('筆記ID')
print(note)

採集用戶所有筆記：

user_notes = xhs.get_user_notes('用戶ID')
for note in user_notes:
    print(note['title'])

搜索關鍵詞：

results = xhs.search('穿搭', num=100)
for note in results:
    print(note['title'], note['likes'])

採集評論：

comments = xhs.get_comments('筆記ID')
for comment in comments:
    print(comment['content'])

第五步：保存數據

採集的數據可以保存為 JSON、CSV 等格式：

import json

# 保存為 JSON
with open('notes.json', 'w', encoding='utf-8') as f:
    json.dump(user_notes, f, ensure_ascii=False, indent=2)

進階玩法

批量採集多個用戶

user_ids = ['用戶ID1', '用戶ID2', '用戶ID3']

for user_id in user_ids:
    notes = xhs.get_user_notes(user_id)
    # 保存數據...

定時自動採集

用定時任務（crontab）每天自動採集：

# 每天凌晨 2 點執行
0 2 * * * cd /path/to/Spider_XHS && python main.py

接入 AI Agent

把採集的數據餵給 AI，實現自動化運營：

# 採集爆款筆記
hot_notes = xhs.search('熱門關鍵詞', num=50)

# 發給 AI 分析
ai_analysis = ai_agent.analyze(hot_notes)

# AI 生成新內容
new_content = ai_agent.generate(ai_analysis)

# 自動發佈（需要額外開發）

常見問題

Q：採集會被封號嗎？

有一定風險，建議：

控制採集頻率，不要頻繁請求
使用小號採集，不要用主號
不要採集過於頻繁

Q：Cookie 會過期嗎？

會，一般幾天到幾周不等。過期後需要重新獲取 Cookie。

Q：能採集私密內容嗎？

不能，只能採集公開可見的內容。私密筆記、需要登錄才能看的內容無法採集。

Q：數據可以商用嗎？

本項目僅供學習交流使用，採集的數據請勿用於商業用途，避免法律風險。

Q：為什麼有些數據採不到？

小紅書有反爬機制，可能會：

限制請求頻率
返回驗證碼
封禁賬號

建議降低採集頻率，或使用代理 IP。

寫在最後

Spider_XHS 是小紅書運營、數據分析的利器，能大大提高數據採集效率。

但請記住：

僅供學習交流使用
尊重用戶隱私
遵守平台規則
不要用於非法用途

合理使用，讓工具為創作服務，而不是成為數據的搬運工。

項目地址

GitHub：https://github.com/cv-cat/Spider_XHS

⚠️ 本項目僅供學習交流使用，禁止任何商業化行為

如果這篇文章對你有幫助

歡迎點贊、在看、轉發三連！