小紅書數據採集神器!一鍵抓取筆記、評論、用戶信息
整理版優先睇
Spider_XHS 係一個開源免費嘅小紅書數據採集工具,可以一鍵抓取筆記、評論、用戶信息,大幅提升運營效率。
呢篇文章係由一位小紅書運營者分享嘅,佢成日要手動採集數據,覺得好痛苦,所以介紹咗一個叫 Spider_XHS 嘅開源工具。呢個工具喺 GitHub 有 5.1k+ Star,好多運營同數據分析師都用緊。文章指出,傳統手動採集效率低,而 Spider_XHS 功能全面、接口穩定、支援 AI 整合,仲要係免費嘅,可以一次過解決呢啲問題。整體結論係:呢個工具好實用,但一定要小心使用,唔好亂嚟。
Spider_XHS 可以幫你抓取公開嘅筆記內容、評論、用戶資料、搜尋結果等,基本上小紅書上見到嘅公開數據都得。文章仲列咗好多實際應用場景,例如競品分析、熱門話題挖掘、用戶畫像、批量下載同 AI 自動化運營。使用步驟都好簡單,只要 clone 個 repo、安裝依賴、設定好 Cookie 就可以開始採集。
不過,作者都提醒咗幾個注意點:採集太密可能會被封號,Cookie 會過期,私密內容係拎唔到嘅,而且數據唔可以用喺商業用途。總括嚟講,Spider_XHS 係一個好強大嘅工具,但要用得啱,尊重平台規則同用戶私隱。
- Spider_XHS 係開源免費小紅書數據採集工具,GitHub 5.1k+ Star,可抓筆記、評論、用戶信息等公開數據。
- 安裝簡單:git clone、pip install、設定 Cookie 就得;支援批量採集、定時任務同 AI Agent 整合。
- 主要場景:競品分析、熱門話題挖掘、用戶畫像、批量下載素材、AI 自動化內容生成。
- 注意風險:控制頻率避免封號、Cookie 會過期、只能採公開內容、不可商用。
- 相比其他付費工具,Spider_XHS 最大優勢係免費開源、可二次開發,而且持續更新適配小紅書接口。
Spider_XHS GitHub 專案
小紅書數據採集工具,開源免費,支援筆記、評論、用戶信息等數據抓取。
小紅書運營嘅痛,呢個工具幫到手
做小紅書運營嘅各位,有冇試過要逐個點開筆記手動記低數據?想收集熱門話題,見到眼花都未搞掂?Spider_XHS 就係為咗解決呢啲問題而嚟嘅。
- 功能全面:筆記、評論、用戶信息、搜尋結果通通得
- 接口穩定:成日跟小紅書更新,唔怕用用下失效
- AI 友好:可以接入 AI Agent,做到自動化運營
- 開源免費:成個源碼公開,你可以自己改裝
可以採集啲咩數據?
呢個工具可以幫你一次過拎曬小紅書上公開嘅數據,唔使自己慢慢 copy。
筆記詳情包括標題、正文、圖片、影片、讚好數、收藏數、評論數
評論數據可以拎到評論內容、評論者、讚好數、回覆數
用戶信息有暱稱、粉絲數、關注數、獲讚數、簡介
搜尋結果 keyword 搜尋後嘅筆記列表
話題筆記:指定話題下嘅所有筆記,用戶筆記:指定用戶全部筆記
一句講曬:小紅書上面你見到嘅公開數據,基本上都用呢個工具拎到,唔使自己逐個記。
實際應用場景,幫你慳時間
Spider_XHS 唔單止係一個數據採集工具,仲可以配合好多運營需要。以下係幾個常見嘅用法:
- 1 競品分析:輸入對手用戶 ID,一鍵拎曬佢啲筆記,分析標題規律、內容風格、發佈時間,仲可以統計讚好收藏評論,找出爆款路數。
- 2 熱門話題挖掘:搜尋關鍵詞,拎返相關筆記,分析高頻詞同標籤,幫你揾出潛在爆款話題。
- 3 用戶畫像:抓目標用戶嘅評論數據,分析佢哋關心嘅話題同興趣點,內容創作方向就清晰曬。
- 4 批量下載素材:需要大量圖片影片做二次創作?一鍵批量下載,慳返好多時間。
- 5 AI 自動化運營:將競品數據餵畀 AI,等 AI 學習爆款規律,再生成新內容,甚至可以配合自動發佈(要自己開發)。
點樣用?一步一步嚟
成個流程好簡單,只要你有基本嘅 Python 知識就可以搞掂。
第一步:git clone 個專案
第二步:pip install -r requirements.txt 裝依賴
第三步:設定 Cookie,呢步最關鍵
# 克隆專案
git clone https://github.com/cv-cat/Spider_XHS.git
cd Spider_XHS
# 安裝依賴
pip install -r requirements.txt
# 喺 .env 檔案寫入 Cookie
COOKIE=你的小紅書Cookie
# 採集單個筆記
from xhs_utils import XHS
xhs = XHS()
note = xhs.get_note('筆記ID')
print(note)
之後你可以用 Python 腳本批量採集用戶筆記、搜尋關鍵詞、拎評論,仲可以將數據 save 做 JSON 或者 CSV。
進階玩法包括批量採集多個用戶、用 crontab 定時自動採集、同埋接入 AI Agent
常見問題同注意事項
用呢個工具之前,呢啲嘢你一定要知,唔係好易出事。
採集會唔會封號?有風險,建議控制頻率、用分身號、唔好用主號
Cookie 會過期,一般幾日到幾星期,過期要重新拎
私密內容採集唔到,只能拎公開可見嘅
數據唔可以商用,呢個項目只供學習交流,否則有法律風險
總之,Spider_XHS 係一個好強大嘅工具,但一定要用得啱,尊重平台規則同用戶私隱,先至係長遠之計。
做小紅書營運?呢個工具令你效率提升一倍
前言:小紅書營運嘅痛,邊個明啊

兄弟們,做小紅書營運嘅有冇咁嘅經歷:
想分析競品賬號,要一個一個撳開筆記手動記錄 想收集熱門話題,翻咗幾百條筆記眼都花埋 想統計評論數據,複製貼上到手軟 想批量下載圖片影片,一張張右鍵儲存
最痛苦嘅係:
手動採集效率太低,一日採唔到幾多數據 想寫個腳本啦,小紅書反爬機制又複雜 網上揾嘅爬蟲工具,一係收費貴,一係唔好用
今日同大家介紹一個神器 —— Spider_XHS,一個開源嘅小紅書數據採集工具,令你一鍵抓取筆記、評論、用戶資訊!

Spider_XHS 係咩嘢?
簡單嚟講,呢個係一個開源免費嘅小紅書數據採集工具。
GitHub 上 5.1k+ Star,好多小紅書營運、數據分析師都用緊。
核心特點:
✅ 功能全面:筆記、評論、用戶資訊、搜尋都抓到 ✅ 接口穩定:持續維護更新,適配小紅書最新接口 ✅ AI 友好:支援接入 AI Agent,實現自動化營運 ✅ 開源免費:代碼全面公開,可以二次開發
可以採集啲咩數據?
| 筆記詳情 | |
| 評論數據 | |
| 用戶資訊 | |
| 搜尋結果 | |
| 話題筆記 | |
| 用戶筆記 |
一句講曬:小紅書上面嘅公開數據,基本上都抓得到。
有咩用?
場景一:競品分析
想知道競品賬號發咗啲咩內容、數據點樣。
用 Spider_XHS 之後:
輸入競品用戶 ID,一鍵抓取所有筆記 分析標題規律、內容風格、發布時間 統計讚好/收藏/評論數據,找出爆款規律
場景二:熱門話題挖掘
想揾熱門話題蹭流量,但係唔知咩嘢火。
用 Spider_XHS 之後:
搜尋關鍵詞,抓取相關筆記 分析高頻詞、熱門標籤 揾到潛在爆款話題
場景三:用戶畫像分析
想了解目標用戶鍾意啲咩內容。
用 Spider_XHS 之後:
抓取目標用戶嘅評論數據 分析用戶關注嘅話題、興趣點 為內容創作提供方向
場景四:批量下載素材
需要大量圖片影片素材做二次創作。
用 Spider_XHS 之後:
批量下載筆記圖片、影片 自動儲存到本地 大大提高素材收集效率
場景五:AI 自動化營運
想用 AI 批量生成內容、自動發布。
用 Spider_XHS 之後:
採集競品數據餵俾 AI AI 學習爆款規律,生成新內容 自動發布到小紅書
點樣用?一步一步教你
第一步:下載代碼
# 克隆項目
git clone https://github.com/cv-cat/Spider_XHS.git
cd Spider_XHS
第二步:安裝依賴
# 安裝 Python 依賴
pip install -r requirements.txt
第三步:配置 Cookie
小紅書需要登入之後先至可以採集數據。
打開瀏覽器,登入小紅書網頁版 按 F12 打開開發者工具 揾到 Network(網絡)標籤 重新整理頁面,揾到任意一個 request 複製 Cookie 字段
將 Cookie 貼上到 .env 檔案入面:
COOKIE=你的小紅書Cookie
第四步:執行採集
採集單個筆記:
from xhs_utils import XHS
xhs = XHS()
note = xhs.get_note('筆記ID')
print(note)
採集用戶所有筆記:
user_notes = xhs.get_user_notes('用戶ID')
for note in user_notes:
print(note['title'])
搜尋關鍵詞:
results = xhs.search('穿搭', num=100)
for note in results:
print(note['title'], note['likes'])
採集評論:
comments = xhs.get_comments('筆記ID')
for comment in comments:
print(comment['content'])
第五步:儲存數據
採集嘅數據可以儲存做 JSON、CSV 等格式:
import json
# 保存為 JSON
with open('notes.json', 'w', encoding='utf-8') as f:
json.dump(user_notes, f, ensure_ascii=False, indent=2)
進階玩法
批量採集多個用戶
user_ids = ['用戶ID1', '用戶ID2', '用戶ID3']
for user_id in user_ids:
notes = xhs.get_user_notes(user_id)
# 保存數據...
定時自動採集
用定時任務(crontab)每日自動採集:
# 每天凌晨 2 點執行
0 2 * * * cd /path/to/Spider_XHS && python main.py
接入 AI Agent
將採集嘅數據餵俾 AI,實現自動化營運:
# 採集爆款筆記
hot_notes = xhs.search('熱門關鍵詞', num=50)
# 發給 AI 分析
ai_analysis = ai_agent.analyze(hot_notes)
# AI 生成新內容
new_content = ai_agent.generate(ai_analysis)
# 自動發佈(需要額外開發)
常見問題
Q:採集會被封號嗎?
有一定風險,建議:
控制採集頻率,唔好頻繁請求 使用小號採集,唔好用主號 唔好採集得過於頻繁
Q:Cookie 會過期嗎?
會,一般幾日到幾星期不等。過期之後要重新獲取 Cookie。
Q:可以採集私密內容嗎?
唔得,只可以採集公開可見嘅內容。私密筆記、需要登入先睇到嘅內容冇辦法採集。
Q:數據可以商用嗎?
呢個項目僅供學習交流使用,採集嘅數據請唔好用喺商業用途,避免法律風險。
Q:點解有啲數據採集唔到?
小紅書有反爬機制,可能會:
限制請求頻率 返回驗證碼 封鎖賬號
建議降低採集頻率,或者使用代理 IP。
寫喺最後
Spider_XHS 係小紅書營運、數據分析嘅利器,可以大大提高數據採集效率。
但係請記住:
僅供學習交流使用 尊重用戶私隱 遵守平台規則 唔好用喺非法用途
合理使用,令工具為創作服務,而唔係成為數據嘅搬運工。
項目地址
GitHub:https://github.com/cv-cat/Spider_XHS

⚠️ 呢個項目僅供學習交流使用,禁止任何商業化行為
如果呢篇文章對你有幫助
歡迎讚好、在看、轉發三連!
做小紅書運營?這個工具讓你效率翻倍
前言:小紅書運營的痛,誰懂啊

兄弟們,做小紅書運營的有沒有這樣的經歷:
想分析競品賬號,得一個個點開筆記手動記錄 想收集熱門話題,翻了幾百條筆記眼睛都花了 想統計評論數據,複製粘貼到手軟 想批量下載圖片視頻,一張張右鍵保存
最痛苦的是:
手動採集效率太低,一天採不了多少數據 想寫個腳本吧,小紅書反爬機制又複雜 網上找的爬蟲工具,要麼收費貴,要麼不好用
今天給大家介紹一個神器 —— Spider_XHS,一個開源的小紅書數據採集工具,讓你一鍵抓取筆記、評論、用戶信息!

Spider_XHS 是什麼?
簡單說,這是一個開源免費的小紅書數據採集工具。
GitHub 上 5.1k+ Star,很多小紅書運營、數據分析師都在用。
核心特點:
✅ 功能全面:筆記、評論、用戶信息、搜索都能抓 ✅ 接口穩定:持續維護更新,適配小紅書最新接口 ✅ AI 友好:支持接入 AI Agent,實現自動化運營 ✅ 開源免費:代碼全公開,可二次開發
能採集什麼數據?
| 筆記詳情 | |
| 評論數據 | |
| 用戶信息 | |
| 搜索結果 | |
| 話題筆記 | |
| 用戶筆記 |
一句話:小紅書上的公開數據,基本上都能抓。
有什麼用?
場景一:競品分析
想知道競品賬號發了什麼內容、數據怎麼樣。
用 Spider_XHS 後:
輸入競品用戶 ID,一鍵抓取所有筆記 分析標題規律、內容風格、發佈時間 統計點贊/收藏/評論數據,找出爆款規律
場景二:熱門話題挖掘
想找熱門話題蹭流量,但不知道什麼火。
用 Spider_XHS 後:
搜索關鍵詞,抓取相關筆記 分析高頻詞、熱門標籤 找到潛在爆款話題
場景三:用戶畫像分析
想了解目標用戶喜歡什麼內容。
用 Spider_XHS 後:
抓取目標用戶的評論數據 分析用戶關注的話題、興趣點 為內容創作提供方向
場景四:批量下載素材
需要大量圖片視頻素材做二次創作。
用 Spider_XHS 後:
批量下載筆記圖片、視頻 自動保存到本地 大大提高素材收集效率
場景五:AI 自動化運營
想用 AI 批量生成內容、自動發佈。
用 Spider_XHS 後:
採集競品數據餵給 AI AI 學習爆款規律,生成新內容 自動發佈到小紅書
怎麼用?一步一步教你
第一步:下載代碼
# 克隆項目
git clone https://github.com/cv-cat/Spider_XHS.git
cd Spider_XHS
第二步:安裝依賴
# 安裝 Python 依賴
pip install -r requirements.txt
第三步:配置 Cookie
小紅書需要登錄後才能採集數據。
打開瀏覽器,登錄小紅書網頁版 按 F12 打開開發者工具 找到 Network(網絡)標籤 刷新頁面,找到任意一個請求 複製 Cookie 字段
把 Cookie 粘貼到 .env 文件中:
COOKIE=你的小紅書Cookie
第四步:運行採集
採集單個筆記:
from xhs_utils import XHS
xhs = XHS()
note = xhs.get_note('筆記ID')
print(note)
採集用戶所有筆記:
user_notes = xhs.get_user_notes('用戶ID')
for note in user_notes:
print(note['title'])
搜索關鍵詞:
results = xhs.search('穿搭', num=100)
for note in results:
print(note['title'], note['likes'])
採集評論:
comments = xhs.get_comments('筆記ID')
for comment in comments:
print(comment['content'])
第五步:保存數據
採集的數據可以保存為 JSON、CSV 等格式:
import json
# 保存為 JSON
with open('notes.json', 'w', encoding='utf-8') as f:
json.dump(user_notes, f, ensure_ascii=False, indent=2)
進階玩法
批量採集多個用戶
user_ids = ['用戶ID1', '用戶ID2', '用戶ID3']
for user_id in user_ids:
notes = xhs.get_user_notes(user_id)
# 保存數據...
定時自動採集
用定時任務(crontab)每天自動採集:
# 每天凌晨 2 點執行
0 2 * * * cd /path/to/Spider_XHS && python main.py
接入 AI Agent
把採集的數據餵給 AI,實現自動化運營:
# 採集爆款筆記
hot_notes = xhs.search('熱門關鍵詞', num=50)
# 發給 AI 分析
ai_analysis = ai_agent.analyze(hot_notes)
# AI 生成新內容
new_content = ai_agent.generate(ai_analysis)
# 自動發佈(需要額外開發)
常見問題
Q:採集會被封號嗎?
有一定風險,建議:
控制採集頻率,不要頻繁請求 使用小號採集,不要用主號 不要採集過於頻繁
Q:Cookie 會過期嗎?
會,一般幾天到幾周不等。過期後需要重新獲取 Cookie。
Q:能採集私密內容嗎?
不能,只能採集公開可見的內容。私密筆記、需要登錄才能看的內容無法採集。
Q:數據可以商用嗎?
本項目僅供學習交流使用,採集的數據請勿用於商業用途,避免法律風險。
Q:為什麼有些數據採不到?
小紅書有反爬機制,可能會:
限制請求頻率 返回驗證碼 封禁賬號
建議降低採集頻率,或使用代理 IP。
寫在最後
Spider_XHS 是小紅書運營、數據分析的利器,能大大提高數據採集效率。
但請記住:
僅供學習交流使用 尊重用戶隱私 遵守平台規則 不要用於非法用途
合理使用,讓工具為創作服務,而不是成為數據的搬運工。
項目地址
GitHub:https://github.com/cv-cat/Spider_XHS

⚠️ 本項目僅供學習交流使用,禁止任何商業化行為
如果這篇文章對你有幫助
歡迎點贊、在看、轉發三連!