告別玩具級 AI Agent!港大開源 OpenHarness,讓大模型真正落地幹活
整理版優先睇
港大開源OpenHarness框架,為AI Agent提供現成嘅手腳眼,解決落地難題
呢篇文章出自公眾號「AI開源前哨」,介紹咗港大團隊開源嘅OpenHarness框架。作者指出,AI Agent開發嘅瓶頸唔係大模型本身,而係工具調用、上下文管理、權限控制等瑣碎問題。OpenHarness就係為咗解決呢個問題而推出嘅。
框架封裝咗Agent落地需要嘅通用能力,包括流式調用、工具並行、API重試、上下文壓縮、跨會話內存、多智能體協同、權限管控同生命週期鈎子。開發者唔使再處理底層邏輯,專注寫業務就得。另外,仲有一個叫ohmo嘅AI助手,可以接飛書、Slack等平台,自動完成開發流程。
整體結論係OpenHarness提供咗一個開放靈活嘅解決方案,支援多種模型API、內置43+工具、可擴展嘅插件生態,同埋嚴謹嘅權限管控同dry-run模式。對於想將AI Agent真正落地嘅團隊嚟講,呢個框架可以慳返大量開發時間同維護成本。
- 結論:OpenHarness係一個為AI Agent落地而設嘅開源框架,提供現成嘅工具調用、上下文管理同權限管控。
- 方法:框架封裝流式調用、工具並行、API重試等底層能力,開發者只需寫業務邏輯。
- 差異:支援多種模型API(包括國內外同本地),內置43+工具同插件生態,仲有AI助手ohmo可直接使用。
- 啟發:權限管控分為默認、自動同計劃三種模式,配合dry-run模式,可以安全可控地執行Agent操作。
- 可行動點:開發者可通過一行命令安裝OpenHarness,然後配置模型認證,即可開始使用,仲可以自定義工具同插件。
OpenHarness GitHub
開源框架項目地址,包含源碼、安裝指南同使用文檔。
AI Agent落地瓶頸同OpenHarness嘅解方
搞Agent開發嘅人都知,大模型本身唔係瓶頸。真正卡進度嘅係啲瑣碎事——
工具調用點樣穩、上下文點樣管、權限點樣控
,唔同模型點樣兼容、IM平台點樣對接。呢啲搞唔掂,Demo再靚都上唔到線。
港大團隊開源咗OpenHarness
,一出就接近17k Star。佢俾大模型配咗一套現成嘅
「手腳眼」
,將Agent落地需要嘅通用能力都封裝好,開發者只需要寫業務邏輯就得。
核心功能:全流程封裝,唔使自己煩底層
其中幾個關鍵能力包括:
跨會話內存
多智能體協同
- 1 大模型流式調用:支援即時串流回應,唔使等曬先出。
- 2 工具並行執行:可以同時叫多個工具,加快流程。
- 3 API異常重試:自動處理臨時錯誤,提高穩定性。
- 4 上下文壓縮:控制token用量,避免超出限制。
- 5 跨會話內存:記住之前對話,支援長期任務。
- 6 多智能體協同:內置通訊協議,方便多Agent合作。
- 7 權限管控:分級權限,安全控制操作。
- 8 生命週期鈎子:喺工具執行前後加入自定義邏輯。
AI助手ohmo同開放模型適配
OpenHarness仲帶咗一個完整嘅個人AI助手叫ohmo。接上飛書、Slack、Telegram、Discord之後,ohmo能夠自己完成創建分支、寫代碼、跑測試、提PR成個開發流程,唔使喺度睇實。
ohmo直接複用你現有嘅Claude Code或Codex訂閲,唔使額外申請API Key,亦唔產生額外費用。
模型適配方面好開放。Claude、OpenAI嘅API用得,國內嘅月之暗面Kimi、智譜GLM、MiniMax都得,甚至GitHub Copilot訂閲同本地Ollama模型都接得到。切換模型就係改下配置文件,業務代碼唔使鬱。
43+工具
插件生態
- 內置43+工具:文件讀寫、Shell執行、網頁搜索、內容抓取、MCP協議集成,每個工具自帶參數校驗、權限檢查同生命週期鈎子。
- 技能系統同插件生態:兼容Claude Code嘅插件體系,現成嘅技能同插件可以直接用。
- 自定義擴展:可以自訂工具、技能、插件,甚至擴展新嘅模型提供商。
嚴謹權限管控同dry-run模式
dry-run模式
Agent可以自主執行Shell命令、改文件,安全問題繞唔過。OpenHarness嘅做法係多級權限:默認模式下所有寫操作同執行操作都要用戶確認;可以開自動模式喺
沙箱
放開權限;亦可以開
計劃模式
,完全禁止寫操作,淨係俾Agent出方案。
# 預覽完整交互式會話配置,不執行任何操作
oh --dry-run
# 預覽單條指令執行計劃,不調用模型、不運行工具
oh --dry-run -p "Review this bug fix and grep for failing tests"
# 預覽斜槓命令執行流程,不實際執行命令
oh --dry-run -p "/plugin list"
# 預覽結構化輸出結果(適配腳本/平台調用),僅生成計劃不執行
oh --dry-run -p "Explain this repository" --output-format json
一行命令安裝,快速上手
安裝好簡單,Linux/macOS/WSL用curl,Windows用PowerShell,或者直接用pip裝。裝好之後跑oh setup(Windows用openh setup),跟住交互式嚮導揀模型、完成認證就得。
一行命令安裝
- 1 curl -fsSL https://raw.githubusercontent.com/HKUDS/OpenHarness/main/scripts/install.sh | bash
- 2 或者 pip install openharness-ai
- 3 跑 oh setup 設定模型
- 4 輸入 oh 啟動 TUI 介面,或者用 oh -p "指令" 非互動模式
項目地址:https://github.com/HKUDS/OpenHarness
最近見到一個啱啱開源就拎咗近萬Star嘅項目:HKUDS/OpenHarness。

搞Agent開發嘅人都知,大模型本身唔係瓶頸。真正卡住進度嘅係啲瑣碎事——工具調用點樣穩、上下文點樣管、權限點樣控、唔同模型點樣兼容、IM平台點樣對接。呢啲嘢搞唔掂,Demo再靚都上唔到線。
OpenHarness就係針對呢個問題嚟嘅。佢俾大模型配咗一套現成嘅「手腳眼」,將Agent落地需要嘅通用能力都封裝好曬,開發者淨係需要寫業務邏輯就得。

佢到底解決咗啲咩
呢個框架圍繞Agent運行嘅全流程嚟做:大模型流式調用、工具並行執行、API異常重試、上下文壓縮、跨會話內存、多智能體協同、權限管控、生命週期鈎子。

講白啲,嗰啲你自己寫都會頭痛嘅底層邏輯,佢都幫你搞掂曬。
舉個例,你唔使再為咗處理工具調用嘅各種邊界情況寫一大堆try-catch,唔使再調試跨日嘅上下文丟失問題,亦唔使自己設計多智能體之間嘅通信協議。
自帶一個可以直接用嘅AI助手ohmo
比較得意嘅係,項目冇淨係停留喺框架層面,仲帶咗一個完整嘅個人AI助手叫ohmo。
接上飛書、Slack、Telegram、Discord之後,ohmo可以自己完成創建分支、寫代碼、跑測試、提PR呢一整套開發流程,唔使人睇住。
而且佢直接用你現有嘅Claude Code或Codex訂閲,唔使額外申請API Key,亦唔會產生額外費用。對已經在用Claude嘅開發者嚟講,等於白得一個7x24小時在線嘅代碼助手。
模型隨便揀,唔綁廠商
模型適配呢方面做得幾開放。Claude、OpenAI嘅API用得,內地嘅月之暗面Kimi、智譜GLM、MiniMax都得,甚至GitHub Copilot訂閲、本地行嘅Ollama模型都可以接。

切換模型就係換一換配置文件,業務代碼唔使鬱。需要對比唔同模型效果或者做私有部署嘅團隊,呢度慳咗唔少功夫。
43+工具,開箱即用亦可以自己擴展
OpenHarness內置了43個工具文件讀寫、Shell執行、網頁搜索、內容抓取、MCP協議集成都有。每個工具自帶參數校驗、權限檢查同生命週期鈎子。

佢仲有一套技能系統同插件生態,兼容Claude Code嘅插件體系。Claude生態入面現成嘅技能同插件可以直接拎嚟用。唔夠嘅話,自定義工具、技能、插件,甚至擴展新嘅模型提供商,都得。
權限管控比較嚴謹
Agent可以自主執行Shell命令、改文件,安全問題係繞唔過嘅。
OpenHarness嘅做法係多級權限:默認模式下所有寫操作同執行操作都要用戶確認;可以開自動模式喺沙箱入面放開權限;亦可以開計劃模式,完全禁止寫操作,只俾Agent出方案。
仲可以配路徑級嘅訪問規則、高危命令黑名單,加上PreToolUse和PostToolUse鈎子,基本可以控制住Agent嘅每一步操作。
另外有個dry-run模式,可以預覽Agent會做啲咩操作,唔會真係調模型或者執行命令,上生產之前先跑一次比較放心。
# 預覽完整交互式會話配置,不執行任何操作
oh --dry-run
# 預覽單條指令執行計劃,不調用模型、不運行工具
oh --dry-run -p "Review this bug fix and grep for failing tests"
# 預覽斜槓命令執行流程,不實際執行命令
oh --dry-run -p "/plugin list"
# 預覽結構化輸出結果(適配腳本/平台調用),僅生成計劃不執行
oh --dry-run -p "Explain this repository" --output-format json
一行指令就裝好
Linux/macOS/WSL:
curl -fsSL https://raw.githubusercontent.com/HKUDS/OpenHarness/main/scripts/install.sh | bashWindows PowerShell:
iex (Invoke-WebRequest -Uri 'https://raw.githubusercontent.com/HKUDS/OpenHarness/main/scripts/install.ps1')或者用pip裝:
pip install openharness-ai裝好之後行oh setup(Windows用openh setup),然後跟住交互式嚮導揀模型、完成認證就得。
配好之後輸入oh啟動TUI界面。非互動模式用-p參數:
oh -p "Explain this codebase"
oh -p "List all functions in main.py" --output-format json
啟動ohmo助手
三步:
1. ohmo init— 初始化工作空間2. ohmo config— 配置聊天頻道同模型3. ohmo gateway start— 啟動網關,助手上線
項目地址:https://github.com/HKUDS/OpenHarness
有興趣可以自己試下。你喺Agent開發入面踩過啲咩坑?留言區傾下。
歡迎置頂(標星)關注呢個公眾號「AI開源前哨」獲取有趣AI技術/工具分享,咁就可以第一時間收到推送啦~





最近看到一個剛開源就拿了近萬Star的項目:HKUDS/OpenHarness。

搞Agent開發的人都知道,大模型本身不是瓶頸。真正卡進度的是那些瑣碎的事——工具調用怎麼穩、上下文怎麼管、權限怎麼控、不同模型怎麼兼容、IM平台怎麼對接。這些東西搞不好,Demo再漂亮也上不了線。
OpenHarness就是衝着這個問題來的。它給大模型配了一套現成的"手腳眼",把Agent落地需要的通用能力都封裝好了,開發者只需要寫業務邏輯就行。

它到底解決了什麼
這個框架圍繞Agent運行的全流程來做:大模型流式調用、工具並行執行、API異常重試、上下文壓縮、跨會話內存、多智能體協同、權限管控、生命週期鈎子。

說白了,那些你自己寫也會頭疼的底層邏輯,它都替你幹了。
舉個例子,你不用再為了處理工具調用的各種邊界情況寫一堆try-catch,不用再調試跨天的上下文丟失問題,也不用自己設計多智能體之間的通信協議。
自帶一個能直接用的AI助手ohmo
比較有意思的是,項目沒停留在框架層面,還帶了一個完整的個人AI助手叫ohmo。
接上飛書、Slack、Telegram、Discord之後,ohmo能自己完成創建分支、寫代碼、跑測試、提PR這一整套開發流程,不用人盯着。
而且它直接複用你現有的Claude Code或Codex訂閲,不用額外申請API Key,也不產生額外費用。對已經在用Claude的開發者來說,等於白得一個7x24小時在線的代碼助手。
模型隨便選,不綁廠商
模型適配這塊做得挺開放。Claude、OpenAI的API能用,國內的月之暗面Kimi、智譜GLM、MiniMax也行,甚至GitHub Copilot訂閲、本地跑的Ollama模型都能接。

切換模型就是換一下配置文件,業務代碼不用動。需要對比不同模型效果或者做私有部署的團隊,這塊省了不少事。
43+工具,開箱即用也能自己擴展
OpenHarness內置了43個工具,文件讀寫、Shell執行、網頁搜索、內容抓取、MCP協議集成都有。每個工具自帶參數校驗、權限檢查和生命週期鈎子。

它還有一套技能系統和插件生態,兼容Claude Code的插件體系。Claude生態裏現成的技能和插件可以直接拿來用。不夠的話,自定義工具、技能、插件,甚至擴展新的模型提供商,都行。
權限管控比較嚴謹
Agent能自主執行Shell命令、改文件,安全問題是繞不過去的。
OpenHarness的做法是多級權限:默認模式下所有寫操作和執行操作都要用戶確認;可以開自動模式在沙箱裏放開權限;也能開計劃模式,完全禁止寫操作,只讓Agent出方案。
還能配路徑級的訪問規則、高危命令黑名單,加上PreToolUse和PostToolUse鈎子,基本能控制住Agent的每一步操作。
另外有個dry-run模式,能預覽Agent會做什麼操作,不會真的調模型或執行命令,上生產之前先跑一遍比較放心。
# 預覽完整交互式會話配置,不執行任何操作
oh --dry-run
# 預覽單條指令執行計劃,不調用模型、不運行工具
oh --dry-run -p "Review this bug fix and grep for failing tests"
# 預覽斜槓命令執行流程,不實際執行命令
oh --dry-run -p "/plugin list"
# 預覽結構化輸出結果(適配腳本/平台調用),僅生成計劃不執行
oh --dry-run -p "Explain this repository" --output-format json
一行命令裝上
Linux/macOS/WSL:
curl -fsSL https://raw.githubusercontent.com/HKUDS/OpenHarness/main/scripts/install.sh | bashWindows PowerShell:
iex (Invoke-WebRequest -Uri 'https://raw.githubusercontent.com/HKUDS/OpenHarness/main/scripts/install.ps1')或者pip裝:
pip install openharness-ai裝好之後跑oh setup(Windows用openh setup),跟着交互式嚮導選模型、完成認證就行。
配好之後輸入oh啓動TUI界面。非交互模式用-p參數:
oh -p "Explain this codebase"
oh -p "List all functions in main.py" --output-format json
啓動ohmo助手
三步:
1. ohmo init— 初始化工作空間2. ohmo config— 配置聊天頻道和模型3. ohmo gateway start— 啓動網關,助手上線
項目地址:https://github.com/HKUDS/OpenHarness
感興趣可以自己試試。你在Agent開發中踩過什麼坑?評論區聊聊。
歡迎 置頂(標星)關注本公眾號「AI開源前哨」獲取有趣AI技術/工具分享,這樣就第一時間獲取推送啦~




