告別玩具級 AI Agent!港大開源 OpenHarness,讓大模型真正落地幹活

作者:AI開源前哨
日期:2026年5月2日 上午1:01
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

港大開源OpenHarness框架,為AI Agent提供現成嘅手腳眼,解決落地難題

整理版摘要

呢篇文章出自公眾號「AI開源前哨」,介紹咗港大團隊開源嘅OpenHarness框架。作者指出,AI Agent開發嘅瓶頸唔係大模型本身,而係工具調用、上下文管理、權限控制等瑣碎問題。OpenHarness就係為咗解決呢個問題而推出嘅。

框架封裝咗Agent落地需要嘅通用能力,包括流式調用、工具並行、API重試、上下文壓縮、跨會話內存、多智能體協同、權限管控同生命週期鈎子。開發者唔使再處理底層邏輯,專注寫業務就得。另外,仲有一個叫ohmo嘅AI助手,可以接飛書、Slack等平台,自動完成開發流程。

整體結論係OpenHarness提供咗一個開放靈活嘅解決方案,支援多種模型API、內置43+工具、可擴展嘅插件生態,同埋嚴謹嘅權限管控同dry-run模式。對於想將AI Agent真正落地嘅團隊嚟講,呢個框架可以慳返大量開發時間同維護成本。

  • 結論OpenHarness係一個為AI Agent落地而設嘅開源框架,提供現成嘅工具調用、上下文管理同權限管控。
  • 方法:框架封裝流式調用、工具並行、API重試等底層能力,開發者只需寫業務邏輯。
  • 差異:支援多種模型API(包括國內外同本地),內置43+工具同插件生態,仲有AI助手ohmo可直接使用。
  • 啟發:權限管控分為默認、自動同計劃三種模式,配合dry-run模式,可以安全可控地執行Agent操作。
  • 可行動點:開發者可通過一行命令安裝OpenHarness,然後配置模型認證,即可開始使用,仲可以自定義工具同插件。
值得記低
連結 github.com

OpenHarness GitHub

開源框架項目地址,包含源碼、安裝指南同使用文檔。

整理重點

AI Agent落地瓶頸同OpenHarness嘅解方

搞Agent開發嘅人都知,大模型本身唔係瓶頸。真正卡進度嘅係啲瑣碎事——

工具調用點樣穩、上下文點樣管、權限點樣控

,唔同模型點樣兼容、IM平台點樣對接。呢啲搞唔掂,Demo再靚都上唔到線。

港大團隊開源咗OpenHarness

,一出就接近17k Star。佢俾大模型配咗一套現成嘅

手腳眼

,將Agent落地需要嘅通用能力都封裝好,開發者只需要寫業務邏輯就得。

整理重點

核心功能:全流程封裝,唔使自己煩底層

其中幾個關鍵能力包括

跨會話內存

多智能體協同

  1. 1 大模型流式調用:支援即時串流回應,唔使等曬先出。
  2. 2 工具並行執行:可以同時叫多個工具,加快流程。
  3. 3 API異常重試:自動處理臨時錯誤,提高穩定性。
  4. 4 上下文壓縮:控制token用量,避免超出限制。
  5. 5 跨會話內存:記住之前對話,支援長期任務。
  6. 6 多智能體協同:內置通訊協議,方便多Agent合作。
  7. 7 權限管控:分級權限,安全控制操作。
  8. 8 生命週期鈎子:喺工具執行前後加入自定義邏輯。
整理重點

AI助手ohmo同開放模型適配

OpenHarness仲帶咗一個完整嘅個人AI助手叫ohmo。接上飛書、SlackTelegramDiscord之後,ohmo能夠自己完成創建分支、寫代碼、跑測試、提PR成個開發流程,唔使喺度睇實。

ohmo直接複用你現有嘅Claude CodeCodex訂閲,唔使額外申請API Key,亦唔產生額外費用。

模型適配方面好開放。ClaudeOpenAIAPI用得,國內嘅月之暗面Kimi、智譜GLM、MiniMax都得,甚至GitHub Copilot訂閲同本地Ollama模型都接得到。切換模型就係改下配置文件,業務代碼唔使鬱。

43+工具

插件生態

  • 內置43+工具:文件讀寫、Shell執行、網頁搜索、內容抓取、MCP協議集成,每個工具自帶參數校驗、權限檢查同生命週期鈎子。
  • 技能系統同插件生態:兼容Claude Code嘅插件體系,現成嘅技能同插件可以直接用。
  • 自定義擴展:可以自訂工具、技能、插件,甚至擴展新嘅模型提供商。
整理重點

嚴謹權限管控同dry-run模式

dry-run模式

Agent可以自主執行Shell命令、改文件,安全問題繞唔過。OpenHarness嘅做法係多級權限:默認模式下所有寫操作同執行操作都要用戶確認;可以開自動模式喺

沙箱

放開權限;亦可以開

計劃模式

,完全禁止寫操作,淨係俾Agent出方案。

dry-run指令範例 bash
# 預覽完整交互式會話配置,不執行任何操作
oh --dry-run

# 預覽單條指令執行計劃,不調用模型、不運行工具
oh --dry-run -p "Review this bug fix and grep for failing tests"

# 預覽斜槓命令執行流程,不實際執行命令
oh --dry-run -p "/plugin list"

# 預覽結構化輸出結果(適配腳本/平台調用),僅生成計劃不執行
oh --dry-run -p "Explain this repository" --output-format json
整理重點

一行命令安裝,快速上手

安裝好簡單,Linux/macOS/WSL用curl,WindowsPowerShell,或者直接用pip裝。裝好之後跑oh setup(Windows用openh setup),跟住交互式嚮導揀模型、完成認證就得。

一行命令安裝

  1. 1 curl -fsSL https://raw.githubusercontent.com/HKUDS/OpenHarness/main/scripts/install.sh | bash
  2. 2 或者 pip install openharness-ai
  3. 3 跑 oh setup 設定模型
  4. 4 輸入 oh 啟動 TUI 介面,或者用 oh -p "指令" 非互動模式

項目地址:https://github.com/HKUDS/OpenHarness

 

 

"前哨君AI精選開源
內地地址:https://www.yaowendeep.cn 
國際地址:https://ai-projects-hub-six.vercel.app

最近見到一個啱啱開源就拎咗近萬Star嘅項目:HKUDS/OpenHarness

圖片

搞Agent開發嘅人都知,大模型本身唔係瓶頸。真正卡住進度嘅係啲瑣碎事——工具調用點樣穩、上下文點樣管、權限點樣控、唔同模型點樣兼容、IM平台點樣對接。呢啲嘢搞唔掂,Demo再靚都上唔到線。

OpenHarness就係針對呢個問題嚟嘅。佢俾大模型配咗一套現成嘅「手腳眼」,將Agent落地需要嘅通用能力都封裝好曬,開發者淨係需要寫業務邏輯就得。

圖片

佢到底解決咗啲咩

呢個框架圍繞Agent運行嘅全流程嚟做:大模型流式調用、工具並行執行、API異常重試、上下文壓縮、跨會話內存、多智能體協同、權限管控、生命週期鈎子。

圖片

講白啲,嗰啲你自己寫都會頭痛嘅底層邏輯,佢都幫你搞掂曬。

舉個例,你唔使再為咗處理工具調用嘅各種邊界情況寫一大堆try-catch,唔使再調試跨日嘅上下文丟失問題,亦唔使自己設計多智能體之間嘅通信協議。

自帶一個可以直接用嘅AI助手ohmo

比較得意嘅係,項目冇淨係停留喺框架層面,仲帶咗一個完整嘅個人AI助手叫ohmo。

接上飛書、Slack、Telegram、Discord之後,ohmo可以自己完成創建分支、寫代碼、跑測試、提PR呢一整套開發流程,唔使人睇住。

而且佢直接用你現有嘅Claude Code或Codex訂閲,唔使額外申請API Key,亦唔會產生額外費用。對已經在用Claude嘅開發者嚟講,等於白得一個7x24小時在線嘅代碼助手。

模型隨便揀,唔綁廠商

模型適配呢方面做得幾開放。ClaudeOpenAI嘅API用得,內地嘅月之暗面Kimi、智譜GLM、MiniMax都得,甚至GitHub Copilot訂閲、本地行嘅Ollama模型都可以接。

圖片

切換模型就係換一換配置文件,業務代碼唔使鬱。需要對比唔同模型效果或者做私有部署嘅團隊,呢度慳咗唔少功夫。

43+工具,開箱即用亦可以自己擴展

OpenHarness內置了43個工具文件讀寫、Shell執行、網頁搜索、內容抓取、MCP協議集成都有。每個工具自帶參數校驗、權限檢查同生命週期鈎子。

圖片

佢仲有一套技能系統同插件生態,兼容Claude Code嘅插件體系。Claude生態入面現成嘅技能同插件可以直接拎嚟用。唔夠嘅話,自定義工具、技能、插件,甚至擴展新嘅模型提供商,都得。

權限管控比較嚴謹

Agent可以自主執行Shell命令、改文件,安全問題係繞唔過嘅。

OpenHarness嘅做法係多級權限:默認模式下所有寫操作同執行操作都要用戶確認;可以開自動模式喺沙箱入面放開權限;亦可以開計劃模式,完全禁止寫操作,只俾Agent出方案。

仲可以配路徑級嘅訪問規則、高危命令黑名單,加上PreToolUsePostToolUse鈎子,基本可以控制住Agent嘅每一步操作。 

另外有個dry-run模式,可以預覽Agent會做啲咩操作,唔會真係調模型或者執行命令,上生產之前先跑一次比較放心。

# 預覽完整交互式會話配置,不執行任何操作
oh --dry-run

# 預覽單條指令執行計劃,不調用模型、不運行工具
oh --dry-run -p "Review this bug fix and grep for failing tests"

# 預覽斜槓命令執行流程,不實際執行命令
oh --dry-run -p "/plugin list"

# 預覽結構化輸出結果(適配腳本/平台調用),僅生成計劃不執行
oh --dry-run -p "Explain this repository" --output-format json

 

 

一行指令就裝好

Linux/macOS/WSL:

curl -fsSL https://raw.githubusercontent.com/HKUDS/OpenHarness/main/scripts/install.sh | bash

Windows PowerShell:

iex (Invoke-WebRequest -Uri 'https://raw.githubusercontent.com/HKUDS/OpenHarness/main/scripts/install.ps1')

或者用pip裝:

pip install openharness-ai

裝好之後行oh setup(Windows用openh setup),然後跟住交互式嚮導揀模型、完成認證就得。

配好之後輸入oh啟動TUI界面。非互動模式用-p參數:

oh -p "Explain this codebase"
oh -p "List all functions in main.py" --output-format json

圖片

啟動ohmo助手

三步:

  1. 1. ohmo init — 初始化工作空間
  2. 2. ohmo config — 配置聊天頻道同模型
  3. 3. ohmo gateway start — 啟動網關,助手上線




項目地址:https://github.com/HKUDS/OpenHarness

有興趣可以自己試下。你喺Agent開發入面踩過啲咩坑?留言區傾下。

歡迎置頂(標星)關注呢個公眾號「AI開源前哨」獲取有趣AI技術/工具分享,咁就可以第一時間收到推送啦~

圖片

GitHub爆紅:呢個AI開源神器,幫你淨係睇「有用資訊」


圖片

GitHub爆紅:呢個AI投研神器,將彭博終端做成免費開源咗


圖片

100% 免費 + 全本地!呢個 AI 音樂工具,直接打低 Suno 付費訂閲


圖片

解決咗我最大嘅焦慮:開源 AI 筆記,數據 100% 自己掌控


圖片

AI Agent 最大卡點,俾港大呢個開源項目解決咗

 

 

"前哨君"AI精選開源
國內地址:https://www.yaowendeep.cn 
國際地址:https://ai-projects-hub-six.vercel.app

最近看到一個剛開源就拿了近萬Star的項目:HKUDS/OpenHarness

圖片

搞Agent開發的人都知道,大模型本身不是瓶頸。真正卡進度的是那些瑣碎的事——工具調用怎麼穩、上下文怎麼管、權限怎麼控、不同模型怎麼兼容、IM平台怎麼對接。這些東西搞不好,Demo再漂亮也上不了線。

OpenHarness就是衝着這個問題來的。它給大模型配了一套現成的"手腳眼",把Agent落地需要的通用能力都封裝好了,開發者只需要寫業務邏輯就行。

圖片

它到底解決了什麼

這個框架圍繞Agent運行的全流程來做:大模型流式調用、工具並行執行、API異常重試、上下文壓縮、跨會話內存、多智能體協同、權限管控、生命週期鈎子。

圖片

說白了,那些你自己寫也會頭疼的底層邏輯,它都替你幹了。

舉個例子,你不用再為了處理工具調用的各種邊界情況寫一堆try-catch,不用再調試跨天的上下文丟失問題,也不用自己設計多智能體之間的通信協議。

自帶一個能直接用的AI助手ohmo

比較有意思的是,項目沒停留在框架層面,還帶了一個完整的個人AI助手叫ohmo。

接上飛書、Slack、Telegram、Discord之後,ohmo能自己完成創建分支、寫代碼、跑測試、提PR這一整套開發流程,不用人盯着。

而且它直接複用你現有的Claude Code或Codex訂閲,不用額外申請API Key,也不產生額外費用。對已經在用Claude的開發者來說,等於白得一個7x24小時在線的代碼助手。

模型隨便選,不綁廠商

模型適配這塊做得挺開放。ClaudeOpenAI的API能用,國內的月之暗面Kimi、智譜GLM、MiniMax也行,甚至GitHub Copilot訂閲、本地跑的Ollama模型都能接。

圖片

切換模型就是換一下配置文件,業務代碼不用動。需要對比不同模型效果或者做私有部署的團隊,這塊省了不少事。

43+工具,開箱即用也能自己擴展

OpenHarness內置了43個工具,文件讀寫、Shell執行、網頁搜索、內容抓取、MCP協議集成都有。每個工具自帶參數校驗、權限檢查和生命週期鈎子。

圖片

它還有一套技能系統和插件生態,兼容Claude Code的插件體系。Claude生態裏現成的技能和插件可以直接拿來用。不夠的話,自定義工具、技能、插件,甚至擴展新的模型提供商,都行。

權限管控比較嚴謹

Agent能自主執行Shell命令、改文件,安全問題是繞不過去的。

OpenHarness的做法是多級權限:默認模式下所有寫操作和執行操作都要用戶確認;可以開自動模式在沙箱裏放開權限;也能開計劃模式,完全禁止寫操作,只讓Agent出方案。

還能配路徑級的訪問規則、高危命令黑名單,加上PreToolUsePostToolUse鈎子,基本能控制住Agent的每一步操作。 

另外有個dry-run模式,能預覽Agent會做什麼操作,不會真的調模型或執行命令,上生產之前先跑一遍比較放心。

# 預覽完整交互式會話配置,不執行任何操作
oh --dry-run

# 預覽單條指令執行計劃,不調用模型、不運行工具
oh --dry-run -p "Review this bug fix and grep for failing tests"

# 預覽斜槓命令執行流程,不實際執行命令
oh --dry-run -p "/plugin list"

# 預覽結構化輸出結果(適配腳本/平台調用),僅生成計劃不執行
oh --dry-run -p "Explain this repository" --output-format json

 

 

一行命令裝上

Linux/macOS/WSL:

curl -fsSL https://raw.githubusercontent.com/HKUDS/OpenHarness/main/scripts/install.sh | bash

Windows PowerShell:

iex (Invoke-WebRequest -Uri 'https://raw.githubusercontent.com/HKUDS/OpenHarness/main/scripts/install.ps1')

或者pip裝:

pip install openharness-ai

裝好之後跑oh setup(Windows用openh setup),跟着交互式嚮導選模型、完成認證就行。

配好之後輸入oh啓動TUI界面。非交互模式用-p參數:

oh -p "Explain this codebase"
oh -p "List all functions in main.py" --output-format json

圖片

啓動ohmo助手

三步:

  1. 1. ohmo init — 初始化工作空間
  2. 2. ohmo config — 配置聊天頻道和模型
  3. 3. ohmo gateway start — 啓動網關,助手上線




項目地址:https://github.com/HKUDS/OpenHarness

感興趣可以自己試試。你在Agent開發中踩過什麼坑?評論區聊聊。

歡迎 置頂(標星)關注本公眾號「AI開源前哨」獲取有趣AI技術/工具分享,這樣就第一時間獲取推送啦~

圖片

GitHub爆火:這個AI開源神器,幫你只看“有用信息”


圖片

GitHub爆火:這個AI投研神器,把彭博終端做成免費開源了


圖片

100% 免費 + 全本地!這個 AI 音樂工具,直接幹翻 Suno 付費訂閲


圖片

解決了我最大的焦慮:開源 AI 筆記,數據 100% 自己掌控


圖片

AI Agent 最大卡點,被港大這個開源項目解決了