一個軟件幹掉10個會員:AI摳圖、人聲分離、格式轉換,這個300MB的開源工具全免費

作者:神器每日推送
日期:2026年3月20日 上午10:35
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

MTools:免費開源本地AI工具箱,整合摳圖、轉換、語音轉文字,取代多個付費會員工具

整理版摘要

作者幫朋友處理證件照,發現要用remove.bg、PhotoshopTinyPNG三個軟件,仲要上傳數據,搞咗成二十分鐘。呢個經歷令佢反思:工具太多、功能割裂、會員費貴,而且數據私隱成疑。

佢發現一個叫MTools嘅開源項目,開發者HG-ha一個人整嘅,300MB壓縮包,解壓即用。功能包括AI摳圖、證件照、人聲分離、格式轉換、壓縮、語音轉文字等,全部本地處理,唔使上傳,唔使會員。實測AI摳圖七秒鐘,髮絲邊緣比remove.bg免費版更細緻;語音轉文字40秒處理10分鐘錄音;圖片壓縮效果同TinyPNG差唔多,但冇額度限制。

文章結論係MTools整合咗十幾個付費軟件嘅核心功能,免費開源,本地優先,數據安全。雖然有侷限(需要N卡、模型佔空間、冇移動版、個人開發),但好適合需要多種工具嘅內容創作者。作者建議去GitHub下載,用得好就畀個Star

  • MTools整合AI摳圖、證件照、語音轉文字、格式轉換、壓縮等十多種功能,全部免費開源,本地處理。
  • 同remove.bg、飛書妙記、TinyPNG等在線工具比較,MTools唔使上傳數據,冇會員限制,私隱安全得多。
  • 實測效果好:AI摳圖七秒完成、語音轉文字40秒處理10分鐘錄音、壓縮效果同TinyPNG同等質素。
  • 需注意:AI功能依賴NVIDIA CUDA加速,首次使用要下載模型文件(幾個GB),冇移動版,個人開發更新不穩定。
  • 可行動:按硬件選擇普通版/CUDA版/CUDA_FULL版;去GitHub下載並畀Star支持開發者。
值得記低
連結 github.com

GitHub官方下載

開發者HG-ha嘅MTools release頁面,下載最新版本

連結 openlist.wer.plus

國內鏡像下載

更快嘅下載地址,適合國內用戶

整理重點

從一張證件照講起:工具太多,反而更慢

作者幫朋友處理證件照,要換背景、調尺寸、扣髮絲邊緣。佢先打開

remove.bg

——要會員。打開

Photoshop

——導出發現文件太大,要壓縮。打開

TinyPNG

——但要上傳朋友嘅臉,有私隱顧慮。最後用咗三個軟件,搞咗二十分鐘。作者感嘆:五分鐘搞掂嘅嘢,因為工具分散、功能割裂,硬生生拖成半小時。

整理重點

MTools 功能實測:本地處理,快過雲端

MTools係一個開源項目,開發者係HG-ha,一個人。當前版本v0.0.8,更新日期2026年1月。解壓300MB,雙擊exe,冇註冊冇登錄冇升級彈窗。界面左邊功能分類:AI工具、圖片工具、音視頻工具、開發工具;右邊係操作區域。

  • AI摳圖:上傳人物相,七秒鐘移除背景,髮絲邊緣處理得比remove.bg免費版更精細,而且本地處理,唔上傳。
  • 證件照:自動換藍底,自動裁剪一寸,remove.bg要Pro會員先用得。MTools免費。
  • 音視頻轉文字:10分鐘錄音,RTX 3060用CUDA版,40秒出文字稿,連語氣詞都識別,可導出SRT字幕。同樣操作喺飛書妙記要5-10分鐘排隊,免費版有時長限制。
  • 圖片壓縮:5MB PNG用pngquant引擎壓到1.1MB,同TinyPNG嘅1.2MB差唔多,但冇額度限制,壓幾多都得。

另外仲有格式轉換(12種互轉、支援批量)、視頻處理(H.264/H.265編碼、速度調整)、人聲分離(UVR MDX-Net模型)、視頻插幀、超分辨率放大等。每個功能單獨拎出嚟都係一款付費軟件嘅主打,但MTools全部整合,免費開源。

整理重點

你的文件去咗邊?數據私隱唔可以忽視

作者翻查瀏覽器記錄,發現過去一個月上傳咗好多文件到各種在線工具。佢提醒:你嘅文件上傳到服務商雲端,處理完之後,可能保留一段時間,甚至用嚟訓練模型。

用戶協議冇人睇

——2023年4月三星員工將敏感代碼上傳ChatGPT導致洩密,就係一個教訓。

本地處理係唯一正確選擇

尤其係含人臉嘅相、商業機密、對話錄音。MTools嘅邏輯好簡單:AI模型放你電腦,用你顯卡跑,文件唔離開硬盤。

整理重點

唔係萬能:四點限制要先知

MTools雖然強大,但唔係完美。作者誠實講出限制,避免過度營銷。

  1. 1 需要NVIDIA CUDA加速:AI功能用AMD顯卡或核顯會慢好多。開發者提供三個版本:普通版(127MB,適合冇獨顯)、CUDA版(GTX 1060/3060等中端)、CUDA_FULL版(RTX 3070以上)。普通版只做格式轉換同壓縮都夠用。
  2. 2 模型文件佔硬盤空間:首次用AI功能會自動下載模型,加埋幾個GB,128GB SSD輕薄本要注意。
  3. 3 冇移動端:目前只有桌面端(Windows/Linux/Mac),用手機處理內容嘅用戶幫唔到手。
  4. 4 個人開發者作品:更新唔似商業軟件穩定,遇到Bug未必即刻修復,但開源代碼可審計,係信任優勢。

只講好處唔講限制嘅推薦,同嗰啲「升級Pro版解鎖功能」嘅彈窗一樣,都係消費你嘅信任。

整理重點

工具應該服務於人,唔係反過來

回到開頭張證件照,如果一早用MTools:打開軟件,選證件照製作,上傳,揀藍底一寸,確定。兩分鐘搞掂,唔註冊唔上傳唔使錢。

作者反思:過去幾年軟件趨勢係將一個功能做成一個App,然後收月費。你為十幾個功能,裝咗十幾個軟件,付咗十幾個會員,月底睇賬單——好傢伙。

工具應該服務於人,而唔係人服務於工具

MTools只係將呢啲功能集成到本地,免費開源。唔係顛覆性創新,而係產品理念嘅回歸。一個300MB壓縮包,解壓即用。

圖片

尋日幫朋友搞一張證件相。

換背景,較尺寸,整走啲亂嘅髮絲邊。聽落好簡單啫?我開咗remove.bg——要會員。開咗Photoshop——匯出發現檔案太大,要壓縮。開咗TinyPNG——上載張相嘅時候猶豫咗一下:呢張相有朋友個樣,我確定要上載去人哋嘅伺服器咩?

最後我用咗三個軟件,用咗二十分鐘,搞咗一張證件相。

你有冇試過呢種情況?一個五分鐘搞得掂嘅嘢,因為工具分散、功能割裂、中間仲要不停上載下載,硬係拖到半個鐘。

唔係你效率低。係呢個時代嘅工具太多喇。


一個300MB嘅壓縮包

喺GitHub兜咗一圈,見到一個開源項目,叫MTools,開發者ID係HG-ha,一個人。冇公司,冇PR團隊,冇融資新聞。項目喺GitHub上當前版本係v0.0.8,最近一次更新係2026年1月。

我下載咗。解壓完300MB多少少。

雙擊exe,彈出一個視窗。冇註冊,冇登入,冇「升級到專業版解鎖更多功能」嘅彈窗。

圖片

介面好簡單,左邊係功能分類——AI工具、圖片工具、音視頻工具、開發工具,右邊係操作區。乾淨利落,冇廣告,冇彈窗。

我試咗幾樣嘢。

AI摳圖

上載咗一張有人嘅户外相,撳「開始處理」。七秒之後,背景乾淨咁被移走咗,髮絲邊緣處理得比remove.bg嘅免費版更仔細。

跟住我試咗證件相功能。自動換藍底,自動裁剪到一寸尺寸。唔使較參數,唔使手動摳。

圖片

呢個功能喺remove.bg要Pro會員先用得。喺MTools度,免費。

分別係:remove.bg喺雲端處理,你嘅相上載去人哋嘅伺服器。MTools喺本地處理,模型下載去你自己嘅硬碟,你嘅相從唔離開你嘅電腦。

音視頻轉文字

我掉咗一段上禮拜訪問嘅錄音入去,大約10分鐘。

我電腦係RTX 3060顯示卡,用嘅係CUDA版MTools。大約40秒,完整嘅文字稿出咗嚟,連語氣詞同停頓都識別埋,可以直接匯出做SRT字幕檔案。

圖片

40秒處理10分鐘錄音。我睇住成個畫面嘅文字稿呆咗幾秒。

喺飛書妙記度,同樣嘅操作要上載錄音,等雲端排隊處理,通常要5到10分鐘——取決於伺服器忙唔忙。飛書妙記嘅語音轉文字功能喺免費版有時長限制,超出要買團隊版。

圖片壓縮

一張5MB嘅PNG圖片,用MTools內置嘅pngquant引擎壓縮,出嚟1.1MB。畫質肉眼睇唔出分別。

圖片

同TinyPNG對比咗一下,TinyPNG壓完1.2MB。效果幾乎一樣。

分別都係嗰個:TinyPNG要上載,MTools喺本地處理。而且TinyPNG有免費額度限制,超出要比錢。MTools冇額度限制,冇收費,你有幾多圖壓幾多。

除此之外,MTools仲塞咗一堆功能落去:

  • 格式轉換
    ——JPG、PNG、WebP、GIF、BMP、TIFF等12種格式互轉,支援批量處理
  • 視頻處理
    ——H.264/H.265編碼,比特率自訂,速度調整唔變音調
  • 人聲分離
    ——用嘅係UVR MDX-Net模型,效果接近專業級
  • 視頻插幀
    ——低幀率視頻補幀到流暢
  • 超分辨率放大
    ——720p修復到2K

呢啲功能,每一個單獨拎出嚟,都係一款付費軟件嘅主打功能。

MTools將佢哋全部塞曬入一個300MB嘅安裝包裏面。

圖片
圖片

免費。開源。

試曬呢啲功能之後,我第一時間唔係發朋友圈推介,而係翻咗一下自己嘅瀏覽器歷史記錄——過去一個月,我到底上載咗幾多檔案去各種在線工具?

結果令我自己都嚇咗一跳。


你啲檔案去咗邊?

你用過嗰啲在線AI工具——AI摳圖、AI降噪、AI超分、AI視頻增強——你啲檔案上載咗去邊?

答案通常係:上載咗去服務商嘅雲端伺服器,處理完之後,檔案可能會喺伺服器保留一段時間,亦可能會用嚟訓練模型。具體保留幾耐、會唔會用嚟訓練,取決於你有冇仔細睇過嗰個唔會有人睇嘅用戶協議。

你而家可以打開手機,是但揀一個你成日用嘅在線AI工具,揭嚇佢嘅用戶協議——揾到「數據處理」嗰條,睇下佢寫咗乜。

我賭你冇睇過。因為我都冇睇過。

2023年4月,三星被爆出員工將公司敏感代碼上載到ChatGPT,導致內部機密資料洩漏。呢件事喺科技圈引起咗唔細嘅震動,但好快就俾新嘅熱點蓋過咗。

我唔係話嗰啲在線工具唔安全。大部分正規服務商都有數據保護措施。但問題係:你啲檔案,真係需要上載去人哋嘅伺服器咩?

對於一張風景相、一段公開嘅演講錄音,上載冇乜大不了。但對於有人樣嘅相、含有商業機密嘅文件、涉及私隱嘅對話錄音——本地處理係唯一正確嘅選擇。

MTools嘅邏輯好簡單:將AI模型下載去你嘅電腦,用你自己嘅顯示卡行。你嘅檔案從唔離開你嘅硬碟。冇網絡連接都用得。

呢就係「本地優先」。唔係咩新技術,但喺呢個所有軟件都想你註冊賬號、上載數據、綁定支付方式嘅時代,佢顯得格外稀有。


佢唔係萬能㗎

講到呢度,我需要做一件好多工具推薦文唔會做嘅事:話畀你知佢邊度唔得。

第一,你需要一張N卡。

MTools嘅AI功能依賴NVIDIA嘅CUDA加速。如果你用AMD顯示卡或者內置顯示卡,AI功能嘅處理速度會大幅下降。普通版可以喺CPU行,但體驗同GPU加速版唔係同一個層次。

圖片

開發者提供咗三個版本:普通版(127MB,適合冇獨立顯示卡嘅裝置)、CUDA版(適合GTX 1060/3060等中階N卡)、CUDA_FULL版(適合RTX 3070或以上高階N卡)。如果你只係做格式轉換同圖片壓縮,普通版就夠用。

第二,模型檔案會佔空間。

第一次用AI功能時,MTools會自動下載對應嘅模型檔案。呢啲模型加埋可能佔用幾個GB嘅硬碟空間。對於128GB SSD嘅輕薄本用家,要注意嚇。

第三,冇手機版。

目前MTools得桌面版(Windows/Linux/Mac)。如果你主要用手機處理內容,佢幫唔到你。

第四,佢係個人開發者嘅作品。

更新頻率可能唔及商業軟件穩定,遇到Bug唔一定即刻修復,功能亦可能冇成熟軟件咁完善。但佢開源,代碼喺GitHub公開可審查——呢本身就係一個信任優勢。

我之所以將呢啲限制講清楚,係因為「免費工具推薦」呢個領域已經充滿咗過度營銷。一個淨係講好唔講壞嘅工具推薦,同嗰啲「升級到Pro版解鎖全部功能」嘅彈窗一樣,都係消耗緊你嘅信任。


工具係用嚟解決問題㗎

返去開頭嗰張證件相。

如果當時我就知道MTools,成個過程大概係咁:開軟件,揀「證件相製作」,上載相,揀藍底一寸,撳確定。兩分鐘。唔使註冊,唔使上載,唔使錢。

我唔肯定MTools會唔會變成你日常嘅主力工具。如果你係專業設計師,Photoshop仲係無可取代;如果你係專業視頻剪接師,Premiere同DaVinci Resolve嘅功能深度遠超一個工具箱。

但如果你同我一樣,做內容創作成日要處理圖片、轉格式、將錄音變成文字,MTools解決嘅係另一個問題——

我到底需要幾多工具?

過去幾年,軟件行業有一個趨勢:將一個功能做成一個App,然後賣月費。圖片壓縮一個App,格式轉換一個App,AI摳圖一個App,PDF處理一個App。每個都收你一筆。

呢個商業模式對開發者梗係好——持續收入,用戶黏性。但對用戶呢?你為咗十幾個功能,裝咗十幾個軟件,俾咗十幾個會員,開每個都要登入,處理檔案都要上載,月尾睇下賬單——好嘢。

MTools做嘅嘢其實好簡單:將呢啲功能集成埋一齊,喺本地行,唔收錢。

呢唔係乜嘢顛覆性創新。呢只係一種產品理念嘅回歸——工具應該服務人,而唔係人服務工具。

一個300MB嘅壓縮包,解壓即用。下載地址放下面。覺得好用,去GitHub畀開發者點個Star。喺呢個所有軟件都諗緊計仔掏你銀包嘅年代,有人願意花時間做一個免費工具,本身就值得尊敬。


GitHub官方下載:https://github.com/HG-ha/MTools/releases

國內鏡像(下載更快):https://openlist.wer.plus/MTools

版本選擇建議:

  • 日常格式轉換、壓縮、裁剪 → 普通版(127MB)
  • AI摳圖、語音轉文字 → CUDA版(需N卡,GTX 1060或以上)
  • 專業視頻處理、批量AI任務 → CUDA_FULL版(需RTX 3070或以上)
圖片

昨天幫朋友處理一張證件照。

換背景,調尺寸,扣掉雜亂的髮絲邊緣。聽起來很簡單對吧?我打開remove.bg——要會員。打開Photoshop——導出發現文件太大,得壓縮。打開TinyPNG——上傳圖片的那一刻猶豫了一下:這張照片裏有朋友的臉,我確定要傳到別人的服務器上嗎?

最後我用了三個軟件,花了二十分鐘,處理了一張證件照。

你有沒有過這種時刻?一個五分鐘能搞定的活,因為工具分散、功能割裂、中間還要反覆上傳下載,硬生生拖成了半小時。

不是你效率低。是這個時代的工具太多了。


一個300MB的壓縮包

GitHub上找了一圈,看到一個開源項目,叫MTools,開發者ID是HG-ha,一個人。沒有公司,沒有PR團隊,沒有融資新聞。項目在GitHub上當前版本是v0.0.8,最近一次更新是2026年1月。

我下載了。解壓完300MB出頭。

雙擊exe,彈出一個窗口。沒有註冊,沒有登錄,沒有"升級到專業版解鎖更多功能"的彈窗。

圖片

界面很簡單,左邊是功能分類——AI工具、圖片工具、音視頻工具、開發工具,右邊是操作區域。乾淨利落,沒有廣告,沒有彈窗。

我做了幾件事。

AI摳圖

上傳了一張含人物的户外照片,點"開始處理"。七秒鐘後,背景乾淨地被移除了,髮絲邊緣處理得比remove.bg的免費版更精細。

然後我試了證件照功能。自動換藍底,自動裁剪到一寸尺寸。不用調參數,不用手動摳。

圖片

這個功能在remove.bg上要Pro會員才能用。在MTools上,免費。

區別是:remove.bg在雲端處理,你的照片上傳到別人的服務器。MTools在本地處理,模型下載到你自己的硬盤上,你的照片從不離開你的電腦。

音視頻轉文字

我扔了一段上週採訪的錄音進去,10分鐘左右。

我電腦是RTX 3060顯卡,用的CUDA版MTools。大約40秒,完整的文字稿出來了,連語氣詞和停頓都識別了,可以直接導出為SRT字幕文件。

圖片

40秒處理10分鐘錄音。我盯着滿屏的文字稿愣了好幾秒。

在飛書妙記上,同樣的操作需要上傳錄音,等雲端排隊處理,通常要5到10分鐘——取決於服務器忙不忙。飛書妙記的語音轉文字功能在免費版裏有時長限制,超出要買團隊版。

圖片壓縮

一張5MB的PNG圖片,用MTools內置的pngquant引擎壓縮,出來1.1MB。畫質肉眼無差別。

圖片

跟TinyPNG對比了一下,TinyPNG壓完1.2MB。效果幾乎一樣。

區別還是那個:TinyPNG要上傳,MTools在本地處理。而且TinyPNG有免費額度限制,超出要付費。MTools沒有額度限制,沒有付費,你有多少圖壓多少。

除此之外,MTools還塞了一堆功能進去:

  • 格式轉換
    ——JPG、PNG、WebP、GIF、BMP、TIFF等12種格式互轉,支持批量處理
  • 視頻處理
    ——H.264/H.265編碼,比特率自定義,速度調整不變音調
  • 人聲分離
    ——用的是UVR MDX-Net模型,效果接近專業級
  • 視頻插幀
    ——低幀率視頻補幀到流暢
  • 超分辨率放大
    ——720p修復到2K

這些功能,每一個單獨拿出來,都是一款付費軟件的主打功能。

MTools把它們全塞進了一個300MB的安裝包裏。

圖片
圖片

免費。開源。

測完這些功能,我做的第一件事不是發朋友圈安利,而是翻了一下自己的瀏覽器歷史記錄——過去一個月,我到底上傳了多少文件到各種在線工具?

結果讓我自己吃了一驚。


你的文件去哪了?

你用過的那些在線AI工具——AI摳圖、AI降噪、AI超分、AI視頻增強——你的文件上傳到哪了?

答案通常是:上傳到了服務商的雲端服務器,處理完之後,文件可能在服務器上保留一段時間,也可能被用於模型訓練。具體保留多久、會不會被用於訓練,取決於你有沒有仔細閲讀那個誰都不會讀的用戶協議。

你可以現在打開手機,隨便挑一個你常用的在線AI工具,翻翻它的用戶協議——找到"數據處理"那一條,看看它寫了什麼。

我賭你沒看過。因為我也沒看過。

2023年4月,三星被爆出員工將公司敏感代碼上傳到ChatGPT,導致內部機密數據泄露。這件事在科技圈引發了不小的震動,但很快就被新的熱點淹沒了。

我不是說那些在線工具不安全。大部分正規服務商都有數據保護措施。但問題是:你的文件,真的需要上傳到別人的服務器上嗎?

對於一張風景照、一段公開的演講錄音,上傳沒什麼大不了。但對於包含人臉的照片、含有商業機密的文檔、涉及隱私的對話錄音——本地處理是唯一正確的選擇。

MTools的邏輯很簡單:把AI模型下載到你的電腦上,用你自己的顯卡跑。你的文件從不離開你的硬盤。沒有網絡連接也能用。

這就是"本地優先"。不是什麼新技術,但在這個所有軟件都想讓你註冊賬號、上傳數據、綁定支付方式的時代,它顯得格外稀缺。


它不是萬能的

說到這裏,我需要做一件很多工具推薦文章不做的事:告訴你它哪裏不行。

第一,你需要一塊N卡。

MTools的AI功能依賴NVIDIA的CUDA加速。如果你用的是AMD顯卡或者核顯,AI功能的處理速度會大幅下降。普通版可以在CPU上運行,但體驗和GPU加速版不在一個量級。

圖片

開發者提供了三個版本:普通版(127MB,適合無獨顯設備)、CUDA版(適合GTX 1060/3060等中端N卡)、CUDA_FULL版(適合RTX 3070及以上高端N卡)。如果你只是做格式轉換和圖片壓縮,普通版就夠用。

第二,模型文件要佔空間。

首次使用AI功能時,MTools會自動下載對應的模型文件。這些模型加起來可能佔用幾個GB的硬盤空間。對於128GB SSD的輕薄本用戶,需要留意一下。

第三,沒有移動端。

目前MTools只有桌面端(Windows/Linux/Mac)。如果你主要在手機上處理內容,它幫不了你。

第四,它是個人開發者的作品。

更新頻率可能不如商業軟件穩定,遇到Bug不一定能立刻修復,功能也不一定比成熟軟件完善。但它開源,代碼在GitHub上公開可審計——這本身就是一個信任優勢。

我之所以把這些侷限性說清楚,是因為"免費工具推薦"這個領域已經充滿了過度營銷。一個只說好不說壞的工具推薦,跟那些"升級到Pro版解鎖全部功能"的彈窗一樣,都是在消費你的信任。


工具是用來解決問題的

回到開頭那張證件照。

如果當時我就知道MTools,整個過程大概是這樣的:打開軟件,選"證件照製作",上傳照片,選藍底一寸,點確定。兩分鐘。不註冊,不上傳,不花錢。

我不確定MTools會不會成為你日常的主力工具。如果你是專業設計師,Photoshop還是不可替代的;如果你是專業視頻剪輯師,Premiere和DaVinci Resolve的功能深度遠超一個工具箱。

但如果你跟我一樣,做內容創作經常要處理圖片、轉格式、把錄音變成文字,MTools解決的是另一個問題——

我到底需要多少工具?

過去幾年,軟件行業有一個趨勢:把一個功能做成一個App,然後賣月費。圖片壓縮一個App,格式轉換一個App,AI摳圖一個App,PDF處理一個App。每個都收你一筆。

這個商業模式對開發者當然好——持續收入,用戶黏性。但對用戶呢?你為十幾個功能,裝了十幾個軟件,付了十幾個會員,打開每個都要登錄,處理文件都要上傳,月底一看賬單——好傢伙。

MTools做的事情其實很簡單:把這些功能集成到一起,放在本地跑,不收錢。

這不是什麼顛覆性創新。這只是一種產品理念的迴歸——工具應該服務於人,而不是人服務於工具。

一個300MB的壓縮包,解壓即用。下載地址放下面了。覺得好用,去GitHub給開發者點個Star。在這個所有軟件都在想方設法掏你錢包的年代,有人願意花時間做一個免費工具,本身就值得尊敬。


GitHub官方下載:https://github.com/HG-ha/MTools/releases

國內鏡像(下載更快):https://openlist.wer.plus/MTools

版本選擇建議:

  • 日常格式轉換、壓縮、裁剪 → 普通版(127MB)
  • AI摳圖、語音轉文字 → CUDA版(需N卡,GTX 1060及以上)
  • 專業視頻處理、批量AI任務 → CUDA_FULL版(需RTX 3070及以上)