小米把頂級 AI 直接放生,還給你 MIT 授權
小米 4/28 凌晨無預警把兩顆大模型 MiMo-V2.5 與 MiMo-V2.5-Pro 放上 Hugging Face,完全開源、MIT 授權,代表你能直接載回家,改完再賣也沒人管。
兩顆模型都是「MoE」架構——你可以想成一家火店,客人只點自己愛吃的料,廚房卻有全聯菜單,省電又快速。
| 模型 | 總參數 | 活躍參數 | 約略大小 |
|---|---|---|---|
| MiMo-V2.5 | 310 B | 15 B | 60 GB |
| MiMo-V2.5-Pro | 1.02 T | 42 B | 165 GB |
想跑 Pro 版?一張 24 GB 的 RTX 4090 不夠,得租雲端 A100(每小時約 120 台幣)。
實測成績:Gemini 3.1 Pro 被超車,Claude Opus 4.6 被緊追
小米自己出的「MiMo Coding Bench」把模型當成打工仔,給它 VS Code 叫編譯器,看誰能一路做到完。
結果:
- MiMo-V2.5-Pro 拿下 78.4 分
- Gemini 3.1 Pro 只有 71.2 分
- Claude Opus 4.6 79.1 分
差距只剩 0.7 分,幾乎算同梯次,但小米這顆完全免費。
最狂的是:它會自己加班 4 小時
北京大學的編譯器作業被小米拿去當壓力測,連續跑 4.3 小時、呼叫工具 672 次,最後產出 100% 能動的編譯器,中間沒當機、沒人類插手。
等於你給它一份「請幫我寫作業」的訊息,它就一路寫到天亮,還自動 Debug。
第三方公證:Artificial Analysis 也蓋章
國外評測機構 Artificial Analysis 給的 Intelligence Score:
- MiMo-V2.5-Pro → 54 分
- DeepSeek V4 → 52 分
- Meta Muse Spark → 51 分
Agent 能力(就是讓 AI 自己開網頁、下載、裝環境)直接貼近閉源旗艦,重點還是 0 元。
台灣開發者可以怎麼玩?
1. 十分鐘架私有客服
- 下載
MiMo-V2.5(15 B 活躍,單卡 4090 跑得動) - 用 FastChat 或 vLLM 起服務
- 餵自家 FAQ,中文、台語、英語秒切換,不再付 ChatGPT 月租 1,500 台幣
2. 接進 Arduino 智慧家電
- 把 Pro 版放樹莓派 5 + 8 GB 當邊緣閘道
- 用語音請「開冷氣 25 度」→ 模型直接生成 MQTT 指令給 Home Assistant
- 延遲 < 300 ms,連網斷線也能跑
3. 學測/大學葉面助教
- 餵 10 年學測題,讓它解數學、解自然
- 學生丟截圖,模型回「這題用能量守恆,步驟 1…」
- 補習班老師一人帶 50 人也不崩潰
授權與風險:MIT 超佛,但還是得注意
✅ 可商用 → 做成 POS 機、醫療 App 都能賣 ✅ 可改模型 → 想刪繁體、加台語 OK ⚠️ 責任自負 → 生成錯誤醫療建議,小米不背心 ⚠️ 硬體門檻 → Pro 版 165 GB,下載就要 3 小時 1 Gbps 頻宽
去哪載?三步搞定
- 打開 Hugging Face 搜尋
XiaomiMiMo/MiMo-V2.5-Pro - 安裝相依套件:
pip install transformers torch accelerate - 官方已轉好 HuggingFace 格式,直接:
from transformers import AutoModelForCausalLM, AutoTokenizer model = AutoModelForCausalLM.from_pretrained("XiaomiMiMo/MiMo-V2.5-Pro", torch_dtype="auto", device_map="auto")
第一次載會抓 165 GB,建議先掛種子檔或開 GCP 免費額度,每小時 120 台幣就能玩世界級模型。
結語:免費的最香,但手腳要快
小米這波等於把高鐵商務艙車票直接送,後面會不會收回授權沒人知道。現在就打開 Hugging Face,把模型拉回 NAS,晚一步,流量爆了就要排隊。試試看吧!