小米開源 MiMo-V2.5-Pro:免費下載就能跑贏 Gemini 3.1 Pro

小米開源 MiMo-V2.5-Pro:免費下載就能跑贏 Gemini 3.1 Pro

小米開源 MiMo-V2.5-Pro:免費下載就能跑贏 Gemini 3.1 Pro

小米把頂級 AI 直接放生,還給你 MIT 授權

小米 4/28 凌晨無預警把兩顆大模型 MiMo-V2.5 與 MiMo-V2.5-Pro 放上 Hugging Face,完全開源、MIT 授權,代表你能直接載回家,改完再賣也沒人管。

兩顆模型都是「MoE」架構——你可以想成一家火店,客人只點自己愛吃的料,廚房卻有全聯菜單,省電又快速。

模型總參數活躍參數約略大小
MiMo-V2.5310 B15 B60 GB
MiMo-V2.5-Pro1.02 T42 B165 GB

想跑 Pro 版?一張 24 GB 的 RTX 4090 不夠,得租雲端 A100(每小時約 120 台幣)。

實測成績:Gemini 3.1 Pro 被超車,Claude Opus 4.6 被緊追

小米自己出的「MiMo Coding Bench」把模型當成打工仔,給它 VS Code 叫編譯器,看誰能一路做到完。

結果:

  • MiMo-V2.5-Pro 拿下 78.4 分
  • Gemini 3.1 Pro 只有 71.2 分
  • Claude Opus 4.6 79.1 分

差距只剩 0.7 分,幾乎算同梯次,但小米這顆完全免費

最狂的是:它會自己加班 4 小時

北京大學的編譯器作業被小米拿去當壓力測,連續跑 4.3 小時、呼叫工具 672 次,最後產出 100% 能動的編譯器,中間沒當機、沒人類插手。

等於你給它一份「請幫我寫作業」的訊息,它就一路寫到天亮,還自動 Debug。

第三方公證:Artificial Analysis 也蓋章

國外評測機構 Artificial Analysis 給的 Intelligence Score:

  • MiMo-V2.5-Pro → 54 分
  • DeepSeek V4 → 52 分
  • Meta Muse Spark → 51 分

Agent 能力(就是讓 AI 自己開網頁、下載、裝環境)直接貼近閉源旗艦,重點還是 0 元。

台灣開發者可以怎麼玩?

1. 十分鐘架私有客服

  • 下載 MiMo-V2.5(15 B 活躍,單卡 4090 跑得動)
  • 用 FastChat 或 vLLM 起服務
  • 餵自家 FAQ,中文、台語、英語秒切換,不再付 ChatGPT 月租 1,500 台幣

2. 接進 Arduino 智慧家電

  • 把 Pro 版放樹莓派 5 + 8 GB 當邊緣閘道
  • 用語音請「開冷氣 25 度」→ 模型直接生成 MQTT 指令給 Home Assistant
  • 延遲 < 300 ms,連網斷線也能跑

3. 學測/大學葉面助教

  • 餵 10 年學測題,讓它解數學、解自然
  • 學生丟截圖,模型回「這題用能量守恆,步驟 1…」
  • 補習班老師一人帶 50 人也不崩潰

授權與風險:MIT 超佛,但還是得注意

可商用 → 做成 POS 機、醫療 App 都能賣 ✅ 可改模型 → 想刪繁體、加台語 OK ⚠️ 責任自負 → 生成錯誤醫療建議,小米不背心 ⚠️ 硬體門檻 → Pro 版 165 GB,下載就要 3 小時 1 Gbps 頻宽

去哪載?三步搞定

  1. 打開 Hugging Face 搜尋 XiaomiMiMo/MiMo-V2.5-Pro
  2. 安裝相依套件:
    pip install transformers torch accelerate
  3. 官方已轉好 HuggingFace 格式,直接:
    from transformers import AutoModelForCausalLM, AutoTokenizer
    model = AutoModelForCausalLM.from_pretrained("XiaomiMiMo/MiMo-V2.5-Pro", torch_dtype="auto", device_map="auto")

第一次載會抓 165 GB,建議先掛種子檔或開 GCP 免費額度,每小時 120 台幣就能玩世界級模型。

結語:免費的最香,但手腳要快

小米這波等於把高鐵商務艙車票直接送,後面會不會收回授權沒人知道。現在就打開 Hugging Face,把模型拉回 NAS,晚一步,流量爆了就要排隊。試試看吧!