美國 Poolside 深夜突襲:Laguna XS.2 正式開源
就在 4 月 29 日晚間,美國新創 Poolside 無預警釋出兩顆新模型:
- Laguna M.1(2,250 億參數,商用級 API)
- Laguna XS.2(330 億參數,完全開源)
重點在後者:Apache 2.0 授權、可商用、可離線,檔案直接放在 HuggingFace,任何人都能載回家。
為什麼台灣工程師該關心?
-
中國模型霸榜,西方終於反擊
最近 Qwen3.6、DeepSeek-V4-Flash 在公開排行榜輾壓西方模型,Poolside 這次直接嗆聲:「西方也需要強大開源模型。」 -
本地就能跑,資料不漂洋過海
Laguna XS.2 提供 INT4 量化版,最低 8GB VRAM 就能推論,公司內網也能用,客戶資料留在台灣。 -
現階段完全免費
API 公開測試期 0 元,下載版也沒有授權費,等於先搶先贏。
實測數據:真的贏過 Gemma 4?
Poolside 公布的 MMLU、HumanEval 等 8 項基準顧名單:
- Laguna XS.2 平均 74.2 分
- Google Gemma 4 平均 71.9 分
- Qwen3.5 平均 75.1 分(仍小勝)
雖然還沒幹掉中國最頂,但已把同級西方模型甩在後頭,而且體積只有 Qwen3.6 的 1/3。
下載+安裝 3 步驟(Windows 版範例)
步驟 1:準備硬碟空間
- FP16 原版:60 GB
- INT4 量化:15 GB
- 建議至少留 100 GB 工作暫存
步驟 2:裝 Ollama 0.6↑
打開 PowerShell:
winget install Ollama.Ollama
裝完重開終端機。
步驟 3:一行指令載模型
ollama run hf.co/poolside/Laguna-XS.2-INT4
第一次會自動抓檔案,約 20 分鐘(100M 光纖速率)。
跑完後就能在終端機直接對話:
>>> 用台灣口吻介紹臭豆腐
企業導入注意事項
- 授權:Apache 2.0 可商用,改做微調也能閉源販售。
- 顯卡:INT4 版 RTX 4060 8G 即可;FP16 建議 RTX 4080 以上。
- 速度:INT4 在 RTX 4090 約 45 token/s,已達生產等級。
- 中文表現:雖以英文為主,但中文閱讀理解僅落後 Qwen 不到 2%,日常客服夠用。
與 Llama 3.1、Gemma 4 怎麼選?
| 模型 | 參數 | 授權 | 中文 | 商用 |
|---|---|---|---|---|
| Llama 3.1 70B | 70B | 自訊 | 中 | ✅ |
| Gemma 4 31B | 31B | Apache | 中 | ✅ |
| Laguna XS.2 | 33B | Apache | 中↑ | ✅ |
結論:
- 想最大社群資源 → Llama
- 想 Google 生態系 → Gemma
- 想嘗鮮、效能兼顧 → Laguna XS.2
立即體驗:5 分鐘把模型灌進筆電
- 打開 https://huggingface.co/poolside 挑版本
- 複製 Ollama 指令
- 終端機貼上 Enter
- 等進度條跑完,直接開聊
今晚就讓你的 RTX 4060 也跑「美製大模型」!