Laguna XS.2 開源模型 60GB 下載實測:RTX 4060 也能跑贏 Gemma 4

Laguna XS.2 開源模型 60GB 下載實測:RTX 4060 也能跑贏 Gemma 4

Laguna XS.2 開源模型 60GB 下載實測:RTX 4060 也能跑贏 Gemma 4

美國 Poolside 深夜突襲:Laguna XS.2 正式開源

就在 4 月 29 日晚間,美國新創 Poolside 無預警釋出兩顆新模型:

  • Laguna M.1(2,250 億參數,商用級 API)
  • Laguna XS.2(330 億參數,完全開源)

重點在後者:Apache 2.0 授權、可商用、可離線,檔案直接放在 HuggingFace,任何人都能載回家。

為什麼台灣工程師該關心?

  1. 中國模型霸榜,西方終於反擊
    最近 Qwen3.6、DeepSeek-V4-Flash 在公開排行榜輾壓西方模型,Poolside 這次直接嗆聲:「西方也需要強大開源模型。」

  2. 本地就能跑,資料不漂洋過海
    Laguna XS.2 提供 INT4 量化版,最低 8GB VRAM 就能推論,公司內網也能用,客戶資料留在台灣。

  3. 現階段完全免費
    API 公開測試期 0 元,下載版也沒有授權費,等於先搶先贏。

實測數據:真的贏過 Gemma 4?

Poolside 公布的 MMLU、HumanEval 等 8 項基準顧名單:

  • Laguna XS.2 平均 74.2 分
  • Google Gemma 4 平均 71.9 分
  • Qwen3.5 平均 75.1 分(仍小勝)

雖然還沒幹掉中國最頂,但已把同級西方模型甩在後頭,而且體積只有 Qwen3.6 的 1/3

下載+安裝 3 步驟(Windows 版範例)

步驟 1:準備硬碟空間

  • FP16 原版:60 GB
  • INT4 量化:15 GB
  • 建議至少留 100 GB 工作暫存

步驟 2:裝 Ollama 0.6↑

打開 PowerShell:

winget install Ollama.Ollama

裝完重開終端機。

步驟 3:一行指令載模型

ollama run hf.co/poolside/Laguna-XS.2-INT4

第一次會自動抓檔案,約 20 分鐘(100M 光纖速率)。

跑完後就能在終端機直接對話:

>>> 用台灣口吻介紹臭豆腐

企業導入注意事項

  • 授權:Apache 2.0 可商用,改做微調也能閉源販售。
  • 顯卡:INT4 版 RTX 4060 8G 即可;FP16 建議 RTX 4080 以上。
  • 速度:INT4 在 RTX 4090 約 45 token/s,已達生產等級。
  • 中文表現:雖以英文為主,但中文閱讀理解僅落後 Qwen 不到 2%,日常客服夠用。

與 Llama 3.1、Gemma 4 怎麼選?

模型參數授權中文商用
Llama 3.1 70B70B自訊
Gemma 4 31B31BApache
Laguna XS.233BApache中↑

結論

  • 想最大社群資源 → Llama
  • 想 Google 生態系 → Gemma
  • 想嘗鮮、效能兼顧 → Laguna XS.2

立即體驗:5 分鐘把模型灌進筆電

  1. 打開 https://huggingface.co/poolside 挑版本
  2. 複製 Ollama 指令
  3. 終端機貼上 Enter
  4. 等進度條跑完,直接開聊

今晚就讓你的 RTX 4060 也跑「美製大模型」!