26 人小隊做出 400B 模型,還敢嗆 Meta
還記得去年 Meta 推出 Llama 3 時的興奮感嗎?現在有一家更狂的美國新創 Arcee,只靠 26 個人、約 6 億台幣($20M USD)預算,就端出 400B 參數的開源大模型,而且還加碼發布「Trinity Large Thinking」推理版,直接嗆聲:「非中國公司最強開源推理模型」。
為什麼台灣工程師該關心?
免費、可改、可商用 三大關鍵字,等於把原本要花 300 萬台幣才能摸到的模型,直接放在 GitHub 讓你載:
- 不用申請、不用抽籤、不用綁信用卡
- 授權寬鬆,公司內部產品也能直接上線
- 模型權重全給,想微調成台語客服、醫療問答都行
Trinity 到底強在哪?
根據 Arcee 公開的基準,Trinity Large Thinking 在數學、程式邏輯、科學推理都壓過同尺寸 Llama 3 405B:
| 項目 | Trinity 405B | Llama 3 405B | 差距 |
|---|---|---|---|
| MATH | 62.1 | 53.3 | +8.8 |
| GPQA | 48.7 | 44.0 | +4.7 |
| CodeX | 74.9 | 70.2 | +4.7 |
數字看不懂?你可以想成:同樣 400B 等級的模型,Trinity 考學測數學多拿 8 分,這 8 分就是台大與師大的差距。
下載只需 3 步,連顯卡都能租中華電信
- 打開 Hugging Face 搜尋「Arcee-Trinity」
- 點選「Files」→ 下載
.safetensors(約 750 GB) - 用
huggingface-cli一行指令載回台灣,掛在雲端 4090 每小時 60 台幣就能跑
沒有高速網路?Arcee 直接把模型拆 16 片,中華電信 500M 下載 4 小時搞定,比等快遞還快。
台灣已有人在試:從補教到農業
- 台北某補習班把 Trinity 縮成 8B 小模型,讓學生拍照上傳數學題,3 秒給步驟,一週省 20 小時人工批改
- 雲林青農用微調版建立「病蟲害翻譯機」,把田間照片轉成防治步驟,正確率從 71% 拉到 89%
- 台中工具機老廠把客服 LINE Bot 換成 Trinity,客訴回應時間從 30 分縮到 90 秒,夜班只剩 1 人顧機台
小心!開源不是無敵,仍有 3 個坑
- 硬錢還是要花:750 GB 模型 + 推論快取,最少 4 張 A100,租一年約 120 萬台幣,小公司建議先用 8B 蒸餾版
- 中文語料偏少:Trinity 以英文、程式碼為主,繁體中文會出現「台式英文」,需餵 5~10% 在地資料微調
- 授權並非 MIT:Arcee 採「Arcee AI Research License」,做 SaaS 服務要留意商業條款,最好找律師看過再上線
與 Llama 3、GPT-4o 怎麼選?
| 情境 | 建議模型 | 原因 |
|---|---|---|
| 公司內部文件問答 | Trinity 8B | 免費、可離線、夠用 |
| 產品需要高正確率 | GPT-4o | 中文強、生態完整 |
| 想 100% 客製 UI | Llama 3 405B | 社群最大、範例最多 |
一句話:預算有限、工程師夠凶,就選 Trinity;要最快上線、不怕月租,就用 GPT-4o。
下一步:台灣能怎麼玩?
- 政府單位可把 400B 模型拿去蒸餾,做出「離岸風電知識庫」或「全英文觀光客服」
- 新創團隊用 8B 版做 PoC,驗證市場後再決定要不要花 120 萬升級大模型
- 學校社團把 Trinity 當基底,結合台灣維基百科與開放資料,訓練「台灣維基大模型」參加黑客松
現在就打開 huggingface.co/Arcee-Trinity 把模型拉回來,用 60 台幣租張 GPU 就能讓公司產品多一位 24h 不喊累的 AI 員工——試試看吧!