手機也能跑 83 億參數 AI?Liquid AI 做到了
Liquid AI 在 5 月 28 日把最新小型語言模型 LFM2.5-8B-A1B 開源釋出,主打「手機就能跑、日文超流利」。這顆模型只有 83 億總參數,實際運算時只啟動 15 億,卻能打出 20B 等級的表現,重點是:Galaxy S26 Ultra 每秒可跑 28 token,比 5G 回傳還快。
為什麼這次不一樣?
- 離線可用:不用連網、不耗流量,飛航模式也能問 AI
- 日文優化:新 tokenizer 讓日文 token 效率提升 6.9 %
- 檔案超小:完整版 8 GB 左右,iPhone 16 Pro 256 GB 裝得下
實測:Galaxy S26 Ultra 跑起來長怎樣?
| 設備 | 晶片 | 速度 | 備註 |
|---|---|---|---|
| Galaxy S26 Ultra | Snapdragon 8 Gen 5 | 28 token/s | 實測 15 分鐘不燙手 |
| AMD Ryzen AI Max+ 395 | PC | 148 token/s | 桌機參考值 |
步驟超簡單:
- 下載 GGUF 4-bit 量化版(約 4.2 GB)
- 用 MLC Chat 或 PocketPal 載入模型
- 開飛航模式測試「台北明天會下雨嗎?」
日文回答實測
我們在 Hugging Face Demo 輸入:
スマートフォンには画面保護フィルムを貼るべき?それとも貼らなくてOK?
AI 先用英文思考 2 秒,接著秒切日文,列出貼膜優缺點,還提醒「高品質玻璃其實不用貼」。整段回答 120 字,沒有亂碼、沒有片假名地獄,就像日本朋友打字回你。
下載與安裝懶人包
- Hugging Face 主頁:
LiquidAI/LFM2.5-8B-A1B - GGUF 量化版:直接搜尋
LFM2.5-8B-A1B-Q4_K_M.gguf - iOS 捷徑:用「快捷指令」+「Private LLM」一鍵載入
- Android APK:MLC Chat nightly 版已內建
台灣人最在意的三件事
- 吃到飽流量再見:離線 AI 不耗網路,月底不怕降速
- 夜市打卡不怕沒網:人擠人時照樣問 AI「這家臭豆腐好吃嗎?」
- 學測英文作文:手機離線就能請 AI 幫你改文法,考場沒 Wi-Fi 也 OK
現在就打開 Hugging Face Demo 試試看
點進 LFM2.5-8B-A1B Demo 直接輸入你最想問的日文問題,3 秒後就知道這顆模型有多台。覺得好用再下載 GGUF 回家裝,今晚就讓手機變身 AI 小幫手!