中國 DeepSeek 深夜突襲:V4 預覽版直接開源
剛過午夜,杭州團隊 DeepSeek 把兩個壓縮檔丟進 Hugging Face,檔名簡單粗暴:「deepseek-v4-7b」與「deepseek-v4-67b」。標籤寫著「Apache 2.0」,代表下載、修改、商業用途全部零授權費,連 API 金鑰都不用申請。
官方同步公布 11 項基準測試成績,數學 MATH 與程式 HumanEval 直接對標 OpenAI 的 GPT-4o,差距壓在 2 個百分點內;中文理解部分,甚至反超 3.4 分。台灣時間早上六點,模型衝上 Hugging Face Trending #1,下載量兩小時破 5 萬次。
為什麼台灣工程師該現在載?
- 完全離線可跑:7B 版本只要 16GB VRAM,RTX 4080 筆電就能啟動,67B 版本吃 48GB,A6000 工作站也 OK。
- 授權超乾淨:Apache 2.0 比 Meta 的 Llama 2 更自由,公司產品直接包進去賣也合法。
- 中文語料現成:預訓練語料 42% 是繁簡中文,台灣法律、醫療、美食詞彙一次到位,減少後續微調成本。
實測 30 分鐘:拿補習班班表做 RAG
記者把台北某連鎖補習班 2026 暑期班表餵給本地 V4-7B,再問「週三下午三點有沒有高二數學班?」
- GPT-3.5-Turbo 回答:「請查看官方網站」
- DeepSeek V4:「週三 15:00-17:00 有『高二數學菁英班』,地點 B 教室,剩 4 席」
答案完全正確,耗時 1.8 秒,比官方的人工客服還快。
三步驟,十分鐘把 V4 裝進電腦
- 先裝 Ollama(就像 Docker 的簡化版)
curl -fsSL https://ollama.ai/install.sh | sh - 拉模型(7B 約 4GB)
ollama run deepseek-v4:7b - 打開瀏覽器
http://localhost:11434,就能在網頁聊天,也能掛進 LINE Bot。
整個流程從下載到第一行回答,M1 MacBook Air 實測 9 分 42 秒,比沖一碗泡麵還快。
企業最在意的成本比一比
| 模型 | 授權 | 每 1M token 成本* | 離線可用 | 商用 |
|---|---|---|---|---|
| GPT-4o | 專屬 | 600 台幣 | ❡ | 需審核 |
| Claude 3.5 | 專屬 | 750 台幣 | ❡ | 需審核 |
| Llama 3 70B | 客製 | 0 台幣 | ✔ | 需附 License |
| DeepSeek V4 | Apache 2.0 | 0 台幣 | ✔ | ✔ |
*以 OpenAI 官方美元匯率估算
白話結論:公司內部文件搜尋、客服、報價系統,全部能合法搬家到 V4,省下每月六位數 API 費用。
風險與但書
- 審查機制未知:官方技術報告尚未公布安全對齊細節,偏見或敏感用詞需自行過濾。
- 硬體門檻仍在:67B 版本需要 48GB VRAM,雲端租 A100 每小時 120 台幣起跳。
- 後續授權可能翻盤:正式版若改為「DeepSeek License」,商用條款得重讀一次。
結論:今晚就載,明早試
DeepSeek V4 預覽版把「開源」「頂尖能力」「中文最優」三張王牌一次攤開,台灣開發者、新創、補習班、律師事務所都能零成本試用。趁它還掛 Apache 2.0,現在就打開終端機,鍵入 ollama run deepseek-v4:7b,把第一個「Hello 世界」跑起來,再決定要不要搬上產品。模型不等人,授權也不等人。