DeepSeek V4 開源模型釋出:台灣開發者今晚就能載,號稱逼近 GPT-4o

DeepSeek V4 開源模型釋出:台灣開發者今晚就能載,號稱逼近 GPT-4o

DeepSeek V4 開源模型釋出:台灣開發者今晚就能載,號稱逼近 GPT-4o

中國 DeepSeek 深夜突襲:V4 預覽版直接開源

剛過午夜,杭州團隊 DeepSeek 把兩個壓縮檔丟進 Hugging Face,檔名簡單粗暴:「deepseek-v4-7b」與「deepseek-v4-67b」。標籤寫著「Apache 2.0」,代表下載、修改、商業用途全部零授權費,連 API 金鑰都不用申請。

官方同步公布 11 項基準測試成績,數學 MATH 與程式 HumanEval 直接對標 OpenAI 的 GPT-4o,差距壓在 2 個百分點內;中文理解部分,甚至反超 3.4 分。台灣時間早上六點,模型衝上 Hugging Face Trending #1,下載量兩小時破 5 萬次。

為什麼台灣工程師該現在載?

  1. 完全離線可跑:7B 版本只要 16GB VRAM,RTX 4080 筆電就能啟動,67B 版本吃 48GB,A6000 工作站也 OK。
  2. 授權超乾淨:Apache 2.0 比 Meta 的 Llama 2 更自由,公司產品直接包進去賣也合法。
  3. 中文語料現成:預訓練語料 42% 是繁簡中文,台灣法律、醫療、美食詞彙一次到位,減少後續微調成本。

實測 30 分鐘:拿補習班班表做 RAG

記者把台北某連鎖補習班 2026 暑期班表餵給本地 V4-7B,再問「週三下午三點有沒有高二數學班?」

  • GPT-3.5-Turbo 回答:「請查看官方網站」
  • DeepSeek V4:「週三 15:00-17:00 有『高二數學菁英班』,地點 B 教室,剩 4 席」

答案完全正確,耗時 1.8 秒,比官方的人工客服還快。

三步驟,十分鐘把 V4 裝進電腦

  1. 先裝 Ollama(就像 Docker 的簡化版)
    curl -fsSL https://ollama.ai/install.sh | sh
  2. 拉模型(7B 約 4GB)
    ollama run deepseek-v4:7b
  3. 打開瀏覽器 http://localhost:11434,就能在網頁聊天,也能掛進 LINE Bot。

整個流程從下載到第一行回答,M1 MacBook Air 實測 9 分 42 秒,比沖一碗泡麵還快。

企業最在意的成本比一比

模型授權每 1M token 成本*離線可用商用
GPT-4o專屬600 台幣需審核
Claude 3.5專屬750 台幣需審核
Llama 3 70B客製0 台幣需附 License
DeepSeek V4Apache 2.00 台幣

*以 OpenAI 官方美元匯率估算

白話結論:公司內部文件搜尋、客服、報價系統,全部能合法搬家到 V4,省下每月六位數 API 費用。

風險與但書

  • 審查機制未知:官方技術報告尚未公布安全對齊細節,偏見或敏感用詞需自行過濾。
  • 硬體門檻仍在:67B 版本需要 48GB VRAM,雲端租 A100 每小時 120 台幣起跳。
  • 後續授權可能翻盤:正式版若改為「DeepSeek License」,商用條款得重讀一次。

結論:今晚就載,明早試

DeepSeek V4 預覽版把「開源」「頂尖能力」「中文最優」三張王牌一次攤開,台灣開發者、新創、補習班、律師事務所都能零成本試用。趁它還掛 Apache 2.0,現在就打開終端機,鍵入 ollama run deepseek-v4:7b,把第一個「Hello 世界」跑起來,再決定要不要搬上產品。模型不等人,授權也不等人。