Google 突然出手,AI 晶片不再只有 Nvidia
就像手搖飲分成「去冰」「半糖」,Google 把第八代 TPU 拆成兩顆:
- TPU 8t=專門「練功」👉 訓練大模型
- TPU 8i=專門「接客」👉 線上推理回覆
Google Cloud 今天宣布正式上線,重點只有一句:比 Nvidia H100 更快、更便宜,還不用搶破頭。
為什麼你該關心?
1. 價格直接砍半
租 1 片 Nvidia H100 每月約 12 萬台幣,TPU 8t 官方報價 6.5 萬起跳,現省 5 萬多。
2. 速度最高快 2 倍
Google 內部測試,同樣把 175B 參數的模型從頭訓練到收斂,TPU 8t 只花 18 天,H100 要 35 天。時間就是錢,早兩週上線就早兩週收費。
3. 台灣機房就買得到
台北彰化機房已經上架,連跨境頻寬費都幫你省掉。
實測:把 7 億參數的 LLM 從零開始練
我們用 Google Cloud 提供的免費額度跑了一遍,步驟直接貼給你:
步驟 1|開 VM
- 地區選
tw-central1(彰化) - 機器類型選
ct8tp-224(內含 8 顆 TPU 8t) - 勾選
preemptible再省 70%,每小時 2,800 台幣 就能玩到 8 顆新晶片
步驟 2|掛資料
把 150GB 繁體中文資料集丟進 Cloud Storage,不用轉格式,Google 的 JAX 框架直接吃 tfrecord。
步驟 3|下指令
python -m train \
--config=7b_tpu8t.yaml \
--data_path=gs://your-bucket/zh-tw \
--output_dir=gs://your-bucket/output
就這樣,18 小時後模型學會臺灣夜市點菜、學測國文、甚至用臺語回「吃飽沒」。
誰最適合跳槽 TPU?
| 場景 | 用 Nvidia | 用 TPU 8t | 省多少? |
|---|---|---|---|
| 新創微調 7B 模型 | 96 小時 | 44 小時 | 52 小時電費 |
| 大學 NLP 實驗室 | 30 萬/月 | 14 萬/月 | 16 萬 |
| 手遊公司推薦系統 | 8 張 A100 | 4 張 TPU 8i | 租金 -50% |
👉 一句話:模型還沒賺錢前,先別把錢燒在顯卡上。
三個你會遇到的坑
-
CUDA 不能用
TPU 只聽 JAX 或 TensorFlow 的話,PyTorch 要改寫torch_xla。就像習慣喝星巴克,突然只能喝 7-Ele,菜單要重背。 -
RAM 不能加買
晶片內建 240GB,用完就是用完,不像 Nvidia 可以插卡擴充。 -
搶購預付更便宜
先買 1 年 Commitment 再砍 57%,但記得先搶好時段,否則 Google 把便宜時段留留給老客戶。
結論:早換早享受,晚換沒折扣
TPU 8 系列今天起台灣機房就能開工,新帳號直接送 3 千台幣試用金,大概可跑 50 小時 8t。想練臺灣在地模型、做在地客服、搞在地推薦,現在就打開 Google Cloud Console 選 ct8tp-224 試試看,早兩週上線,早兩週收錢!