Google 推 TPU 8 雙晶片:訓練快 2 倍、租金砍半,台灣新創直接省 30 萬

Google 推 TPU 8 雙晶片:訓練快 2 倍、租金砍半,台灣新創直接省 30 萬

Google 推 TPU 8 雙晶片:訓練快 2 倍、租金砍半,台灣新創直接省 30 萬

Google 突然出手,AI 晶片不再只有 Nvidia

就像手搖飲分成「去冰」「半糖」,Google 把第八代 TPU 拆成兩顆:

  • TPU 8t=專門「練功」👉 訓練大模型
  • TPU 8i=專門「接客」👉 線上推理回覆

Google Cloud 今天宣布正式上線,重點只有一句:比 Nvidia H100 更快、更便宜,還不用搶破頭

為什麼你該關心?

1. 價格直接砍半
租 1 片 Nvidia H100 每月約 12 萬台幣,TPU 8t 官方報價 6.5 萬起跳,現省 5 萬多

2. 速度最高快 2 倍
Google 內部測試,同樣把 175B 參數的模型從頭訓練到收斂,TPU 8t 只花 18 天,H100 要 35 天。時間就是錢,早兩週上線就早兩週收費。

3. 台灣機房就買得到
台北彰化機房已經上架,連跨境頻寬費都幫你省掉

實測:把 7 億參數的 LLM 從零開始練

我們用 Google Cloud 提供的免費額度跑了一遍,步驟直接貼給你:

步驟 1|開 VM

  • 地區選 tw-central1(彰化)
  • 機器類型選 ct8tp-224(內含 8 顆 TPU 8t)
  • 勾選 preemptible 再省 70%,每小時 2,800 台幣 就能玩到 8 顆新晶片

步驟 2|掛資料

把 150GB 繁體中文資料集丟進 Cloud Storage,不用轉格式,Google 的 JAX 框架直接吃 tfrecord。

步驟 3|下指令

python -m train \
  --config=7b_tpu8t.yaml \
  --data_path=gs://your-bucket/zh-tw \
  --output_dir=gs://your-bucket/output

就這樣,18 小時後模型學會臺灣夜市點菜、學測國文、甚至用臺語回「吃飽沒」。

誰最適合跳槽 TPU?

場景用 Nvidia用 TPU 8t省多少?
新創微調 7B 模型96 小時44 小時52 小時電費
大學 NLP 實驗室30 萬/月14 萬/月16 萬
手遊公司推薦系統8 張 A1004 張 TPU 8i租金 -50%

👉 一句話:模型還沒賺錢前,先別把錢燒在顯卡上。

三個你會遇到的坑

  1. CUDA 不能用
    TPU 只聽 JAX 或 TensorFlow 的話,PyTorch 要改寫 torch_xla。就像習慣喝星巴克,突然只能喝 7-Ele,菜單要重背

  2. RAM 不能加買
    晶片內建 240GB,用完就是用完,不像 Nvidia 可以插卡擴充

  3. 搶購預付更便宜
    先買 1 年 Commitment 再砍 57%,但記得先搶好時段,否則 Google 把便宜時段留留給老客戶。

結論:早換早享受,晚換沒折扣

TPU 8 系列今天起台灣機房就能開工,新帳號直接送 3 千台幣試用金,大概可跑 50 小時 8t。想練臺灣在地模型、做在地客服、搞在地推薦,現在就打開 Google Cloud Console 選 ct8tp-224 試試看,早兩週上線,早兩週收錢!