為什麼你該知道 GPT 的「底層邏輯」?
就像手搖杯標「半糖」其實還是甜,搞懂配方才不會越喝越胖。學會 GPT 怎麼「算」下一個字,你才知道 Prompt 怎麼下最省錢、最精準。
概念 1:Token 就像切好的雞排,大小決定你錢包厚度
- 中文 1 字 ≠ 1 Token。GPT 會把「學測」拆成「學」「測」兩塊,「Covid-19」算 3 塊。
- ChatGPT 上限 4096 Token,聽起來很多?實測貼一篇 1500 字新聞就 2200 Token,再回 800 字就爆表。
- 省錢技巧:先把文章餵給「Notion AI」摘要 200 字,再貼到 ChatGPT,Token 直接砍 70%,等於一杯星巴克變成 7-11 美式。
概念 2:Attention 就像夜市撈魚,同時盯所有魚再決定撈哪隻
- 白話說:模型看句子時,每個字都開一個「探照燈」照其他字,算出誰跟誰最麻吉。
- 例:「台北天氣好」→「天氣」這盞燈最亮照到「台北」,就知道「天氣」是地名後面的主角。
- 實用啟示:Prompt 裡把關鍵字放前面,Attention 亮度更高,GPT 更不容易「歪樓」。

概念 3:訓練兩階段,就像先讀漫畫再上補習班
- 預訓練(Pre-training):
- 資料量 3000 億句話,相當於把全台灣 2300 萬人每天講的話累積 300 年。
- 目標:讓模型學會「語感」——知道「雞排」後面常接「珍奶」而不是「報稅」。
- RLHF(人類回饋強化學習):
- 請真人標註員打分數,像補習班老師改作文,教它「講幹話」不如「給步驟」。
- 結果:ChatGPT 回答變得「有禮貌+承認錯誤」,但偶爾還是會一本正經胡說八道。
3 步 Prompt 省 30% Token、效果不變
- 刪填充詞:「請問你可以幫我」→「幫我」
- 用條列代替長句:「請用五點說明」→「1.2.3.4.5.」
- 中英混用時加空格:「AI 模型」→「AI模型」可省 1 Token
實測同樣請 GPT 寫「週報」,優化後從 1800 Token 降到 1260 Token,每個月 20 篇就省 324 元台幣,剛好再請自己一杯手搖。
常見迷思一次破解
| 迷思 | 真相 |
|---|---|
| GPT 理解中文比英文差 | 錯!訓練語料 46% 是英文、13% 中文,但中文 Token 拆得細,看起來比較「囉嗦」而已。 |
| 越長 Prompt 越厲害 | 超過 600 Token 後邊際效應遞減,重點是「結構」不是「長度」。 |
| 最新版一定最省 | GPT-4 Turbo 雖然便宜 3 倍,但回應字數常爆表,總成本反而高。 |
結語:把 GPT 當成「超會接龍的國小生」就夠了
它沒有常識,只會機率;給它「填空題」格式,它就填出你要的答案。下次 Prompt 太長時,想像你在 LINE 群組丟懶人包——字越少、重點越前面,大家越願意看。
現在就打開 ChatGPT,把昨天那串 800 字 Prompt 刪成 200 字,試試看回答是不是更快、更便宜!