不用再眼花撩亂!AI 智商排行榜一次看懂
還記得每次要比較哪個 AI 比較厲害時,都要滑過一堆密密麻麻的表格嗎?現在終於有人把這些複雜的數據,變成我們都能秒懂的「智商分數」了!
什麼是 AI IQ?就像學測總分的概念
想像一下,如果每個 AI 都要考 12 種不同考試(數學、程式、邏輯推理等等),然後把這些分數換算成一個總分,這就是 AI IQ 在做的事。
創辦人 Ryan Shea 把這個概念叫做「AI IQ」,直接把 GPT-5.5、Claude、Gemini 等熱門 AI 的表現,換算成我們熟悉的 IQ 分數。
最新 AI 智商排行榜(2026 年 5 月)
| 排名 | AI 模型 | IQ 分數 | 特色 |
|---|---|---|---|
| 🥇 | GPT-5.5 | 155 | 目前最聰明,邏輯推理超強 |
| 🥈 | Gemini 3.1 Pro | 148 | Google 王牌,數學表現突出 |
| 🥉 | Claude Opus 4.7 | 145 | Anthropic 出品,安全性高 |
| 4 | Grok 4.3 | 142 | xAI 開發,擅長即時資訊 |
| 5 | Kimi K2.6 | 138 | 中國團隊,中文理解佳 |
12 項考試是哪些?就像 AI 的學測考科
AI IQ 不是隨便打分數,而是用 12 個公開的「考試」來評分:
邏輯推理類
- ARC-AGI-1 & 2:抽象圖形推理
- Humanity’s Last Exam:人類最終考試
數學能力類
- FrontierMath T1-T4:高等數學解題
- AIME:美國數學邀請賽題目
程式設計類
- SWE-bench:軟體工程實務
- Terminal-Bench 2.0:終端機操作
學術知識類
- GPQA Diamond:博士級問答
- SciCode:科學程式設計
每個 AI 都要考這 12 科,最後算出平均分數,就是我們看到的 IQ。
台灣用戶最關心的 3 件事
1. 哪個 AI 最划算?
除了智商,AI IQ 還幫你算「每分智商多少錢」:
- GPT-5.5:每 1,000 次回答約 300 台幣
- Claude Opus:每 1,000 次回答約 450 台幣
- Gemini Pro:每 1,000 次回答約 200 台幣
2. 中文表現如何?
雖然 AI IQ 主要用英文考試,但從實測發現:
- Kimi 和 GPT-5.5 在中文語境下表現最佳
- Claude 雖然智商高,但有時會過度謹慎
3. 會不會有作弊嫌疑?
官方特別說明:他們會壓縮那些「靠背答案」就能高分的考試權重,避免某些 AI 靠記憶題目拿高分。
怎麼自己查詢?
- 打開 aiiq.org
- 點選你想看的 AI 模型
- 滑鼠移到圖表上,就能看到每項考試的詳細分數
- 用篩選功能,可以只看特定公司(如 Google、OpenAI)的產品
小結:選 AI 就像選補習班
以前選 AI 工具就像在比較補習班,要看升學率、師資、教材…現在只要看一個「總分」就夠了!
記住三個重點:
- 智商 150+:頂尖 AI,適合複雜任務
- 智商 140-150:高階 AI,日常夠用
- 智商 130-140:中階 AI,基本需求 OK
下次朋友問你「哪個 AI 比較聰明?」,直接報 IQ 分數就對了!
試試看:現在就打開 aiiq.org,看看你常用的 AI 智商幾分~