Arena AI 排行榜 8 個月賺進 3 億台幣：不做模型只做裁判的賺錢術

一個讓 AI「打架」的網站，怎麼變成 3 億台幣生意？

你一定有看過那種「兩個 AI 同時回答，你選哪個比較好」的截圖對吧？那就是 Arena，現在已經是 AI 產業最重要的成績單——而且超會賺錢。

這個 2023 年從加州大學柏克萊分校（UC Berkeley）畢業專題起家的網站，上線商業服務才 8 個月，年營收已經衝到 1 億美元（約 3 億台幣）。

想像一下：學測考完之後，不是只有大考中心說「這題答案選 B」，而是有 1000 萬個考生 實際寫過、比較過，告訴你「這家補習班的解題真的比較清楚」。

Arena 做的就是這件事：

到目前為止已經累積 超過 1000 萬筆真人評價，這個數據量讓 Arena 的排行榜比任何學術論文都更有參考價值。

這裡有個反直覺的事實：Arena 自己不做 GPT、不做 Claude，它只評分。

但這個「裁判」角色讓他們抓到三個賺錢機會：

AI 公司訓練完新模型，需要證明「我們比 OpenAI 強」。Arena 提供 私有評測服務，讓企業在公開發表前先看排名。

那 1000 萬筆評價不是放著好看——其他公司可以付費接取 Arena 的 API，用來 訓練自己的模型 或 調整產品方向。

當所有人都在引用 Arena 的排名，這個品牌本身就是護城河。就像台灣人買手機會看 DxOMark 相機評分、挑筆電會看 Mobile01 討論，Arena 已經變成 AI 模型的「必過認證」。

你可能會想：這跟我有什麼關係？

其實關係很大：

簡單說：這個柏克萊學生做的網站，正在 定義什麼叫「好的 AI」。

Arena 的起點很單純：幾個研究生想做個工具，讓大家比較開源模型跟 GPT-4 誰厲害。

兩年後：

這個故事給台灣的啟示是：不一定要做最強的技術，找到「大家需要但沒人做」的位置，可能更有價值。

就像我們熟悉的 104 人力銀行 不做求職者培訓、591 房屋網 不蓋房子——但他們掌握了資訊的流動，就掌握了商業機會。

下次看到「GPT-4.5 擊敗 Claude 3.5」的新聞，記得去看看 Arena 的原始數據——那些分數背後是千萬個真人實測，不是廠商自己說了算。

如果你在做 AI 相關產品，也可以想想：你的產業裡，有沒有還沒人做的「裁判」角色？

試試看吧：打開 arena.ai，親自當一次 AI 評審，你就知道為什麼這個網站值 3 億了。