哈佛研究：ChatGPT 急診診斷正確率 92%，比兩位醫生還高

哈佛研究：ChatGPT 急診診斷正確率 92%，比兩位醫生還高

2026年5月6日 · 4 分鐘閱讀

哈佛研究：ChatGPT 急診診斷正確率 92%，比兩位醫生還高

急診室大震撼：AI 診斷打敗人類醫師

你半夜掛急診，最怕遇到什麼？等超久、檢查找不出問題、醫生看太快漏掉地雷。哈佛團隊最新研究直接給了一顆震撼彈：把 ChatGPT-4 丟進急診室，正確率 92%，同場較勁的兩位資深主治只有 86% 與 84%。

研究怎麼做？就像把 AI 丟進台大急診實戰

研究人員從美國兩家醫學中心撈出 500 筆真實病例，包含發燒、胸痛、外傷、肚子痛這些台灣急診天天遇到的狀況。接著：

把病歷「去識別化」→ 病歷只剩性別、年齡、主訴、檢驗數據，沒有名字。
同時給 ChatGPT-4、兩位急診主治 各自判讀最可能診斷與下一步檢查。
用「最終出院診斷」當標準答案，看誰猜得準。

結果出爐：

ChatGPT-4：92% 命中
醫師 A：86% 命中
醫師 B：84% 命中

AI 不只比較準，還平均 快 15 秒 給出鑑別名單，等於醫生還在翻病歷，AI 已經把「最可能的三個病」排好序。

為什麼 AI 能贏？就像隨身帶 3,000 萬份病歷小幫手

你可以把 ChatGPT-4 想成讀過全維基百科 + 3,000 萬篇醫學論文的書呆子，人腦再強也記不住這麼多。研究發現 AI 特別擅長：

抓罕見病：人類一輩子可能只遇 5 例，AI 卻「看過」上千例。
拼拼圖：把「胸口灼熱＋手臂麻＋冒冷汗」自動連成「疑似心肌梗塞」。
不會累：凌晨三點跟下午三點都給同一品質答案，不會被夜班拖垮。

台灣急診現場：護理師像陀螺、病人等到睡著

把場景拉回台灣——台大、林口長庚、中國附醫急診常常「滿床」。根據衛福部統計，全台急診平均等候住院要 180 分鐘，最塞的甚至 6 小時起跳。護理師要量血壓、打點滴、安撫家屬，還得幫醫生 key 資料，一個人當三個人用。

如果先用 AI 跑第一關：

病人掛號完，病歷即刻餵給 AI，15 秒產出「最可能 3 診斷＋建議檢查」。
醫生再根據 AI 提示快速確認，省去從頭頭想鑑別的時間。
研究估算，平均可縮短 30% 決策時間，等於原本等 3 小時，現在 2 小時就能躺床。

醫生會被取代嗎？研究這樣說

不會。急診科主任比喻：「AI 像導航，醫生才是司機。」

AI 給方向，但最終踩油門、轉彎、閃紅燈還是醫生。
研究裡 AI 仍有 8% 出包，需要人類覆核。
法律責任、與病人溝通、做侵入性處置，都得靠真人。

換句話說，AI 是幫醫生開外掛，把雜訊過濾掉，讓人類專心處理「要命」的部分。

你我該知道的三件事

下次急診更快：部分醫院已試點導入 AI 分診，等待時間有望再下降。
AI 也會錯：研究提醒，AI 可能「過度自信」，仍需醫師簽字才能執行。
資料隱私：病歷上雲端前會去識別化，名字、身分證、電話全數刪除，降低外洩風險。

現在就行動：把這篇存起來，下次掛急診不焦慮

分享給常跑急診的爸媽：讓他們知道科技正在讓醫院變快又準。
若你是護理師/醫檢師：可以跟院方資訊科討論導入 AI 分診，研究原始碼已開源在 GitHub。
若你是病人：掛號時主動提供完整主訴，AI 判讀越準，醫生越快對症下藥。

試試看吧，下次走進急診室，也許背後就有一套 AI 幫你先跑過一輪，讓你少等 1 小時、早點拿到藥、早點回家睡覺。