哈佛研究:ChatGPT 急診診斷正確率 92%,比兩位醫生還高

哈佛研究:ChatGPT 急診診斷正確率 92%,比兩位醫生還高

哈佛研究:ChatGPT 急診診斷正確率 92%,比兩位醫生還高

急診室大震撼:AI 診斷打敗人類醫師

你半夜掛急診,最怕遇到什麼?等超久、檢查找不出問題、醫生看太快漏掉地雷。哈佛團隊最新研究直接給了一顆震撼彈:把 ChatGPT-4 丟進急診室,正確率 92%,同場較勁的兩位資深主治只有 86% 與 84%。

研究怎麼做?就像把 AI 丟進台大急診實戰

研究人員從美國兩家醫學中心撈出 500 筆真實病例,包含發燒、胸痛、外傷、肚子痛這些台灣急診天天遇到的狀況。接著:

  1. 把病歷「去識別化」→ 病歷只剩性別、年齡、主訴、檢驗數據,沒有名字。
  2. 同時給 ChatGPT-4兩位急診主治 各自判讀最可能診斷與下一步檢查。
  3. 用「最終出院診斷」當標準答案,看誰猜得準。

結果出爐:

  • ChatGPT-4:92% 命中
  • 醫師 A:86% 命中
  • 醫師 B:84% 命中

AI 不只比較準,還平均 快 15 秒 給出鑑別名單,等於醫生還在翻病歷,AI 已經把「最可能的三個病」排好序。

為什麼 AI 能贏?就像隨身帶 3,000 萬份病歷小幫手

你可以把 ChatGPT-4 想成讀過全維基百科 + 3,000 萬篇醫學論文的書呆子,人腦再強也記不住這麼多。研究發現 AI 特別擅長:

  • 抓罕見病:人類一輩子可能只遇 5 例,AI 卻「看過」上千例。
  • 拼拼圖:把「胸口灼熱+手臂麻+冒冷汗」自動連成「疑似心肌梗塞」。
  • 不會累:凌晨三點跟下午三點都給同一品質答案,不會被夜班拖垮。

台灣急診現場:護理師像陀螺、病人等到睡著

把場景拉回台灣——台大、林口長庚、中國附醫急診常常「滿床」。根據衛福部統計,全台急診平均等候住院要 180 分鐘,最塞的甚至 6 小時起跳。護理師要量血壓、打點滴、安撫家屬,還得幫醫生 key 資料,一個人當三個人用

如果先用 AI 跑第一關:

  • 病人掛號完,病歷即刻餵給 AI,15 秒產出「最可能 3 診斷+建議檢查」。
  • 醫生再根據 AI 提示快速確認,省去從頭頭想鑑別的時間
  • 研究估算,平均可縮短 30% 決策時間,等於原本等 3 小時,現在 2 小時就能躺床。

醫生會被取代嗎?研究這樣說

不會。急診科主任比喻:「AI 像導航,醫生才是司機。」

  • AI 給方向,但最終踩油門、轉彎、閃紅燈還是醫生。
  • 研究裡 AI 仍有 8% 出包,需要人類覆核。
  • 法律責任、與病人溝通、做侵入性處置,都得靠真人。

換句話說,AI 是幫醫生開外掛,把雜訊過濾掉,讓人類專心處理「要命」的部分。

你我該知道的三件事

  1. 下次急診更快:部分醫院已試點導入 AI 分診,等待時間有望再下降。
  2. AI 也會錯:研究提醒,AI 可能「過度自信」,仍需醫師簽字才能執行。
  3. 資料隱私:病歷上雲端前會去識別化,名字、身分證、電話全數刪除,降低外洩風險。

現在就行動:把這篇存起來,下次掛急診不焦慮

  • 分享給常跑急診的爸媽:讓他們知道科技正在讓醫院變快又準。
  • 若你是護理師/醫檢師:可以跟院方資訊科討論導入 AI 分診,研究原始碼已開源在 GitHub。
  • 若你是病人:掛號時主動提供完整主訴,AI 判讀越準,醫生越快對症下藥

試試看吧,下次走進急診室,也許背後就有一套 AI 幫你先跑過一輪,讓你少等 1 小時、早點拿到藥、早點回家睡覺