OpenAI o1 急診實測：病歷 3 行字正確率 67%，比醫師高 12%

急診室被 AI 超前？哈佛最新研究數據出爐

哈佛醫學院與波士頓貝斯以色列醫療中心剛在《Science》丟出震撼彈：OpenAI 的 o1 模型只用「電子病歷＋護理師 3 句話」就能把診斷正確率衝到 67%，現場值班醫師卻只有 50–55%。資訊越片段，AI 贏越多，直接改寫急診室遊戲規則。

研究團隊把 76 位實際掛急診的病歷拆成 3 個時間點：

每個階段都讓 o1 與 2 位人類醫師「閉卷考」，只能看當下有的資料，再給出「最可能診斷」與「下一步建議」。

階段	人醫正確率	o1 正確率	差距
初到櫃台	42%	59%	+17%
護理師評估	50–55%	67%	+12%
完整報告	70–79%	82%	統計上不顯著

👉 資訊越少，AI 優勢越大；等資料齊全，人醫也能追到 8 成。

場景 1｜檢傷分級 把 o1 嵌進 HIS，病人一刷健保卡，AI 先跑高風險名單，護理師再複核，縮短排隊 20–30%。

場景 2｜偏鄉夜診 山地離島夜裡只有 1 位值班醫師，AI 先幊初步名單，醫師電話視訊再確認，降低誤判。

場景 3｜醫學生訓練 把 o1 當「隨身教案」，實習醫師先自己猜診斷，再跟 AI 比對，一周就能累積 300 例經驗值。

研究作者強調：「o1 最強的是早期過濾，不是終極診斷。」就像掃地雷，AI 先插旗，人醫再拆彈。未來流程可能是：

把寶貴的「醫師腦力」留給真正需要手術或溝通的病人。

當台灣急診平均等候 2.5 小時、護理師離職率突破 20%，任何能「先分流、先提醒」的工具都該試。o1 給出的不只是 67% 正確率，而是讓醫護把專注力留給「人」的價值：安慰、解釋、做困難決定。

試試看吧，把 AI 當作「最強實習醫師」，讓它先熬夜，你專心救人。