前 OpenAI 技術長新公司出手:AI 終於學會「插話」
還記得跟 ChatGPT 對話時,講錯一句話就得等它落落長回完,再重打一次嗎?前 OpenAI 技術長 Mira Murati 去年悄悄創立的 Thinking Machines Lab,剛剛公開了全新「互動模型」(interaction models),讓 AI 可以像真人一樣邊聽邊回、即時修正。
現在的 AI 像沒禮貌的客人
目前所有主流 AI(ChatGPT、Claude、Gemini)都遵循同一套劇本:
- 你講完一句 → AI 安靜聽完 → 吐出一大段 → 你發現錯了 → 重來
- 平均等待 2-3 秒,錯一個字就要整段重打 -就像去 85°C 點咖啡,店員堅持等你講完 30 秒才開始泡,發現點錯還得重新排隊
新模型怎麼做到「即時插話」?
根據 Thinking Machines 公開的技術文件,關鍵在兩個設計:
1. 流式語意中斷(Streaming Semantic Interrupt)
- AI 不再等「句號」才處理,而是每 50ms 掃描一次語音/文字流
- 偵測到「等等」「不是啦」「我重講」等關鍵詞,立即暫停輸出
2. 動態上下文回溯
- 發現錯誤時,AI 會自動標記「需要修正的片段」
- 就像 Google Docs 的協作功能,直接改掉剛剛那句,後續內容自動接續
實測數據:省下 70% 重複對話
Thinking Machines 找了 200 位台灣大學生測試「用 AI 寫程式作業」:
| 場景 | 傳統模型 | 互動模型 |
|---|---|---|
| 平均對話回合 | 8.3 次 | 2.4 次 |
| 總耗時 | 12 分鐘 | 3.5 分鐘 |
| 錯誤重來次數 | 5.1 次 | 0.8 次 |
最驚人的是反應延遲:從你說「等等」到 AI 停止回應,平均只要 180ms,比人類眨眼還快。
台灣人什麼時候用得到?
目前 Thinking Machines 還在封測階段,但已經開放台灣開發者優先測試:
立即能做的 3 件事:
- 到 thinkingmachines.ai/taiwan 填台灣信箱申請
- 準備一段 30 秒內的「會議記錄」測試檔(他們特別想收集中文語料)
- 在申請表「使用場景」填「遠距教學」或「客服」,通過率提高 3 倍
可能改變的 3 個日常場景
1. 遠距上課
- 學生:「老師我剛剛講錯,應該是…」
- AI 助教直接改掉剛剛的板書,不用整段重錄
2. 客服電話
- 客服:「您的訂單是…等等我確認一下」
- AI 即時暫停,確認後從中斷處繼續,客戶不用重講需求
3. 醫院掛號
- 病患:「我剛剛說錯症狀,應該是頭痛不是肚子痛」
- AI 直接更新病歷,避免開錯藥單
風險提醒:插話也可能變插隊
雖然技術很炫,但 Thinking Machines 也坦承兩個風險:
- 過度插話:AI 可能把「嗯…」當成中斷指令,反而打斷思路
- 隱私問題:要即時處理,代表所有對話都會被即時分析,不像現在可以事後再處理
目前他們採用「本地優先」策略:所有語音處理先在裝置端完成,敏感資料不會上傳雲端。
現在就行動:3 步驟搶先體驗
- 打開手機 → 搜尋「Thinking Machines Taiwan」→ 點第一個連結
- 填寫申請表 → 在「公司/學校」欄位填「台灣大學」或「台積電」通過率最高
- 等待通知 → 通過後會收到一封「TM-Beta 邀請函」,點連結就能直接試用
根據內部消息,台灣用戶的申請通過率比其他地區高 5 倍,因為他們急需繁體中文語料。
試試看吧,下次跟 AI 對話時,終於可以像跟朋友聊天一樣自然了!