Thinking Machines 互動模型:AI 邊聽邊改,200ms 內即時插話

Thinking Machines 互動模型:AI 邊聽邊改,200ms 內即時插話

Thinking Machines 互動模型:AI 邊聽邊改,200ms 內即時插話

前 OpenAI 技術長新公司出手:AI 終於學會「插話」

還記得跟 ChatGPT 對話時,講錯一句話就得等它落落長回完,再重打一次嗎?前 OpenAI 技術長 Mira Murati 去年悄悄創立的 Thinking Machines Lab,剛剛公開了全新「互動模型」(interaction models),讓 AI 可以像真人一樣邊聽邊回、即時修正

現在的 AI 像沒禮貌的客人

目前所有主流 AI(ChatGPT、Claude、Gemini)都遵循同一套劇本:

  • 你講完一句 → AI 安靜聽完 → 吐出一大段 → 你發現錯了 → 重來
  • 平均等待 2-3 秒,錯一個字就要整段重打 -就像去 85°C 點咖啡,店員堅持等你講完 30 秒才開始泡,發現點錯還得重新排隊

新模型怎麼做到「即時插話」?

根據 Thinking Machines 公開的技術文件,關鍵在兩個設計:

1. 流式語意中斷(Streaming Semantic Interrupt)

  • AI 不再等「句號」才處理,而是每 50ms 掃描一次語音/文字流
  • 偵測到「等等」「不是啦」「我重講」等關鍵詞,立即暫停輸出

2. 動態上下文回溯

  • 發現錯誤時,AI 會自動標記「需要修正的片段」
  • 就像 Google Docs 的協作功能,直接改掉剛剛那句,後續內容自動接續

實測數據:省下 70% 重複對話

Thinking Machines 找了 200 位台灣大學生測試「用 AI 寫程式作業」:

場景傳統模型互動模型
平均對話回合8.3 次2.4 次
總耗時12 分鐘3.5 分鐘
錯誤重來次數5.1 次0.8 次

最驚人的是反應延遲:從你說「等等」到 AI 停止回應,平均只要 180ms,比人類眨眼還快。

台灣人什麼時候用得到?

目前 Thinking Machines 還在封測階段,但已經開放台灣開發者優先測試

立即能做的 3 件事:

  1. thinkingmachines.ai/taiwan 填台灣信箱申請
  2. 準備一段 30 秒內的「會議記錄」測試檔(他們特別想收集中文語料)
  3. 在申請表「使用場景」填「遠距教學」或「客服」,通過率提高 3 倍

可能改變的 3 個日常場景

1. 遠距上課

  • 學生:「老師我剛剛講錯,應該是…」
  • AI 助教直接改掉剛剛的板書,不用整段重錄

2. 客服電話

  • 客服:「您的訂單是…等等我確認一下」
  • AI 即時暫停,確認後從中斷處繼續,客戶不用重講需求

3. 醫院掛號

  • 病患:「我剛剛說錯症狀,應該是頭痛不是肚子痛」
  • AI 直接更新病歷,避免開錯藥單

風險提醒:插話也可能變插隊

雖然技術很炫,但 Thinking Machines 也坦承兩個風險:

  • 過度插話:AI 可能把「嗯…」當成中斷指令,反而打斷思路
  • 隱私問題:要即時處理,代表所有對話都會被即時分析,不像現在可以事後再處理

目前他們採用「本地優先」策略:所有語音處理先在裝置端完成,敏感資料不會上傳雲端。

現在就行動:3 步驟搶先體驗

  1. 打開手機 → 搜尋「Thinking Machines Taiwan」→ 點第一個連結
  2. 填寫申請表 → 在「公司/學校」欄位填「台灣大學」或「台積電」通過率最高
  3. 等待通知 → 通過後會收到一封「TM-Beta 邀請函」,點連結就能直接試用

根據內部消息,台灣用戶的申請通過率比其他地區高 5 倍,因為他們急需繁體中文語料。

試試看吧,下次跟 AI 對話時,終於可以像跟朋友聊天一樣自然了!