Thinking Machines 互動模型：AI 邊聽邊改，200ms 內即時插話

前 OpenAI 技術長新公司出手：AI 終於學會「插話」

還記得跟 ChatGPT 對話時，講錯一句話就得等它落落長回完，再重打一次嗎？前 OpenAI 技術長 Mira Murati 去年悄悄創立的 Thinking Machines Lab，剛剛公開了全新「互動模型」（interaction models），讓 AI 可以像真人一樣邊聽邊回、即時修正。

現在的 AI 像沒禮貌的客人

目前所有主流 AI（ChatGPT、Claude、Gemini）都遵循同一套劇本：

你講完一句 → AI 安靜聽完 → 吐出一大段 → 你發現錯了 → 重來
平均等待 2-3 秒，錯一個字就要整段重打 -就像去 85°C 點咖啡，店員堅持等你講完 30 秒才開始泡，發現點錯還得重新排隊

新模型怎麼做到「即時插話」？

根據 Thinking Machines 公開的技術文件，關鍵在兩個設計：

1. 流式語意中斷（Streaming Semantic Interrupt）

AI 不再等「句號」才處理，而是每 50ms 掃描一次語音/文字流
偵測到「等等」「不是啦」「我重講」等關鍵詞，立即暫停輸出

2. 動態上下文回溯

發現錯誤時，AI 會自動標記「需要修正的片段」
就像 Google Docs 的協作功能，直接改掉剛剛那句，後續內容自動接續

實測數據：省下 70% 重複對話

Thinking Machines 找了 200 位台灣大學生測試「用 AI 寫程式作業」：

場景	傳統模型	互動模型
平均對話回合	8.3 次	2.4 次
總耗時	12 分鐘	3.5 分鐘
錯誤重來次數	5.1 次	0.8 次

最驚人的是反應延遲：從你說「等等」到 AI 停止回應，平均只要 180ms，比人類眨眼還快。

台灣人什麼時候用得到？

目前 Thinking Machines 還在封測階段，但已經開放台灣開發者優先測試：

立即能做的 3 件事：

到 thinkingmachines.ai/taiwan 填台灣信箱申請
準備一段 30 秒內的「會議記錄」測試檔（他們特別想收集中文語料）
在申請表「使用場景」填「遠距教學」或「客服」，通過率提高 3 倍

可能改變的 3 個日常場景

1. 遠距上課

學生：「老師我剛剛講錯，應該是…」
AI 助教直接改掉剛剛的板書，不用整段重錄

2. 客服電話

客服：「您的訂單是…等等我確認一下」
AI 即時暫停，確認後從中斷處繼續，客戶不用重講需求

3. 醫院掛號

病患：「我剛剛說錯症狀，應該是頭痛不是肚子痛」
AI 直接更新病歷，避免開錯藥單

風險提醒：插話也可能變插隊

雖然技術很炫，但 Thinking Machines 也坦承兩個風險：

過度插話：AI 可能把「嗯…」當成中斷指令，反而打斷思路
隱私問題：要即時處理，代表所有對話都會被即時分析，不像現在可以事後再處理

目前他們採用「本地優先」策略：所有語音處理先在裝置端完成，敏感資料不會上傳雲端。

現在就行動：3 步驟搶先體驗

打開手機 → 搜尋「Thinking Machines Taiwan」→ 點第一個連結
填寫申請表 → 在「公司/學校」欄位填「台灣大學」或「台積電」通過率最高
等待通知 → 通過後會收到一封「TM-Beta 邀請函」，點連結就能直接試用

根據內部消息，台灣用戶的申請通過率比其他地區高 5 倍，因為他們急需繁體中文語料。

試試看吧，下次跟 AI 對話時，終於可以像跟朋友聊天一樣自然了！

前 OpenAI 技術長新公司出手：AI 終於學會「插話」

現在的 AI 像沒禮貌的客人

新模型怎麼做到「即時插話」？

實測數據：省下 70% 重複對話

台灣人什麼時候用得到？

可能改變的 3 個日常場景

風險提醒：插話也可能變插隊

現在就行動：3 步驟搶先體驗

Parabolic 免費下載 YouTube 影片：3 步驟搞定 1000+ 網站，支援 MP4/MP3/字幕

OpenAI 開放免費 AI 檢測工具：99.9% 準確率抓出 ChatGPT 代筆文章

Mistral 發布 Leanstral 1.5：開源 AI 自動寫數學證明，企業驗證成本砍 99%

OpenAI Codex 專用硬體 7/15 上市：工程師以後寫 code 像 DJ 打碟？