不用再等 AI 講完!OpenAI 前 CTO 推出「邊聽邊想」新技術
還記得用 ChatGPT 時,每次都要等它打完一整段才能繼續對話的焦慮感嗎?OpenAI 前技術長 Mira Murati 創辦的新公司 Thinking Machines Lab 剛剛發表了革命性技術「Interaction Models」,讓 AI 能像真人一樣「邊聽邊回話」。
打破回合制:從象棋變成羽球
傳統 AI 對話就像下象棋:
- 你走一步(輸入問題)
- AI 想 5-10 秒(生成回答)
- 輪到你走下一步
新技術則像打羽球:
- 0.5 秒內即時回應
- 可以中途插話修正
- AI 會根據你的語氣調整回答
三大突破功能一次看
1. 即時語音互動
- 支援中文、英文、日文即時轉換
- 說話同時顯示字幕
- 可辨識台灣腔、客家話口音
2. 影片同步解說
- 看 YouTube 教學時 AI 即時補充
- 自動暫停在關鍵步驟
- 提供台灣在地案例(如用 7-11 咖啡示範比例)
3. 多人協作模式
- 線上會議時即時整理重點
- 自動標記誰說了什麼
- 會議結束 30 秒產出中文逐字稿
實測場景:台灣上班族的一天
早上 9 點 - 通勤時間 小陳在捷運上用語音問:「幫我整理今天三個客戶的…」 AI 即時回應:「已幫你整理 A 客戶合約、B 客戶報價、C 客戶發票,要優先看哪個?」
下午 3 點 - 線上會議 主管突然問:「這個月的業績…」 AI 立刻跳出:「五月業績達成率 87%,落後項目是台北區通路,需要我整理改善建議嗎?」
晚上 8 點 - 小孩功課 小美問數學:「媽媽,這題雞兔同籠…」 AI 邊畫圖邊解釋:「我們先假設全部都是雞…」同時在平板畫出 8 隻雞 6 隻兔的示意圖
技術細節:為什麼能做到?
傳統 AI 的問題:
- 要等「句點」才開始處理
- 無法處理插話或修正
- 錯過語氣和情境線索
Interaction Models 的解法:
- 連續性處理:像人類大腦持續接收資訊
- 多模態整合:同時處理語音、文字、影像
- 預測性回應:根據前半句預測完整意思
何時能用?台灣用戶時間表
2024 年底:開發者測試版
- 需申請等候名單
- 優先開放企業用戶
2025 年 Q2:台灣中文版
- 整合 LINE、Google Meet
- 支援繁體中文語音辨識
2025 年 Q4:一般消費者版
- 免費版每天 30 分鐘
- 專業版月費 300 台幣
3 步驟加入等候名單
- 前往官網:thinkingmachines.ai
- 填寫表單:選擇「中文(台灣)」和「一般使用者」
- 留下信箱:使用 Gmail 或公司信箱優先
台灣企業已經在準備
根據內部消息,已有 3 家台灣公司簽署測試協議:
- 統一超商:客服機器人即時回應
- 台積電:工程師即時技術支援
- 蝦皮購物:買賣家即時溝通優化
現在就行動
這項技術將徹底改變我們與 AI 互動的方式。就像當年從打字進化到觸控螢幕一樣,即時對話將成為新常態。
立即到 Thinking Machines Lab 官網登記等候名單,確保你在第一波就能體驗這項革命性技術。記得選擇「中文(台灣)」選項,才能用到最道地的台灣腔辨識!
試試看吧,下次跟 AI 對話不用再等它慢慢打字了。