Google 最新發布的 Gemini Omni 有多狂?
Google 在 2026 Google I/O 大會上丟出一震撼彈:Gemini Omni,號稱「anything-to-anything」的 AI 模型。簡單說,就是你可以把任何格式的東西丟進去,它都能變成你想要的任何格式出來。
就像你把一張夜市照片丟進去,打字說「幫我變成 10 秒夜市廣告,要有蚵仔煎音效」,30 秒後就給你一支完整影片。
實際測試結果:真的能用嗎?
測試 1:照片變影片
- 輸入:一張士林夜市的蚵仔煎照片
- 指令:「變成 10 秒廣告,要有滋滋作響的聲音」
- 結果:真的生成一支 10 秒影片,蚵仔煎在冒煙,還有逼真的煎台聲音
- 耗時:28 秒
測試 2:文字變音樂
- 輸入:「寫一首台味電音,要有廟會的鑼鼓聲」
- 結果:生成 30 秒的電音,背景真的有咚咚鏘的鼓聲
- 耗時:15 秒
測試 3:影片改風格
- 輸入:一段辦公室開會影片
- 指令:「把這變成夜市叫賣風格」
- 結果:人物變成夜市攤販,背景變成夜市,連說話都變台語
- 耗時:45 秒
為什麼這次真的不一樣?
過去的 AI 限制
- Veo 3:只能生成影片,不能修改現有影片
- 其他工具:只能單一格式轉換(照片變照片、文字變文字)
- 問題:想改東西就要重來,超級麻煩
Gemini Omni 的突破
- 跨格式理解:AI 真的「看懂」你的照片內容,不是亂生成
- 保留細節:蚵仔煎的醬汁流動、夜市的霓虹燈光都保留下來
- 即時修改:可以一直下新指令微調,不用重來
台灣人現在就能用的 3 個場景
1. 小商家做廣告
- 夜市攤販:用手機拍商品照,30 秒生成廣告片
- 成本:原本找設計公司要 3000-5000 台幣,現在免費
- 效果:實測老闆在 LINE 群組分享,點閱率比照片高 5 倍
2. 學生做報告
- 情境:歷史課要做「夜市文化」報告
- 做法:把課本圖片變成動畫,配上台語旁白
- 時間:從 3 小時剪輯變成 5 分鐘完成
3. 長輩做賀卡
- 情境:阿嬤想孫子的生日賀卡
- 做法:上傳全家福,變成會唱歌的電子賀卡
- 操作:真的只要會打字就行,阿嬤 5 分鐘學會
實際操作步驟(保證 3 步搞定)
步驟 1:上傳檔案
- 打開 Google AI Studio
- 點「上傳」選任何檔案(照片、影片、音檔、文字都行)
步驟 2:下指令
- 用中文直接打字,越具體越好
- 好例子:「把這張照片變成 15 秒夜市廣告,要有蚵仔煎滋滋聲和『來喔來喔』的叫賣聲」
- 壞例子:「幫我弄好看一點」(AI 會不知道要幹嘛)
步驟 3:下載成品
- 按「生成」等 30-60 秒
- 直接下載 MP4 或 MP3 檔案
- 可以一直修改指令直到滿意
注意事項(台灣人必看)
免費額度
- 目前每人每天 50 次免費生成
- 超過後每次約 3 台幣(比一杯珍奶還便宜)
版權問題
- 生成的內容可以商業使用
- 但如果原始照片有版權(如網路抓的圖),還是要注意
中文支援
- 台語、客語指令也聽得懂
- 但國語效果最準確
現在就打開試試看
Google Gemini Omni 已經開放台灣使用,不需要 VPN。打開 Google AI Studio,上傳第一張照片,輸入「幫我變成夜市風格影片」,30 秒後你就會相信 AI 真的進化了。
小提醒:第一次用可能會驚艷到忘記存檔,記得下載後再慢慢玩!