免費音樂 AI 來了!Stable Audio 3.0 一次給你 4 種模型
還在為 YouTube 背景音樂付月費嗎?開發出 Stable Diffusion 的 Stability AI 剛剛丟出 Stable Audio 3.0,直接把音樂生成 AI 變成免費大餐。這次一次釋出 4 種模型,從手機跑到工作站都有得玩。
4 種模型怎麼選?一張表看懂
| 模型名稱 | 最長音樂 | 適用裝置 | 特色 |
|---|---|---|---|
| Small | 2 分鐘 | 手機、筆電 | 輕量級,做短影片 BGM |
| Small SFX | 2 分鐘 | 手機、筆電 | 專門做音效,按鈕聲、腳步聲 |
| Medium | 6 分 20 秒 | 桌機 | 音樂細節更豐富 |
| Large | 6 分 20 秒 | 高階顯卡 | 旗艦級,音質最好 |
👉 重點:Small、Small SFX、Medium 三個模型完全免費開源,直接從 Hugging Face 下載就能用。
實測:用 Medium 模型 3 步做出 Lo-fi 背景音樂
步驟 1:開啟 Hugging Face
打開瀏覽器進入:
步驟 2:輸入中文 Prompt
在「Text Prompt」欄位直接打中文也通:
Lo-fi hip-hop,台北下雨的咖啡廳,90 BPM,輕鬆慵懶,適合讀書背景
步驟 3:下載 & 剪輯
按下 Generate 等 30 秒,直接下載 WAV 檔,拖進 CapCut 或 Premiere 就能用。
進階玩法:讓 AI 接續你的音樂
Stable Audio 3.0 不只是從零生成,還能做兩件事:
- 音樂接龍:上傳你現有的 30 秒音樂,AI 自動延長到 6 分鐘
- 風格轉換:用 LoRA 微調,把流行歌變成爵士版
實際案例
小安在做畢業專題影片,原本用 Artlist 月付 600 台幣。現在:
- 用 Medium 模型生成 6 分鐘 Lo-fi
- 用 ComfyUI 工作流程自動化
- 一個月省下 600 元,還能商用
台灣創作者最在意的 3 件事
1. 版權問題
Stable Audio 3.0 標榜訓練資料「完全合法授權」,可以商用。但建議還是留一下生成紀錄,避免 YouTube 版權警告。
2. 中文 Prompt 效果
實測打中文描述「夜市小吃攤的熱鬧氛圍」也能生成接近的聲音,但英文 Prompt 細節更精準。
3. 手機跑得動嗎?
Small 模型在 iPhone 15 Pro 上跑 2 分鐘音樂只要 45 秒,發熱不明顯。安卓旗艦機也 OK。
現在就打開 Hugging Face 試試
免費模型已經上架,直接下載就能玩。剪片、Podcast、遊戲配樂都能用。記得先從 Medium 模型開始,效果最平衡。
試試看吧! 打開 stable-audio-3-medium,輸入你的第一個 Prompt,30 秒後就有專屬背景音樂。