Stable Audio 3.0 免費釋出:手機 2 分鐘生成 6 分鐘音樂,剪片不再花錢買版權

Stable Audio 3.0 免費釋出:手機 2 分鐘生成 6 分鐘音樂,剪片不再花錢買版權

Stable Audio 3.0 免費釋出:手機 2 分鐘生成 6 分鐘音樂,剪片不再花錢買版權

免費音樂 AI 來了!Stable Audio 3.0 一次給你 4 種模型

還在為 YouTube 背景音樂付月費嗎?開發出 Stable Diffusion 的 Stability AI 剛剛丟出 Stable Audio 3.0,直接把音樂生成 AI 變成免費大餐。這次一次釋出 4 種模型,從手機跑到工作站都有得玩。

4 種模型怎麼選?一張表看懂

模型名稱最長音樂適用裝置特色
Small2 分鐘手機、筆電輕量級,做短影片 BGM
Small SFX2 分鐘手機、筆電專門做音效,按鈕聲、腳步聲
Medium6 分 20 秒桌機音樂細節更豐富
Large6 分 20 秒高階顯卡旗艦級,音質最好

👉 重點:Small、Small SFX、Medium 三個模型完全免費開源,直接從 Hugging Face 下載就能用。

實測:用 Medium 模型 3 步做出 Lo-fi 背景音樂

步驟 1:開啟 Hugging Face

打開瀏覽器進入:

步驟 2:輸入中文 Prompt

在「Text Prompt」欄位直接打中文也通:

Lo-fi hip-hop,台北下雨的咖啡廳,90 BPM,輕鬆慵懶,適合讀書背景

步驟 3:下載 & 剪輯

按下 Generate 等 30 秒,直接下載 WAV 檔,拖進 CapCut 或 Premiere 就能用。

進階玩法:讓 AI 接續你的音樂

Stable Audio 3.0 不只是從零生成,還能做兩件事:

  • 音樂接龍:上傳你現有的 30 秒音樂,AI 自動延長到 6 分鐘
  • 風格轉換:用 LoRA 微調,把流行歌變成爵士版

實際案例

小安在做畢業專題影片,原本用 Artlist 月付 600 台幣。現在:

  1. 用 Medium 模型生成 6 分鐘 Lo-fi
  2. 用 ComfyUI 工作流程自動化
  3. 一個月省下 600 元,還能商用

台灣創作者最在意的 3 件事

1. 版權問題

Stable Audio 3.0 標榜訓練資料「完全合法授權」,可以商用。但建議還是留一下生成紀錄,避免 YouTube 版權警告。

2. 中文 Prompt 效果

實測打中文描述「夜市小吃攤的熱鬧氛圍」也能生成接近的聲音,但英文 Prompt 細節更精準。

3. 手機跑得動嗎?

Small 模型在 iPhone 15 Pro 上跑 2 分鐘音樂只要 45 秒,發熱不明顯。安卓旗艦機也 OK。

現在就打開 Hugging Face 試試

免費模型已經上架,直接下載就能玩。剪片、Podcast、遊戲配樂都能用。記得先從 Medium 模型開始,效果最平衡。

試試看吧! 打開 stable-audio-3-medium,輸入你的第一個 Prompt,30 秒後就有專屬背景音樂。