Stability AI 发布 Stable Audio 3.0,支持最长六分钟音频曲目并开放模型权重

2026年05月21日 由 alex 发表 445 0

Stable-Audio-3.0-Thumbnail_16x9


Stability AI正式推出新一代音频模型 Stable Audio 3.0,该系列共有四款模型,其中三款开放模型权重。官方表示,这批模型可生成最长 6 分钟的音乐曲目,且全部采用合规授权数据集完成训练。


该音频模型家族包含四个版本。Stable Audio 3.0 Small SFX 和 Stable Audio 3.0 Small 均搭载 4.59 亿参数,在 H200 GPU上仅需 0.44 秒即可生成最长 2 分钟的音频内容。前者主打音效制作,适配智能手机与家用轻薄本;后者侧重短曲目音乐创作。Stable Audio 3.0 Medium 拥有 14 亿参数,可生成最长 6 分 20 秒的音频,推理耗时仅 1.31 秒。以上三款模型均已在Hugging Face平台开放权重下载。


参数规模达 27 亿的顶配版本 —— Stable Audio 3.0 Large 暂不开放权重,仅可通过Stability AI API、合作伙伴 fal.ai 调用,企业用户也可购买商业授权,部署至自有服务器使用。官方称该版本音乐创作质感最优,专为高批量音频生成的音乐平台打造。


全新架构 实现更长更灵活音频创作


Stability AI 介绍,Stable Audio 3.0 搭载全新架构,内置语义 - 声学自动编码器,支持制作时长更长、自由度更高的音频作品,可精准按秒自由调控生成音频时长。


官方称,仅有Stable Audio 3.0 Small支持端侧离线完整编曲,无短音频时长限制。作为对比,前代开源Stable Audio Open Small最长仅支持 11 秒音频生成,Stable Audio Open最长为 47 秒。此次官方还同步放出小型版与中型版模型的低秩适配(LoRA)训练教程,用户可依托自有音频素材库自主微调模型。


企业用户还可获得专属微调技术指导。模型新增音频填充编辑功能,支持单独修改音轨片段、批量编辑多段音频,还能在原有曲目基础上无缝续写延长音频。


商用政策:年收入百万美元以内可免费商用


依据Stability AI 社区许可协议,用户拥有所有生成音频的所有权,可直接用于商业用途。企业年营收超 100 万美元,则需向官方申请企业商用授权,解锁完整商业使用权限与法律赔付保障。


Stability AI表示,目前市面上同类开源音乐模型大多限制商用权限,或因使用无授权数据训练存在版权风险。而该企业背靠环球音乐集团、华纳音乐集团两大音乐巨头达成版权合作,彻底规避相关隐患。


从图像 AI 先驱转型音频领域


Stability AI 曾凭借稳定扩散模型引领开源图像生成赛道,自创始人 Emad Mostaque离职叠加持续资金压力后,企业发展重心全面转向音频领域。

2023 年 9 月初代Stable Audio正式面世,依托音频素材平台 AudioSparx 提供的 80 万首歌曲、音效及乐器采样完成训练;


2024 年 4 月推出Stable Audio 2.0,成为首批可商用、支持 44.1kHz 无损音质、最长 3 分钟完整曲目创作的 AI 音乐工具;

2024 年夏季推出Stable Audio Open开源版;

2025 年 5 月联合Arm发布适配手机端的Stable Audio Open Small;

2025 年 9 月上线Stable Audio 2.5 版本,面向专业音频制作,支持前奏、主段、尾声分段式编曲;

Stable Audio 3.0 版本完成架构统一,也将成为稳定 AI 下一代合规专业音频模型的核心基底。


版权判例之下 合规训练成核心优势


近期多国版权相关司法判决,让授权合规训练数据成为行业重中之重。

2025 年 11 月,德国慕尼黑法院裁定人工智能企业 OpenAI 构成版权侵权,原因是其大模型可通过简单指令复刻受版权保护的歌词内容。法院认定训练数据会留存于模型权重中并可被还原,也就是版权方所称的 “数据记忆现象”,目前该案件已进入上诉审理阶段。


当下 Suno、Udio 等主流 AI 音乐工具均深陷音乐行业版权诉讼纠纷,而Stability AI坚持全授权数据训练,并为企业用户提供法律赔付保障,主动避开版权争议赛道,在合规层面建立明显行业优势。

文章来源:https://the-decoder.com/stability-ai-launches-stable-audio-3-0-with-up-to-six-minute-tracks-and-open-weights/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消