
语音 AI 企业 ElevenLabs 推出了新一代音乐生成模型 Music v2,该模型可在一首乐曲的播放过程中切换音乐风格。据官方介绍,这款模型能够同时处理复杂的人声演绎与乐曲编曲。距离这家初创公司推出初代音乐生成模型,本次更新时隔近十个月。
ElevenLabs 表示,该模型可实现从古典歌剧无缝切换到重金属音乐并来回转换,也能生成节奏紧凑的说唱段落且整体流畅连贯,还可在乐曲中加入非音乐类音效。创作者只需选中歌曲的某个片段,借助文字指令就能单独重制该部分,且不会影响曲目其他内容。
除此之外,该模型不再局限于生成短音频片段。创作者可分段制作前奏、主歌、副歌等乐曲段落,再将各部分拼接成完整歌曲。官方补充道,新版本在多语言适配、歌词创作、人声演绎和编曲制作方面的表现也更加稳定。
近几个月来,各大 AI 实验室竞相推出可制作专业级音乐的生成模型。谷歌、Stability AI 以及 Suno 均已发布新版音乐生成模型,能够创作更长、结构更复杂的曲目。在谷歌开发者大会上,其推出的 Flow Music 工具新增多项功能,支持快速制作歌曲翻唱、分段编辑乐曲以及生成音乐 MV。
ElevenLabs 着重说明,这款新模型基于授权合规数据训练而成,已获得商用许可,用户可自由使用生成的音乐作品。当下,与唱片公司达成版权合作至关重要,此前 Suno、Udio 等其他 AI 音乐初创企业就曾因版权问题卷入诉讼纠纷。
目前,该模型已上线至面向营销与品牌团队的 ElevenCreative 工具,以及全新推出的 AI 音乐创作平台 ElevenMusic;相关能力也即将接入 ElevenAPI 接口。
