Likesmile AI 发布了开源的文本转语音模型 Chatterbox Turbo,可在五秒内克隆语音

2025年12月29日 由 alex 发表 1909 0

人工智能初创公司Resemble AI正与Elevenlabs合作,推出“Chatterbox Turbo”,这是一种开放的文本转语音模型,能够从仅需五秒钟的音频中克隆出语音。


公司声称其新型号在语音质量上超过了Elevenlabs和Cartesia,同时首次音频输出时间不到150毫秒。这种速度可能使开发者在构建实时客服、客户支持系统、游戏、头像和社交平台时具有吸引力。受监管行业的公司也可能发现模型内置的“PerTh”水印有助于验证言论是否由人工智能生成。




Resemble AI 发布了 Chatterbox Turbo 的 MIT 许可,这意味着任何人都可以免费使用、调整和再分发,甚至用于商业项目。该模型可在 Hugging Face、RunPod、Modal、Replicate 和 Fal 上试用,完整代码可在 GitHub 上下载。Resemble AI 还提供托管服务,并即将推出低延迟版本。

文章来源:https://the-decoder.com/resemble-ai-drops-chatterbox-turbo-an-open-source-text-to-speech-model-that-clones-voices-in-five-seconds/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消