EMO模型正式上线通义APP,免费开放AI生成视频功能

2024年04月26日 由 neo 发表 45 0

近日,备受瞩目的EMO模型终于上线通义APP,并面向所有用户免费开放使用。这款AI模型以其独特的照片唱歌功能,让用户能够轻松实现让图中人物开口唱歌说话的效果,引发了广泛关注。

据悉,用户只需将一段音频或一张照片输入EMO模型,即可让奥黛丽·赫本唱起《上春山》、陶俑仕女说英文RAP,甚至让爱因斯坦用中文讲段子。这种全新的AI生成视频功能为用户带来了全新的创意体验。

s_3e2caa0a77ff422388cdc7f352690fcf

在通义APP中,用户进入“全民舞台”频道后,即可找到EMO产品的页面“全民唱演”。在这里,用户可以选择歌曲、热梗、表情包等丰富的模板,并上传自己的肖像照片。随后,EMO模型将根据所选模板和照片,快速合成一段生动有趣的视频。

目前,通义APP首批上线了80多个EMO模板,包括热门歌曲《上春山》《野狼disco》等以及网络热梗“钵钵鸡”“回手掏”等,为用户提供了丰富的选择。不过,目前通义APP暂未开放用户自定义音频的功能,用户只能选择APP预置的音频来生成视频。

EMO模型是通义实验室研发的AI模型,其背后的肖像说话(Talking Head)技术是当前AIGC领域的热门话题。与之前的Talking Head技术相比,EMO模型采用了弱控制设计,无需针对人脸、人头或身体部分进行3D建模,即可驱动肖像开口说话。这一创新不仅降低了视频生成的成本,还大幅提升了视频生成的质量。

此外,EMO模型还具备学习并编码人类表达情绪的能力。它能够将音频内容与人物的表情、嘴型进行精准匹配,并将音频的语气特征和情绪色彩反映到人物的微表情上,使生成的视频更加生动逼真。

今年2月底,通义实验室公布了关于EMO模型的相关论文,使其迅速成为继SORA之后最受关注的AI模型之一。现在,通义APP的推出让所有人都可免费体验这一前沿模型的创造力。

未来,随着EMO技术的不断发展和完善,有望广泛应用于数字人、数字教育、影视制作、虚拟陪伴、电商直播等多个领域,为用户带来更多创新和便利。

文章来源:https://news.mydrivers.com/1/976/976554.htm
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消