EMO模型正式上线通义APP，免费开放AI生成视频功能

2024年04月26日由 neo 发表 2757 0

近日，备受瞩目的EMO模型终于上线通义APP，并面向所有用户免费开放使用。这款AI模型以其独特的照片唱歌功能，让用户能够轻松实现让图中人物开口唱歌说话的效果，引发了广泛关注。

据悉，用户只需将一段音频或一张照片输入EMO模型，即可让奥黛丽·赫本唱起《上春山》、陶俑仕女说英文RAP，甚至让爱因斯坦用中文讲段子。这种全新的AI生成视频功能为用户带来了全新的创意体验。

s_3e2caa0a77ff422388cdc7f352690fcf

在通义APP中，用户进入“全民舞台”频道后，即可找到EMO产品的页面“全民唱演”。在这里，用户可以选择歌曲、热梗、表情包等丰富的模板，并上传自己的肖像照片。随后，EMO模型将根据所选模板和照片，快速合成一段生动有趣的视频。

目前，通义APP首批上线了80多个EMO模板，包括热门歌曲《上春山》《野狼disco》等以及网络热梗“钵钵鸡”“回手掏”等，为用户提供了丰富的选择。不过，目前通义APP暂未开放用户自定义音频的功能，用户只能选择APP预置的音频来生成视频。

EMO模型是通义实验室研发的AI模型，其背后的肖像说话（Talking Head）技术是当前AIGC领域的热门话题。与之前的Talking Head技术相比，EMO模型采用了弱控制设计，无需针对人脸、人头或身体部分进行3D建模，即可驱动肖像开口说话。这一创新不仅降低了视频生成的成本，还大幅提升了视频生成的质量。

此外，EMO模型还具备学习并编码人类表达情绪的能力。它能够将音频内容与人物的表情、嘴型进行精准匹配，并将音频的语气特征和情绪色彩反映到人物的微表情上，使生成的视频更加生动逼真。

今年2月底，通义实验室公布了关于EMO模型的相关论文，使其迅速成为继SORA之后最受关注的AI模型之一。现在，通义APP的推出让所有人都可免费体验这一前沿模型的创造力。

未来，随着EMO技术的不断发展和完善，有望广泛应用于数字人、数字教育、影视制作、虚拟陪伴、电商直播等多个领域，为用户带来更多创新和便利。

文章来源：https://news.mydrivers.com/1/976/976554.htm

标签：

通义千问 AI视频

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 Profluent推出首个AI设计基因编辑器OpenCRISPR-1

下一篇【评估】医疗数据的差异隐私和联合学习

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术