Google Gemini 现在允许用户在每次输入时使用多个参考图像来引导 AI 视频

2025年11月17日 由 alex 发表 872 0

谷歌正在更新 Gemini 应用程序,以一种控制其 AI 视频模型的新方法。在最新版本中,用户可以为单个视频提示上传多个参考图像。然后,系统根据这些图像与文本相结合生成视频和音频,使人们能够更直接地控制最终剪辑的外观和声音。




谷歌此前曾在该公司扩展的视频人工智能平台 Flow 中测试了此功能。Flow 还支持扩展现有剪辑和将多个场景拼接在一起,并且它提供的视频配额比 Gemini 应用程序略高。Veo 3.1 自 10 月中旬开始推出,据谷歌称,它比 Veo 3.0 提供更逼真的纹理、更高的输入保真度和更好的音频质量。

文章来源:https://the-decoder.com/gemini-now-lets-users-guide-ai-video-with-multiple-reference-images-per-input/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消