谷歌正在更新 Gemini 应用程序,以一种控制其 AI 视频模型的新方法。在最新版本中,用户可以为单个视频提示上传多个参考图像。然后,系统根据这些图像与文本相结合生成视频和音频,使人们能够更直接地控制最终剪辑的外观和声音。
谷歌此前曾在该公司扩展的视频人工智能平台 Flow 中测试了此功能。Flow 还支持扩展现有剪辑和将多个场景拼接在一起,并且它提供的视频配额比 Gemini 应用程序略高。Veo 3.1 自 10 月中旬开始推出,据谷歌称,它比 Veo 3.0 提供更逼真的纹理、更高的输入保真度和更好的音频质量。
