谷歌推出了新的视频模型Veo 3.1,具备改进的音频输出、精细的编辑控制以及更佳的图像到视频转换效果。谷歌表示,Veo 3.1是在五月发布的Veo 3基础上构建的并能够生成更逼真的片段,更好地响应用户提示。
谷歌表示,该模型允许用户在视频中添加对象,并使其与片段风格融为一体。不久之后,用户还将能够在Flow中从视频中移除现有对象。
Veo 3已经具备多种编辑功能,例如添加参考图像来驱动角色,提供首尾帧以使用AI生成片段,以及根据最后几帧扩展现有视频的能力。通过Veo 3.1,谷歌为所有这些功能添加了音频,使片段更加生动。
公司正在将该模型推广到其视频编辑器Flow、Gemini应用程序,以及Vertex和Gemini API。谷歌表示,自Flow在五月推出以来,用户已经在该应用上创建了超过2.75亿个视频。