Vidu更新Q1 AI视频生成模型，支持多达七个图像输入

2025年07月08日由佚名发表 690 0

屏幕截图2025-07-09100057

Vidu AI是由中国公司盛数科技开发的生成式人工智能视频平台。今天，该公司宣布其最新的Q1模型更新，具备由语义理解驱动的高级“参考到视频”功能。

该公司正在开发一个生成视频的AI模型，与OpenAI的Sora竞争。该模型能够生成生动的视频序列。此次更新允许在制作涉及多个元素的视频场景时提供更丰富的视频背景，这些元素在不同片段的帧之间保持一致。

用户现在可以上传多达七张参考图像，并提供一个将它们结合在一起的提示，供AI在场景中使用。例如，AI使用公司称之为“语义理解”的技术来参考图像，并将其与文本提示相关联，甚至推断缺失的元素以生成关键对象。

“这次更新突破了创作者认为他们可以用AI视频实现的极限，”首席执行官罗一航表示。“通过扩展多图像引用以支持多达七个输入，我们正在更接近于让用户创建完全实现的场景，完整的角色、物体和背景。”

例如，用户可以上传一张穿绿色连衣裙的年轻女子的图像、一幅田园诗般的森林场景和一只猫头鹰。然后输入提示：“女子在森林中拉小提琴，而猫头鹰在日出时飞下来，落在附近的树枝上。”

罗一航表示，Vidu Q1语义核心引擎将在她手中生成小提琴，保持整个片段的场景一致性和叙述质量。使用这项技术，创作者在尝试创建复杂场景时不再需要面对陡峭的技术障碍。制作一致的视频场景时，他们只需要文本提示和图像。

Vidu正在与Google LLC的Veo 3竞争，该产品于五月底发布。其生成视频功能包括自然的英语提示和参考图像，以及一个名为Flow的电影制作工具，允许用户管理叙述设计，以开发包括视觉效果、特效和音频（包括语音）的完整短篇AI生成电影。

盛数科技在三月底宣布与洛杉矶的动画工作室Aura Productions合作发布一部50集的短片科幻动漫系列，完全由AI生成。该项目旨在通过使用AI能力增强传统叙述技术来重新定义数字娱乐。计划今年在主要社交媒体平台上发布。

“AI不再仅仅是一个工具；它是一种创造性的增强，允许我们在保持艺术完整性的同时扩大生产规模，”Aura的节目负责人D.T. Carpenter在接受《Variety》采访时谈到这个项目。

文章来源：https://siliconangle.com/2025/07/08/vidu-updates-q1-ai-video-generation-model-handle-seven-image-inputs/

标签：

OpenAI

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 OpenAI加强安全措施以防止信息泄露

下一篇在谷歌云上使用Apache Iceberg和Apache Spark构建现代数据湖仓

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术

每个人都应该知道的48个AI术语

openwebtext glue shunk031/JGLUE piqa wikitext sciq EleutherAI/lambada_openai facebook/flores

AI热点

行业学习机器学习人工智能公司板人工智能未来机器人视觉识别

AI工具

更多工具 »

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

热门企业

更多企业 »

热门职位

更多职位 »

深度学习软件工程师

Maluuba

20000~40000/月

Unity技术经理

Cisco

25000~30000/月深圳市

高级数据分析工程师

PilotAILabs

30000~60000/年深圳市