Midjourney是最受欢迎的AI图像生成初创公司之一,该公司于周三宣布了推出其备受期待的AI视频生成模型V1。
V1是一个图像到视频的模型,用户可以上传一张图片,或者使用Midjourney其他模型生成的图片,然后V1会基于此生成一组四个五秒的视频。与Midjourney的图像模型类似,V1仅通过Discord提供,并且在发布时仅在网络上可用。
V1的推出使Midjourney与其他公司的AI视频生成模型展开竞争,如OpenAI的Sora、Runway的Gen 4、Adobe的Firefly和Google的Veo 3。虽然许多公司专注于开发可控的AI视频模型以用于商业环境,Midjourney一直以其独特的AI图像模型而闻名,迎合创意类型。
公司表示,其AI视频模型的目标不仅仅是为好莱坞电影或广告行业制作B-roll。在一篇博文中,Midjourney的CEO David Holz表示,其AI视频模型是公司朝着最终目标迈出的下一步,即创建“能够进行实时开放世界模拟”的AI模型。
在AI视频模型之后,Midjourney表示计划开发用于生成3D渲染以及实时AI模型的AI模型。
Midjourney的V1模型的推出仅在该初创公司被好莱坞两家最知名的电影公司起诉一周后:迪士尼和环球。诉讼称,Midjourney的AI图像模型生成的图像描绘了工作室的版权角色,如荷马·辛普森和达斯·维达。
好莱坞工作室一直在努力应对AI图像和视频生成模型的日益普及,如Midjourney开发的那些。人们越来越担心这些AI工具可能会取代或贬低创意领域的工作,几家媒体公司声称这些产品是基于他们的版权作品进行训练的。
虽然Midjourney试图将自己定位为与其他AI图像和视频初创公司不同——更专注于创意而非直接商业应用——但该初创公司无法摆脱这些指控。
首先,Midjourney表示视频生成的收费将是典型图像生成的8倍,这意味着订阅者在创建视频时会比创建图像更快地用完每月的生成配额。
在发布时,尝试V1的最便宜方式是订阅Midjourney每月10美元的基础计划。订阅Midjourney每月60美元的专业计划和每月120美元的超级计划的用户将在公司的较慢“放松”模式下拥有无限的视频生成。接下来一个月,Midjourney表示将重新评估其视频模型的定价。
V1带有一些自定义设置,允许用户控制视频模型的输出。
用户可以选择自动动画设置,使图像随机移动,或者选择手动设置,允许用户用文字描述他们想要添加到视频中的特定动画。用户还可以通过在设置中选择“低运动”或“高运动”来切换相机和主体的运动量。
虽然V1生成的视频只有五秒长,但用户可以选择每次延长四秒,最多延长四次,这意味着V1视频最长可以达到21秒。
与Midjourney的AI图像模型类似,V1视频的早期演示看起来有些超现实,而不是超现实主义。对V1的初步反应是积极的,尽管尚不清楚它与其他领先的AI视频模型相比表现如何,这些模型已经在市场上存在了数月甚至数年。