
Midjourney 正在推出其新款 V8 的早期版本供社区测试。据报道图像生成速度更快、细节更丰富,但某些功能成本是其四倍。
Midjourney 已在 Alpha 官网发布了其早期 V8 型号进行测试,邀请社区成员试用并分享反馈。该公司称这是一种根本全新的模式,具有自身的优缺点,可能需要全新的提示策略。
据Midjourney称,图像生成速度大约是以前的五倍。此次更新还引入了一种新模式,可以原生渲染2K分辨率的图像,以及一个提升图像一致性的模式。V8 自带支持多种宽高比和参数,如 、 、 和 。现有的V7个性化配置文件、情绪板和风格参考(srefs)2“应能沿用并保持向后兼容。
Midjourney表示,V8在遵循详细说明方面明显更好。模特通过个性化、风格参考和情绪板对个人美学的把握明显提升,生成的图像也更加连贯和细致。公司称,只要用户在提示中用引号包裹所需文本,文本渲染——即将可读文本放入生成图像中——比以往版本更可靠。
扩散模型在复杂提示时仍然会出错
不过,作为纯扩散模型,Midjourney 仍不及那些开始将自回归组件融入图像生成流程的竞争对手。谷歌的 Nano Banana 和 OpenAI 的 GPT 图像 1.5 等模型采用这些混合架构来提升提示准确性,而较早的 Midjourney 模型中差异已显而易见。
初步迹象表明V8尚未完全缩小差距,尽管现在还为时过早。在一次使用复杂宇航员提示词的初步测试中,Midjourney的表现明显逊于这两款增强现实模型。抽象的概念——一匹马骑着宇航员,而不是反过来——是Midjourney始终无法掌握的。即使是Midjourney更直接的竞争对手Flux,也表现得稍微好一些。随着越来越多的图像生成器采用这些混合架构,Midjourney 仅依赖扩散策略可能会成为需要精准提示控制的用户越来越难以接受的挑战。
一张超写实的单反照片。一只拿着粉色香蕉的猴子坐在前景的老虎身上。背景中,一匹马骑着一名宇航员。宇航员在下面,就像一个活生生的“宇航服马鞍”,而马显然在上面,掌控着骑手。让它百分百明确:马是骑手,宇航员是被骑乘的,而不是反过来。高分辨率,清晰对焦,逼真的光影。

MJV8 草案

NBPro 由《解码者》启发 / 两代最佳影片
Midjourney表示,标准的V8美学尚未完成,建议寻求写实或更受控风格的用户直接进入模式,或使用情绪板和风格参考。公司还声称,目前提升个性化()是“最大”发挥模型效果的,而当用户大量依赖风格化系统并写出更长、更具体的提示时,V8 真正闪耀。
高级功能价格是发售时的四倍,且没有放松模式
定价可能会让部分用户感到刺痛。Midjourney表示,使用、 、 风格参考或情绪板的工作目前运行速度是标准工作的四倍,成本也高出四倍。放松模式是一个受欢迎的选项,允许用户更缓慢但无需额外费用生成图像,但发售时尚未开放。Midjourney 表示正在为 Relax 构建新的服务器集群,并致力于开发更便宜的渲染模式。
