Luma AI 的新Uni-1 图像模型在基于逻辑的基准测试中超越了Nano Banana 2和GPT Image 1.5

2026年03月09日由 alex 发表 3995 0

Luma AI 推出了 Uni-1，这是其首个将图像理解与图像生成结合在单一架构中的模型。

与谷歌的Nano Banana Pro和GPT Image 1.5类似，Uni-1基于自回归变换器构建，这是一种按顺序生成内容令牌的AI模型，而非像传统扩散模型那样从噪声中提取图像。文本和图片共享相同的处理流程。

Luma表示，模型可以在生成前和生成过程中推理提示，拆解复杂的指令并规划场景。这种方法通常能带来更准确的提示跟随，Uni-1也不例外。例如，它可以拍摄多张照片并将它们合成出全新的构图。

luma_1_dog

除了基础生成，Luma表示，Uni-1还能在多个对话回合中细化主题，同时保持上下文完整，将图像转换为76种以上的艺术风格，接受草图和视觉指令作为输入，并将身份、姿势和构图从参考照片转移到新图像中。在一个演示中，模型从单一参考图像生成了整段序列，逐步将钢琴家从童年发展到老年。

piano_keyframes

据Luma介绍，Uni-1在基于逻辑的图像处理RISEBench测试中得分最高，略胜Nano Banana 2和GPT Image 1.5。图像生成能力还提升了模型的视觉理解能力。例如，在物体识别方面，它几乎可以媲美谷歌的Gemini 3 Pro。该模型支持多种语言。

uni_1_benchmarks

Uni-1 很快将通过新推出的创意助手 Luma Agents 和 Luma API 提供。目前尚未公布具体价格。

文章来源：https://the-decoder.com/luma-ais-new-uni-1-image-model-tops-nano-banana-2-and-gpt-image-1-5-on-logic-based-benchmarks/

标签：

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 OpenAI 机器人负责人凯特琳·卡利诺夫斯基因五角大楼协议辞职

下一篇 Anthropic的Claude AI发现Firefox中超过100个安全漏洞

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术

每个人都应该知道的48个AI术语

openwebtext glue shunk031/JGLUE piqa wikitext sciq EleutherAI/lambada_openai facebook/flores

AI热点

行业学习机器学习人工智能公司板人工智能未来机器人视觉识别

AI工具

更多工具 »

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

本周热门

热门企业

热门职位

Maluuba

20000~40000/月

Unity技术经理

Cisco

25000~30000/月深圳市

高级数据分析工程师

PilotAILabs

30000~60000/年深圳市