谷歌更新Gemini，推出强大新AI图像模型，具备照片编辑功能

2025年08月27日由佚名发表 803 0

谷歌有限责任公司今天宣布，它正在更新其Gemini应用和聊天机器人，引入一个强大的新人工智能图像模型，为用户提供精细的照片编辑功能。

这个新模型名为Gemini 2.5 Flash Image，今天在Gemini应用上首次亮相。用户可以用自然语言编辑他们的照片。公司声称新模型提供了最先进的图像生成和编辑功能，保持原始构图、物体和人物不变，同时根据用户的需求添加、改变或删除内容。

谷歌DeepMind，公司旗下的AI研究部门，以神秘而滑稽的名字“Nano Banana”在LMArena上测试了这个新模型。这个公共网站通过众包方式收集关于AI模型质量的匿名反馈。起初，这个新模型是什么尚不清楚，尤其是考虑到它奇怪的名字，但用户很快就推测出它一定来自谷歌。

在早期预览中，这个模型在网站上表现优于其他所有照片编辑模型，获得了“世界顶级编辑模型”的称号。尽管它并非没有缺陷，但该模型在一致性、质量和遵循指令方面表现出色。

现在，DeepMind透露，这个模型实际上是Gemini 2.5 Flash Image，并为新的Gemini图像编辑体验提供支持。

“我们正在大力推动视觉质量的进步，以及模型遵循指令的能力，”谷歌DeepMind视觉生成模型的产品负责人Nicole Brichtova在接受TechCrunch采访时说道。

图像编辑和AI模型的一个问题一直是模型往往会对图像进行细微或大的修改，即使用户要求它们进行小改动。例如，用户可能拍摄了一张自己的照片，并要求模型添加眼镜。模型可能会在他们的脸上添加眼镜，但可能会显著改变他们的面部特征，调整他们的发型，或者背景中的一个物体可能会从一个东西变成另一个。

为了测试新模型，谷歌建议人们用自己的照片试一试。他们可以用它来给自己换上新装或改变位置。该模型还能够将来自两张不同照片的主体融合到一个全新的场景中——例如，拍一张你和你的猫的照片，并让它把你们放在沙发上。

根据谷歌的说法，这个新模型允许用户进行多次编辑：只需拍一张照片并要求进行一次更改，然后再进行后续更改。这允许对照片或图像进行自然的迭代修改。由于提示可以对位置或主体提出具体要求，模型只会改变它们而不会改变其他内容。

开发者还可以通过Gemini API、Google AI Studio和Vertex AI访问这一功能。

文章来源：https://siliconangle.com/2025/08/26/google-updates-gemini-powerful-new-ai-image-model-photo-editing-capabilities/

标签：

谷歌

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 Anthropic推出在Chrome中运行的Claude AI代理

下一篇 Anthropic与作者达成AI书籍训练诉讼和解

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术

每个人都应该知道的48个AI术语

openwebtext glue shunk031/JGLUE piqa wikitext sciq EleutherAI/lambada_openai facebook/flores

AI热点

行业学习机器学习人工智能公司板人工智能未来机器人视觉识别

AI工具

更多工具 »

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

热门企业

更多企业 »

热门职位

更多职位 »

深度学习软件工程师

Maluuba

20000~40000/月

Unity技术经理

Cisco

25000~30000/月深圳市

高级数据分析工程师

PilotAILabs

30000~60000/年深圳市